正在加载图片...
·476· 智能系统学报 第13卷 3.5,a分别取0.4、0.5、0.6、0.7,共进行了8组实验, 2.4,a=0.7时最短,但Liverdisorders数据集在任何 实验结果如表3~10所示,其中:集合1=集合7=集 阈值下均没有冗余属性。 合17=集合19=集合22=集合28={1},{2},{3}, 3.2约简效率对比 {4},{5},{6}};集合2=集合14=集合16=集合 本节选取Mammographic Mass数据集,对比两 18=集合21=集合23={1,{2},{3,{4),{5}:集 个算法随对象数量的增加耗时变化情况。图1~ 合3=集合20=集合24={1},{2,{3},{4},{5},{6;, 5为入取2.4,a分别取0.4、0.5、0.6、0.7、0.8时,3个 {7};集合4=集合6={1,3,4,5,6,7,8,9}:集合 算法的时间耗费情况;横坐标表示Mammographic 5=集合8=集合9=集合10=集合26=集合27={1,2, Mass数据集的对象数量,纵坐标表示运行时间,单 3,4,5,6,7,8,9};集合11=集合12=集合13={1,3, 位为s 5},{2,3,5},{3,4,5},{1,2,3,4,6},{1,5,6},{2,5, PRADN 6),{3,5,6}{4,5,6}}:集合15={1},{2},{3},{4}, 50 R (5,{6},{7,{8},{9}:集合25={1,2,3,4,5,7,8,9}。 40 表9约简结果对比(d=3.5,=0.6) 0 Table 9 Comparison of reduction results (A=3.5.q=0.6) 20 数据集 PRADM DRADM MDRADM 100200300400500600700800900 BLO {1,2,4,5} {1,2,3,4,5} {1.2,3,4,5} 对象数量 FER 集合25 集合26 集合27 图1约简效率对比(a=0.4) TA {1,2,3,4,5} {1,2,3,4,5} 1,2,3,4,5} Fig.1 Comparison of reduction efficiency (a=0.4) 80r QB 集合28 {1,2,3,4,5,6} {1,2,6} -PRADM 70-·DRADM UKM {1,2,3,4,5} {1,2,3,4,5} 60 MDRADM {1,2,3,4,5} 宣50 LD {1,2,3,5,6} {1,2,34,5,6}{1,2,3,4,5,6} 30 AM{1,2,3,4,5,6,7}{1,2,3,45,6,7}{1,2,3,4,5,6,7} 20 MM {1,2,3,5} {1,2,3,4,5} {1,2,3,4,5} 10 01 100200300400500600700800900 表10约简结果对比(=3.5,a=0.7) 对象数量 Table 10 Comparison of reduction results (3.5,q=0.7) 图2约简效率对比(a=0.5) 数据集 PRADM DRADM MDRADM Fig.2 Comparison of reduction efficiency (q=0.5) BL0{1,2,3,4,5} {1,2,3,4,5}{1,2,3,4,5} 80 PRADM FER {3; {3} 3} 70 DM 60 MDRADM TAE {1,2,3,4,5} {12.3.4.5 {1.2.3.4.5} QB {1,5,6} {1,2,3,4,5,6}{1,2,3,4,5,6} UKM{1,2,3,4,5} {1,2,3,4,5} {1,2,3,4,5} 20 LD{1,2,3,4,5,6}{1.2,3,4,5,6}{1,2.3,4,5,6 0 100200300400500600700800900 AM{1,2,3,4,5,6,7}{1.2,3,4,5,6,7}{12,3,4,5,6,7} 对象数量 MM{1,2,3,4,5} {1,2,3,4,5}{1,2,3,4,5} 图3约简效率对比(a=0.6) 表3~6为取2.4,a分别取0.4、0.5、0.6、 Fig.3 Comparison of reduction efficiency (q=0.6) 0.7时,正域保持、分布保持和最大分布保持约简算 80 70 PRADM DRADM 法的约简结果。实验结果表明,MDRADM约简结 60 MDRADM 果为DRADM约简结果的子集,即验证了性质3的 50 正确性,而PRADM约简结果和MDRADM约简结 果没有明显关系。这是因为,当正域为空时,正域 0 约简结果为条件属性中任意一个属性,故PRA 0 100200300400500600700800900 DM的约简结果和MDRADM的约简结果不存在包 对象数量 含关系。当=3.5,=0.4时,对于大部分数据集, 图4约简效率对比(a=0.7) DRADM的约简结果最短,Fertility数据集则在d= Fig.4 Comparison of reduction efficiency (a=0.7)3.5,α分别取 0.4、0.5、0.6、0.7 ,共进行了 8 组实验, 实验结果如表 3~10 所示,其中:集合 1=集合 7=集 合 17=集合 19=集合 22=集合 28={{1}, {2}, {3}, {4}, {5}, {6}};集合 2=集合 14=集合 16=集合 18=集合 21=集合 23={{1}, {2}, {3}, {4}, {5}};集 合 3=集合 20=集合 24={{1}, {2}, {3}, {4}, {5}, {6}, {7}};集合 4=集合 6={1, 3, 4, 5, 6, 7, 8, 9};集合 5=集合 8=集合 9=集合 10=集合 26=集合 27={1, 2, 3, 4, 5, 6, 7, 8, 9};集合 11=集合 12=集合 13={{1, 3, 5},{2, 3, 5},{3, 4, 5},{1, 2, 3, 4, 6},{1, 5, 6},{2, 5, 6},{3, 5, 6}{4, 5, 6}};集合 15={{1}, {2}, {3}, {4}, {5}, {6}, {7}, {8}, {9}};集合 25={1, 2, 3, 4, 5, 7, 8, 9}。 表 9 约简结果对比 ( λ= 3.5,α= 0.6 ) Table 9 Comparison of reduction results ( λ= 3.5,α= 0.6 ) 数据集 PRADM DRADM MDRADM BLO {1, 2, 4, 5} {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} FER 集合 25 集合 26 集合 27 TA {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} QB 集合 28 {1, 2, 3, 4, 5, 6} {1, 2, 6} UKM {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} LD {1, 2, 3, 5, 6} {1, 2, 3, 4, 5, 6} {1, 2, 3, 4, 5, 6} AM {1, 2, 3, 4, 5, 6, 7}{1, 2, 3, 4, 5, 6, 7}{1, 2, 3, 4, 5, 6, 7} MM {1, 2, 3, 5} {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} 表 10 约简结果对比 ( λ= 3.5,α= 0.7 ) Table 10 Comparison of reduction results ( λ= 3.5,α= 0.7 ) 数据集 PRADM DRADM MDRADM BLO {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} FER {3} {3} {3} TAE {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} QB {1, 5, 6} {1, 2, 3, 4, 5, 6} {1, 2, 3, 4, 5, 6} UKM {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} LD {1, 2, 3, 4, 5, 6} {1, 2, 3, 4, 5, 6} {1, 2, 3, 4, 5, 6} AM {1, 2, 3, 4, 5, 6, 7}{1, 2, 3, 4, 5, 6, 7}{1, 2, 3, 4, 5, 6, 7} MM {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} {1, 2, 3, 4, 5} λ 2.4 α λ= 3.5,α= 0.4 λ= 表 3~6 为 取 , 分别取 0.4、0.5、0.6、 0.7 时,正域保持、分布保持和最大分布保持约简算 法的约简结果。实验结果表明,MDRADM 约简结 果为 DRADM 约简结果的子集,即验证了性质 3 的 正确性,而 PRADM 约简结果和 MDRADM 约简结 果没有明显关系。这是因为,当正域为空时,正域 约简结果为条件属性中任意一个属性,故 PRA￾DM 的约简结果和 MDRADM 的约简结果不存在包 含关系。当 时,对于大部分数据集, DRADM 的约简结果最短,Fertility 数据集则在 2.4,α= 0.7 时最短,但 Liverdisorders 数据集在任何 阈值下均没有冗余属性。 3.2 约简效率对比 λ 2.4 α 本节选取 Mammographic Mass 数据集,对比两 个算法随对象数量的增加耗时变化情况。图 1~ 5 为 取 , 分别取 0.4、0.5、0.6、0.7、0.8 时,3 个 算法的时间耗费情况;横坐标表示 Mammographic Mass 数据集的对象数量,纵坐标表示运行时间,单 位为 s。 60 50 40 30 20 10 0 䓼㵸ᬢ䬠/s 100 200 300 400 500 600 700 800 900 ᄥ䆍᪜䛻 PRADM DRADM MDRADM 图 1 约简效率对比 (α= 0.4 ) Fig. 1 Comparison of reduction efficiency (α= 0.4 ) 60 70 80 50 40 30 20 10 0 运行时间/s 100 200 300 400 500 600 700 800 900 对象数量 PRADM DRADM MDRADM 图 2 约简效率对比 (α= 0.5 ) Fig. 2 Comparison of reduction efficiency (α= 0.5 ) 60 70 80 50 40 30 20 10 0 运行时间/s 100 200 300 400 500 600 700 800 900 对象数量 PRADM DRADM MDRADM 图 3 约简效率对比 (α= 0.6 ) Fig. 3 Comparison of reduction efficiency (α= 0.6 ) 60 70 80 50 40 30 20 10 0 运行时间/s 100 200 300 400 500 600 700 800 900 对象数量 PRADM DRADM MDRADM 图 4 约简效率对比 (α= 0.7 ) Fig. 4 Comparison of reduction efficiency (α= 0.7 ) ·476· 智 能 系 统 学 报 第 13 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有