正在加载图片...
第2期 高琪,等:基于模糊不一致对的多标记属性约简 ·383 0.0362 0.155 0.0359 0.0356 0.150 0.0353 0.145 0.0350 0.03470100200300400500600700800 0.140 0100200300400500600700800 属性个数 属性个数 (a)汉明损失(HL) (b)排序损失(RL) 0.77 7.7r 0.76 ◆MLAR-FL 7.6 0.75 --MLFRS 0.74 7.5 0.73 7.4 号0.72 0.71 7.3 0.70 72 0.69 0.68 1 0.67 0100200300400500600700800 7.001002003004050060070080 属性个数 属性个数 (C)1-错误率(OE) (d覆盖率(CV) 0.08 0.46 0.07 0.45 0.06 0.44 0.05 0.43 0.04 0.42 0.03 0.41 0.02 0.40 0.01 0.39 0100200300400500600700800 0 100200300400500600700800 属性个数 属性个数 (e)平均精度(AP) (⑤Micro-F1微平均FI) 图3 science数据集上6种评价指标下各算法的分类性能的变化情况 Fig.3 Changes in classification performance of each algorithm under six evaluation indicators on the science data set 对于这3个数据集,针对各种评价指标,由 法,与LWMF和MLFRS算法的分类性能比较接 图13可以发现: 近,但仍在很小程度上优于这两种算法,对于 1)在science数据集上,对于6种评价指标而 F1评价指标而言,LWMF的分类性能与MLAR- 言,MLAR-FL的分类性能比其余3种算法的分类 L的分类性能比较接近,且在小于300个属性 性能好,并且在很大程度上优于其余算法;在 个数的情况下,LWMF的分类性能优于这两种 business数据集上,MLAR-FL的分类性能在AP、 算法。 RL、CV3种评价指标上,在小于225个属性个数 2)对于不同的数据集,得到的约简的属性个 的情况下,分类情况较大程度上优于其余3种算 数不同,但是可以发现,在小于250个属性个数 法,在OE、HL、F13种评价指标上,分类性能存 的情况下,MLARF-FL的分类性能普遍优于其余 在波动,但是仍然在小于225个属性个数的情况3种算法,同时,随着属性个数的增加,分类性能 下,优于其余3种算法:在reference数据集合上, 越来越优,而在达到最高值后,会趋于平稳或者 对于AP、CV、OE、RL、HL5种评价指标而言, 变差,因为越来越多的属性加入到特征空间当 MLAR-HL的分类性能很明显地优于RF-ML算 中,可能会与原先的属性之间存在一定的影响,0.036 2 0.035 9 0.035 6 0.035 3 0.035 0 0.034 7 0 100 200 300 400 500 600 700 800 HL 属性个数 RF-ML LWMF MLAR-FL MLFRS RL 0.155 0.150 0.145 0.140 0 100 200 300 400 500 600 700 800 属性个数 RF-ML LWMF MLAR-FL MLFRS 0.77 0.76 0.75 0.74 0.73 0.72 0.71 0.70 0.69 0.68 0.67 0 100 200 300 400 500 600 700 800 属性个数 RF-ML LWMF MLAR-FL MLFRS 7.7 7.6 7.5 7.4 7.3 7.2 7.1 7.0 0 100 200 300 400 500 600 700 800 属性个数 RF-ML LWMF MLAR-FL MLFRS 0.46 0.45 0.44 0.43 0.42 0.41 0.40 0.39 0 100 200 300 400 500 600 700 800 属性个数 RF-ML LWMF MLAR-FL MLFRS 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 100 200 300 400 500 600 700 800 属性个数 RF-ML LWMF MLAR-FL MLFRS (a) 汉明损失(HL) (b) 排序损失(RL) (c) 1-错误率(OE) (d) 覆盖率(CV) (e) 平均精度(AP) (f) Micro-F1微平均(F1) OE CV AP F1 图 3 science 数据集上 6 种评价指标下各算法的分类性能的变化情况 Fig. 3 Changes in classification performance of each algorithm under six evaluation indicators on the science data set 对于这 3 个数据集,针对各种评价指标,由 图 1~3 可以发现: 1) 在 science 数据集上,对于 6 种评价指标而 言,MLAR-FL 的分类性能比其余 3 种算法的分类 性能好,并且在很大程度上优于其余算法;在 business 数据集上,MLAR-FL 的分类性能在 AP、 RL、CV 3 种评价指标上,在小于 225 个属性个数 的情况下,分类情况较大程度上优于其余 3 种算 法,在 OE、HL、F1 3 种评价指标上,分类性能存 在波动,但是仍然在小于 225 个属性个数的情况 下,优于其余 3 种算法;在 reference 数据集合上, 对于 AP、CV、OE、RL、HL 5 种评价指标而言, MLAR-HL 的分类性能很明显地优于 RF-ML 算 法,与 LWMF 和 MLFRS 算法的分类性能比较接 近,但仍在很小程度上优于这两种算法,对于 F1 评价指标而言,LWMF 的分类性能与 MLAR￾FL 的分类性能比较接近,且在小于 300 个属性 个数的情况下,LWMF 的分类性能优于这两种 算法。 2) 对于不同的数据集,得到的约简的属性个 数不同,但是可以发现,在小于 250 个属性个数 的情况下,MLARF-FL 的分类性能普遍优于其余 3 种算法,同时,随着属性个数的增加,分类性能 越来越优,而在达到最高值后,会趋于平稳或者 变差,因为越来越多的属性加入到特征空间当 中,可能会与原先的属性之间存在一定的影响, 第 2 期 高琪,等:基于模糊不一致对的多标记属性约简 ·383·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有