续表１分类器得分方式排序损失汉明损失差一错误覆盖范

正在加载图片...

·296· 智能系统学报第9卷续表1 搜索到的特征子集在排序损失、汉明损失和平均查得分排序汉明差一覆盖平均准率指标下预测结果差异较小，几乎重叠在一起，但分类器方式损失损失错误范围查准率是在差一错误和覆盖范围指标下，都出现不同程度 max 0.08710.09840.25840.5184 0.8461 的小幅震荡。在min下搜索到的特征子集在5种评 CC avg0.08390.09730.25550.50100.8493 价指标下结果最差，而且收敛速度明显慢于avg和 mim0.08560.09840.25840.51140.8462 max,特征选择对于分类性能提升效果较差。从全 max0.07690.08470.22350.47110.8669 局实验结果看，avg下搜索到的特征子集，达到最优 MLkNN avg0.07660.08430.22310.47070.8674 结果。同时，可以看出在CC分类器下，3种取值方 mim0.07490.08340.21190.46110.8716 式搜索到的特征子集，在5种评价指标下的结果，都 3.4 Yeast数据集上的实验结果分析呈现出震荡的形式，尤其是在差一错误指标下，震荡 Yeast数据集部分实验结果如图4所示。幅度最大。虽然在震荡中，但是随着特征个数的增加，结果逐渐改善，说明特征选择起到了很好的提高 0.25 max 分类性能的作用。从全局实验结果看，在排序损失米avg 和平均查准率指标下，avg下搜索到的特征子集表 0.2 …“多0 min 现最好，而且其余3种评价指标下，max下搜索到的特征子集表现最好。在MLkNN分类器下，整体趋 20 4060 80 100 选取的部分特征个数势与在BR分类器下相似。从全局实验结果看，除 (a)在BR分类器下的排序损失值了在排序损失和差一错误指标下，avg与max下搜 0.4 索到的特征子集，达到相同最优结果，其余3种评价 □max 指标下，max的结果最好。Scene数据集实验的最优 0.3 米avg 结果比较如表5所示。 min 表5 Scene数据集实验的最优结果比较是。萧d能 Table 5 Comparison of optimal results of the experi- 020 40 60 80 选取的部分特征个数 ment on the scene dataset (b)在BR分类器下的汉明损失值得分排序汉明差一覆盖平均分类器方式损失损失错误范围查准率 9 max 米avg max 0.0752 0.09700.23020.45950.8642 min BR avg0.07520.09730.23260.45950.8629 音首丹金队限曼光 min0.07520.09680.20880.45900.8629 米 0 20 40 60 80100 max0.08710.09840.25840.51840.8461 选取的部分特征个数 CC avg0.08390.09730.25550.50100.8493 (c)在CC分类器下的覆盖范围值 min0.08560.09840.25840.51140.8462 0.8 max0.07690.08470.22350.47110.8669 著，在尽BB80 MLkNN avg0.07660.08430.22310.47070.8674 max 米avg min0.07490.08340.21190.46110.8716 0.6 min 3.5实验结果 0 20 40、6080 100 从以上所有实验结果可以看出，针对不同类型选取的部分特征个数的多标记数据集，都有其特定的得分统计方式能很 (d)在MLkNN分类器下的平均查准率值快地搜索到较优的特征子集，然后趋于稳定，说明特图4 Yeast数据集部分实验结果征选择起到了很好的提高分类性能的作用。为了便 Fig.4 Partial results of the experiment on the yeast 于使展示图片美观易懂，画图时特征子集所含特征 dataset 个数采用间隔选取再绘制（本身实验数据是全的），在BR分类器下，avg和max两种得分统计方式所有的同类型图片都采用这个方法。续表１分类器得分方式排序损失汉明损失差一错误覆盖范围平均查准率ｍａｘ０．０８７１０．０９８４０．２５８４０．５１８４０．８４６１ＣＣａｖｇ０．０８３９０．０９７３０．２５５５０．５０１００．８４９３ｍｉｎ０．０８５６０．０９８４０．２５８４０．５１１４０．８４６２ｍａｘ０．０７６９０．０８４７０．２２３５０．４７１１０．８６６９ＭＬｋＮＮａｖｇ０．０７６６０．０８４３０．２２３１０．４７０７０．８６７４ｍｉｎ０．０７４９０．０８３４０．２１１９０．４６１１０．８７１６３．４Ｙｅａｓｔ数据集上的实验结果分析Ｙｅａｓｔ数据集部分实验结果如图４所示。（ａ）在ＢＲ分类器下的排序损失值（ｂ）在ＢＲ分类器下的汉明损失值（ｃ）在ＣＣ分类器下的覆盖范围值（ｄ）在ＭＬｋＮＮ分类器下的平均查准率值图４Ｙｅａｓｔ数据集部分实验结果Ｆｉｇ．４Ｐａｒｔｉａｌｒｅｓｕｌｔｓｏｆｔｈｅｅｘｐｅｒｉｍｅｎｔｏｎｔｈｅｙｅａｓｔｄａｔａｓｅｔ在ＢＲ分类器下，ａｖｇ和ｍａｘ两种得分统计方式搜索到的特征子集在排序损失、汉明损失和平均查准率指标下预测结果差异较小，几乎重叠在一起，但是在差一错误和覆盖范围指标下，都出现不同程度的小幅震荡。在ｍｉｎ下搜索到的特征子集在５种评价指标下结果最差，而且收敛速度明显慢于ａｖｇ和ｍａｘ，特征选择对于分类性能提升效果较差。从全局实验结果看，ａｖｇ下搜索到的特征子集，达到最优结果。同时，可以看出在ＣＣ分类器下，３种取值方式搜索到的特征子集，在５种评价指标下的结果，都呈现出震荡的形式，尤其是在差一错误指标下，震荡幅度最大。虽然在震荡中，但是随着特征个数的增加，结果逐渐改善，说明特征选择起到了很好的提高分类性能的作用。从全局实验结果看，在排序损失和平均查准率指标下，ａｖｇ下搜索到的特征子集表现最好，而且其余３种评价指标下，ｍａｘ下搜索到的特征子集表现最好。在ＭＬｋＮＮ分类器下，整体趋势与在ＢＲ分类器下相似。从全局实验结果看，除了在排序损失和差一错误指标下，ａｖｇ与ｍａｘ下搜索到的特征子集，达到相同最优结果，其余３种评价指标下，ｍａｘ的结果最好。Ｓｃｅｎｅ数据集实验的最优结果比较如表５所示。表５Ｓｃｅｎｅ数据集实验的最优结果比较Ｔａｂｌｅ５Ｃｏｍｐａｒｉｓｏｎｏｆｏｐｔｉｍａｌｒｅｓｕｌｔｓｏｆｔｈｅｅｘｐｅｒｉ⁃ ｍｅｎｔｏｎｔｈｅｓｃｅｎｅｄａｔａｓｅｔ分类器得分方式排序损失汉明损失差一错误覆盖范围平均查准率ｍａｘ０．０７５２０．０９７００．２３０２０．４５９５０．８６４２ＢＲａｖｇ０．０７５２０．０９７３０．２３２６０．４５９５０．８６２９ｍｉｎ０．０７５２０．０９６８０．２０８８０．．４５９００．８６２９ｍａｘ０．０８７１０．０９８４０．２５８４０．５１８４０．８４６１ＣＣａｖｇ０．０８３９０．０９７３０．２５５５０．５０１００．８４９３ｍｉｎ０．０８５６０．０９８４０．２５８４０．５１１４０．８４６２ｍａｘ０．０７６９０．０８４７０．２２３５０．４７１１０．８６６９ＭＬｋＮＮａｖｇ０．０７６６０．０８４３０．２２３１０．４７０７０．８６７４ｍｉｎ０．０７４９０．０８３４０．２１１９０．４６１１０．８７１６３．５实验结果从以上所有实验结果可以看出，针对不同类型的多标记数据集，都有其特定的得分统计方式能很快地搜索到较优的特征子集，然后趋于稳定，说明特征选择起到了很好的提高分类性能的作用。为了便于使展示图片美观易懂，画图时特征子集所含特征个数采用间隔选取再绘制（本身实验数据是全的），所有的同类型图片都采用这个方法。 ·２９６· 智能系统学报第９卷

<<向上翻页向下翻页>>

点击下载：人工智能基础：一种多标记数据的过滤式特征选择框架