正在加载图片...
·296· 智能系统学报 第9卷 续表1 搜索到的特征子集在排序损失、汉明损失和平均查 得分排序 汉明 差一覆盖 平均 准率指标下预测结果差异较小,几乎重叠在一起,但 分类器 方式 损失 损失错误 范围查准率 是在差一错误和覆盖范围指标下,都出现不同程度 max 0.08710.09840.25840.5184 0.8461 的小幅震荡。在min下搜索到的特征子集在5种评 CC avg0.08390.09730.25550.50100.8493 价指标下结果最差,而且收敛速度明显慢于avg和 mim0.08560.09840.25840.51140.8462 max,特征选择对于分类性能提升效果较差。从全 max0.07690.08470.22350.47110.8669 局实验结果看,avg下搜索到的特征子集,达到最优 MLkNN avg0.07660.08430.22310.47070.8674 结果。同时,可以看出在CC分类器下,3种取值方 mim0.07490.08340.21190.46110.8716 式搜索到的特征子集,在5种评价指标下的结果,都 3.4 Yeast数据集上的实验结果分析 呈现出震荡的形式,尤其是在差一错误指标下,震荡 Yeast数据集部分实验结果如图4所示。 幅度最大。虽然在震荡中,但是随着特征个数的增 加,结果逐渐改善,说明特征选择起到了很好的提高 0.25 max 分类性能的作用。从全局实验结果看,在排序损失 米avg 和平均查准率指标下,avg下搜索到的特征子集表 0.2 …“多0 min 现最好,而且其余3种评价指标下,max下搜索到的 特征子集表现最好。在MLkNN分类器下,整体趋 20 4060 80 100 选取的部分特征个数 势与在BR分类器下相似。从全局实验结果看,除 (a)在BR分类器下的排序损失值 了在排序损失和差一错误指标下,avg与max下搜 0.4 索到的特征子集,达到相同最优结果,其余3种评价 □max 指标下,max的结果最好。Scene数据集实验的最优 0.3 米avg 结果比较如表5所示。 min 表5 Scene数据集实验的最优结果比较 是。萧d能 Table 5 Comparison of optimal results of the experi- 020 40 60 80 选取的部分特征个数 ment on the scene dataset (b)在BR分类器下的汉明损失值 得分排序 汉明差一覆盖平均 分类器 方式 损失 损失错误 范围查准率 9 max 米avg max 0.0752 0.09700.23020.45950.8642 min BR avg0.07520.09730.23260.45950.8629 音首丹金队限曼光 min0.07520.09680.20880.45900.8629 米 0 20 40 60 80100 max0.08710.09840.25840.51840.8461 选取的部分特征个数 CC avg0.08390.09730.25550.50100.8493 (c)在CC分类器下的覆盖范围值 min0.08560.09840.25840.51140.8462 0.8 max0.07690.08470.22350.47110.8669 著,在尽BB80 MLkNN avg0.07660.08430.22310.47070.8674 max 米avg min0.07490.08340.21190.46110.8716 0.6 min 3.5实验结果 0 20 40、6080 100 从以上所有实验结果可以看出,针对不同类型 选取的部分特征个数 的多标记数据集,都有其特定的得分统计方式能很 (d)在MLkNN分类器下的平均查准率值 快地搜索到较优的特征子集,然后趋于稳定,说明特 图4 Yeast数据集部分实验结果 征选择起到了很好的提高分类性能的作用。为了便 Fig.4 Partial results of the experiment on the yeast 于使展示图片美观易懂,画图时特征子集所含特征 dataset 个数采用间隔选取再绘制(本身实验数据是全的), 在BR分类器下,avg和max两种得分统计方式 所有的同类型图片都采用这个方法。续表 1 分类器 得分 方式 排序 损失 汉明 损失 差一 错误 覆盖 范围 平均 查准率 max 0.0871 0.0984 0.2584 0.5184 0.8461 CC avg 0.0839 0.0973 0.2555 0.5010 0.8493 min 0.0856 0.0984 0.2584 0.5114 0.8462 max 0.0769 0.0847 0.2235 0.4711 0.8669 MLkNN avg 0.0766 0.0843 0.2231 0.4707 0.8674 min 0.0749 0.0834 0.2119 0.4611 0.8716 3.4 Yeast 数据集上的实验结果分析 Yeast 数据集部分实验结果如图 4 所示。 (a)在 BR 分类器下的排序损失值 (b) 在 BR 分类器下的汉明损失值 (c) 在 CC 分类器下的覆盖范围值 (d) 在 MLkNN 分类器下的平均查准率值 图 4 Yeast 数据集部分实验结果 Fig.4 Partial results of the experiment on the yeast dataset 在 BR 分类器下,avg 和 max 两种得分统计方式 搜索到的特征子集在排序损失、汉明损失和平均查 准率指标下预测结果差异较小,几乎重叠在一起,但 是在差一错误和覆盖范围指标下,都出现不同程度 的小幅震荡。 在 min 下搜索到的特征子集在 5 种评 价指标下结果最差,而且收敛速度明显慢于 avg 和 max,特征选择对于分类性能提升效果较差。 从全 局实验结果看,avg 下搜索到的特征子集,达到最优 结果。 同时,可以看出在 CC 分类器下,3 种取值方 式搜索到的特征子集,在 5 种评价指标下的结果,都 呈现出震荡的形式,尤其是在差一错误指标下,震荡 幅度最大。 虽然在震荡中,但是随着特征个数的增 加,结果逐渐改善,说明特征选择起到了很好的提高 分类性能的作用。 从全局实验结果看,在排序损失 和平均查准率指标下,avg 下搜索到的特征子集表 现最好,而且其余 3 种评价指标下,max 下搜索到的 特征子集表现最好。 在 MLkNN 分类器下,整体趋 势与在 BR 分类器下相似。 从全局实验结果看,除 了在排序损失和差一错误指标下,avg 与 max 下搜 索到的特征子集,达到相同最优结果,其余 3 种评价 指标下,max 的结果最好。 Scene 数据集实验的最优 结果比较如表 5 所示。 表 5 Scene 数据集实验的最优结果比较 Table 5 Comparison of optimal results of the experi⁃ ment on the scene dataset 分类器 得分 方式 排序 损失 汉明 损失 差一 错误 覆盖 范围 平均 查准率 max 0.0752 0.0970 0.2302 0.4595 0.8642 BR avg 0.0752 0.0973 0.2326 0.4595 0.8629 min 0.0752 0.0968 0.2088 0..4590 0.8629 max 0.0871 0.0984 0.2584 0.5184 0.8461 CC avg 0.0839 0.0973 0.2555 0.5010 0.8493 min 0.0856 0.0984 0.2584 0.5114 0.8462 max 0.0769 0.0847 0.2235 0.4711 0.8669 MLkNN avg 0.0766 0.0843 0.2231 0.4707 0.8674 min 0.0749 0.0834 0.2119 0.4611 0.8716 3.5 实验结果 从以上所有实验结果可以看出,针对不同类型 的多标记数据集,都有其特定的得分统计方式能很 快地搜索到较优的特征子集,然后趋于稳定,说明特 征选择起到了很好的提高分类性能的作用。 为了便 于使展示图片美观易懂,画图时特征子集所含特征 个数采用间隔选取再绘制(本身实验数据是全的), 所有的同类型图片都采用这个方法。 ·296· 智 能 系 统 学 报 第 9 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有