正在加载图片...
·294 智能系统学报 第9卷 观地测试特征子集的分类效果,实验选取了3个多标 0.8 记分类器,分别是BR【o1,CC门和MkNN(2]。 朵bD.Gmax 梁一齿0米avg 3 实验结果及分析 min 0.6 20 40 按照上节的实验设置,在4个公开数据集上先 60 80 选取的部分特征个数 进行特征选择,再分类,实验结果做如下分析。 (d)在MkNN分类器下的平均查准率值 3.1 Emotions数据集上的实验结果分析 图1 Emotions数据集部分实验结果 如图1(其中横轴坐标表示特征子集所含有的特 Fig.l Partial results of the experiment on the emotions dataset 征个数,纵轴坐标表示特征子集在相应指标下的实验 表2 Emotions数据集实验的最优结果比较 结果数值,之后分析相同)和表2所示,在BR分类器 Table 2 Comparison of optimal results of the experi- 下,随着特征个数增多到最后阶段3种得分统计方式 ment on the emotions dataset 搜索到的特征子集性能较差。虽然开始在min下搜索 得分排序 汉明差一覆盖 平均 分类器 到的特征子集相比于其他2种方式,在5种评价指标 方式损失 损失错误范围查准率 下性能较差,但是随着特征个数的增加,min下的实验 max0.19310.22110.32201.93240.7657 结果渐渐超过avg和max,最终达到全局最优,得到最 BR avg0.19390.22090.32371.94230.7656 优特征子集。而且avg和max下搜索得到的特征子集 min0.17380.20880.30011.83500.7849 除了在差一错误评价指标下的实验结果存在较明显差 max0.19910.23160.33041.92900.7608 异,在其余4种评价指标下预测结果差异较小。同时, CC avg0.19910.23050.32881.95240.7640 可以看出在CC分类器下,整体趋势与BR分类器下相 min0.17960.21050.31181.83810.7810 似,但是后期波动较小。在MkNN分类器下,整体趋 max0.22600.24480.36252.07140.7395 势与BR分类器下相似,但是后期波动较大。 MLkNN avg0.21970.24500.35052.05290.7451 0.4 max min0.20570.19770.34561.97160.7535 米avg 3.2 Medical数据集上的实验结果分析 min 如图2和表3所示,在BR分类器下,avg和max 2种得分统计方式搜索到的特征子集在5种评价指 0.2 0 20 40 60 80 标下预测结果差异较小,几乎重叠在一起。但是从 选取的部分特征个数 全局最优结果看,在排序损失和覆盖范围指标下, (a)在BR分类器下的汉明损失值 avg和max都能搜到最优特征子集,而在汉明损失 0.50r max 和差一错误指标下,avg结果最好,在平均查准率指 0.45 米avg 标下,max结果最好。在min下搜索到的特征子集 0.40 min 在5种评价指标下结果最差,而且收敛速度明显慢 0.35 尿出一留卧 0.30 于avg和max,特征选择对于分类性能提升效果较 20 4060 80 差。同时,可以看出在CC分类器下,整体趋势与 选取的部分特征个数 BR分类器下相似。但是从全局最优结果看,在5种 (b)在BR分类器下的差一错误值 指标下,max下搜索到最优特征子集,结果最好。在 0.50r max MLkNN分类器下,整体趋势与BR分类器下相似。 0.45k 米avg 0.40 min 0.4 0.35 尿齿图每 max 0.30 米avg 20 40 60 80 毫02 选取的部分特征个数 min 条一量一品金金量业 (c)在CC分类器下的汉明损失值 50100150.200250 选取的部分特征个数 (a)在BR分类器下的排序损失值观地测试特征子集的分类效果,实验选取了 3 个多标 记分类器,分别是 BR [ 10 ] 、CC [ 11 ]和 MLkNN [ 12 ] 。 3 实验结果及分析 按照上节的实验设置,在 4 个公开数据集上先 进行特征选择,再分类,实验结果做如下分析。 3.1 Emotions 数据集上的实验结果分析 如图 1(其中横轴坐标表示特征子集所含有的特 征个数,纵轴坐标表示特征子集在相应指标下的实验 结果数值,之后分析相同)和表 2 所示,在 BR 分类器 下,随着特征个数增多到最后阶段 3 种得分统计方式 搜索到的特征子集性能较差。 虽然开始在 min 下搜索 到的特征子集相比于其他 2 种方式,在 5 种评价指标 下性能较差,但是随着特征个数的增加,min 下的实验 结果渐渐超过 avg 和 max,最终达到全局最优,得到最 优特征子集。 而且 avg 和 max 下搜索得到的特征子集 除了在差一错误评价指标下的实验结果存在较明显差 异,在其余 4 种评价指标下预测结果差异较小。 同时, 可以看出在 CC 分类器下,整体趋势与 BR 分类器下相 似,但是后期波动较小。 在 MLkNN 分类器下,整体趋 势与 BR 分类器下相似,但是后期波动较大。 (a)在 BR 分类器下的汉明损失值 (b) 在 BR 分类器下的差一错误值 (c) 在 CC 分类器下的汉明损失值 (d) 在 MLkNN 分类器下的平均查准率值 图 1 Emotions 数据集部分实验结果 Fig.1 Partial results of the experiment on the emotions dataset 表 2 Emotions 数据集实验的最优结果比较 Table 2 Comparison of optimal results of the experi⁃ ment on the emotions dataset 分类器 得分 方式 排序 损失 汉明 损失 差一 错误 覆盖 范围 平均 查准率 max 0.1931 0.2211 0.3220 1.9324 0.7657 BR avg 0.1939 0.2209 0.3237 1.9423 0.7656 min 0.1738 0.2088 0.3001 1.8350 0.7849 max 0.1991 0.2316 0.3304 1.9290 0.7608 CC avg 0.1991 0.2305 0.3288 1.9524 0.7640 min 0.1796 0.2105 0.3118 1.8381 0.7810 max 0.2260 0.2448 0.3625 2.0714 0.7395 MLkNN avg 0.2197 0.2450 0.3505 2.0529 0.7451 min 0.2057 0.1977 0.3456 1.9716 0.7535 3.2 Medical 数据集上的实验结果分析 如图 2 和表 3 所示,在 BR 分类器下,avg 和 max 2 种得分统计方式搜索到的特征子集在 5 种评价指 标下预测结果差异较小,几乎重叠在一起。 但是从 全局最优结果看,在排序损失和覆盖范围指标下, avg 和 max 都能搜到最优特征子集,而在汉明损失 和差一错误指标下,avg 结果最好,在平均查准率指 标下,max 结果最好。 在 min 下搜索到的特征子集 在 5 种评价指标下结果最差,而且收敛速度明显慢 于 avg 和 max,特征选择对于分类性能提升效果较 差。 同时,可以看出在 CC 分类器下,整体趋势与 BR 分类器下相似。 但是从全局最优结果看,在 5 种 指标下,max 下搜索到最优特征子集,结果最好。 在 MLkNN 分类器下,整体趋势与 BR 分类器下相似。 (a)在 BR 分类器下的排序损失值 ·294· 智 能 系 统 学 报 第 9 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有