观地测试特征子集的分类效果，实验选取了３个多标记分类器，分别是ＢＲ

正在加载图片...

·294 智能系统学报第9卷观地测试特征子集的分类效果，实验选取了3个多标 0.8 记分类器，分别是BR【o1,CC门和MkNN(2]。朵bD.Gmax 梁一齿0米avg 3 实验结果及分析 min 0.6 20 40 按照上节的实验设置，在4个公开数据集上先 60 80 选取的部分特征个数进行特征选择，再分类，实验结果做如下分析。 (d)在MkNN分类器下的平均查准率值 3.1 Emotions数据集上的实验结果分析图1 Emotions数据集部分实验结果如图1（其中横轴坐标表示特征子集所含有的特 Fig.l Partial results of the experiment on the emotions dataset 征个数，纵轴坐标表示特征子集在相应指标下的实验表2 Emotions数据集实验的最优结果比较结果数值，之后分析相同)和表2所示，在BR分类器 Table 2 Comparison of optimal results of the experi- 下，随着特征个数增多到最后阶段3种得分统计方式 ment on the emotions dataset 搜索到的特征子集性能较差。虽然开始在min下搜索得分排序汉明差一覆盖平均分类器到的特征子集相比于其他2种方式，在5种评价指标方式损失损失错误范围查准率下性能较差，但是随着特征个数的增加，min下的实验 max0.19310.22110.32201.93240.7657 结果渐渐超过avg和max,最终达到全局最优，得到最 BR avg0.19390.22090.32371.94230.7656 优特征子集。而且avg和max下搜索得到的特征子集 min0.17380.20880.30011.83500.7849 除了在差一错误评价指标下的实验结果存在较明显差 max0.19910.23160.33041.92900.7608 异，在其余4种评价指标下预测结果差异较小。同时， CC avg0.19910.23050.32881.95240.7640 可以看出在CC分类器下，整体趋势与BR分类器下相 min0.17960.21050.31181.83810.7810 似，但是后期波动较小。在MkNN分类器下，整体趋 max0.22600.24480.36252.07140.7395 势与BR分类器下相似，但是后期波动较大。 MLkNN avg0.21970.24500.35052.05290.7451 0.4 max min0.20570.19770.34561.97160.7535 米avg 3.2 Medical数据集上的实验结果分析 min 如图2和表3所示，在BR分类器下，avg和max 2种得分统计方式搜索到的特征子集在5种评价指 0.2 0 20 40 60 80 标下预测结果差异较小，几乎重叠在一起。但是从选取的部分特征个数全局最优结果看，在排序损失和覆盖范围指标下， (a)在BR分类器下的汉明损失值 avg和max都能搜到最优特征子集，而在汉明损失 0.50r max 和差一错误指标下，avg结果最好，在平均查准率指 0.45 米avg 标下，max结果最好。在min下搜索到的特征子集 0.40 min 在5种评价指标下结果最差，而且收敛速度明显慢 0.35 尿出一留卧 0.30 于avg和max,特征选择对于分类性能提升效果较 20 4060 80 差。同时，可以看出在CC分类器下，整体趋势与选取的部分特征个数 BR分类器下相似。但是从全局最优结果看，在5种 (b)在BR分类器下的差一错误值指标下，max下搜索到最优特征子集，结果最好。在 0.50r max MLkNN分类器下，整体趋势与BR分类器下相似。 0.45k 米avg 0.40 min 0.4 0.35 尿齿图每 max 0.30 米avg 20 40 60 80 毫02 选取的部分特征个数 min 条一量一品金金量业 (c)在CC分类器下的汉明损失值 50100150.200250 选取的部分特征个数 (a)在BR分类器下的排序损失值观地测试特征子集的分类效果，实验选取了３个多标记分类器，分别是ＢＲ［１０］、ＣＣ［１１］和ＭＬｋＮＮ［１２］。３实验结果及分析按照上节的实验设置，在４个公开数据集上先进行特征选择，再分类，实验结果做如下分析。３．１Ｅｍｏｔｉｏｎｓ数据集上的实验结果分析如图１（其中横轴坐标表示特征子集所含有的特征个数，纵轴坐标表示特征子集在相应指标下的实验结果数值，之后分析相同）和表２所示，在ＢＲ分类器下，随着特征个数增多到最后阶段３种得分统计方式搜索到的特征子集性能较差。虽然开始在ｍｉｎ下搜索到的特征子集相比于其他２种方式，在５种评价指标下性能较差，但是随着特征个数的增加，ｍｉｎ下的实验结果渐渐超过ａｖｇ和ｍａｘ，最终达到全局最优，得到最优特征子集。而且ａｖｇ和ｍａｘ下搜索得到的特征子集除了在差一错误评价指标下的实验结果存在较明显差异，在其余４种评价指标下预测结果差异较小。同时，可以看出在ＣＣ分类器下，整体趋势与ＢＲ分类器下相似，但是后期波动较小。在ＭＬｋＮＮ分类器下，整体趋势与ＢＲ分类器下相似，但是后期波动较大。（ａ）在ＢＲ分类器下的汉明损失值（ｂ）在ＢＲ分类器下的差一错误值（ｃ）在ＣＣ分类器下的汉明损失值（ｄ）在ＭＬｋＮＮ分类器下的平均查准率值图１Ｅｍｏｔｉｏｎｓ数据集部分实验结果Ｆｉｇ．１Ｐａｒｔｉａｌｒｅｓｕｌｔｓｏｆｔｈｅｅｘｐｅｒｉｍｅｎｔｏｎｔｈｅｅｍｏｔｉｏｎｓｄａｔａｓｅｔ表２Ｅｍｏｔｉｏｎｓ数据集实验的最优结果比较Ｔａｂｌｅ２Ｃｏｍｐａｒｉｓｏｎｏｆｏｐｔｉｍａｌｒｅｓｕｌｔｓｏｆｔｈｅｅｘｐｅｒｉ⁃ ｍｅｎｔｏｎｔｈｅｅｍｏｔｉｏｎｓｄａｔａｓｅｔ分类器得分方式排序损失汉明损失差一错误覆盖范围平均查准率ｍａｘ０．１９３１０．２２１１０．３２２０１．９３２４０．７６５７ＢＲａｖｇ０．１９３９０．２２０９０．３２３７１．９４２３０．７６５６ｍｉｎ０．１７３８０．２０８８０．３００１１．８３５００．７８４９ｍａｘ０．１９９１０．２３１６０．３３０４１．９２９００．７６０８ＣＣａｖｇ０．１９９１０．２３０５０．３２８８１．９５２４０．７６４０ｍｉｎ０．１７９６０．２１０５０．３１１８１．８３８１０．７８１０ｍａｘ０．２２６００．２４４８０．３６２５２．０７１４０．７３９５ＭＬｋＮＮａｖｇ０．２１９７０．２４５００．３５０５２．０５２９０．７４５１ｍｉｎ０．２０５７０．１９７７０．３４５６１．９７１６０．７５３５３．２Ｍｅｄｉｃａｌ数据集上的实验结果分析如图２和表３所示，在ＢＲ分类器下，ａｖｇ和ｍａｘ２种得分统计方式搜索到的特征子集在５种评价指标下预测结果差异较小，几乎重叠在一起。但是从全局最优结果看，在排序损失和覆盖范围指标下，ａｖｇ和ｍａｘ都能搜到最优特征子集，而在汉明损失和差一错误指标下，ａｖｇ结果最好，在平均查准率指标下，ｍａｘ结果最好。在ｍｉｎ下搜索到的特征子集在５种评价指标下结果最差，而且收敛速度明显慢于ａｖｇ和ｍａｘ，特征选择对于分类性能提升效果较差。同时，可以看出在ＣＣ分类器下，整体趋势与ＢＲ分类器下相似。但是从全局最优结果看，在５种指标下，ｍａｘ下搜索到最优特征子集，结果最好。在ＭＬｋＮＮ分类器下，整体趋势与ＢＲ分类器下相似。（ａ）在ＢＲ分类器下的排序损失值 ·２９４· 智能系统学报第９卷

<<向上翻页向下翻页>>

点击下载：人工智能基础：一种多标记数据的过滤式特征选择框架