正在加载图片...
第4期 李顺勇,等:一种新的最大相关最小冗余特征选择算法 ·657· MRMR、Chi-quare-.Test之上,尤其是New-MRMR- 可见,在数据集clean上,新提算法New- K-NI,当分类准确率达到最大时,所选的特征子集 MRMR-LNM、New-MRMR-LP的特征选择效果更好。 数为20,远小于两种传统算法所选择的最优特征 不同维度下,算法New-MRMR-IG-NI、New- 子集数。可见,在数据集clean上,算法New-MRMR- MRMR-IG-P、传统特征选择算法MRMR、Fisher KNI、New-MRMR-K-P的特征选择效果更优。 Score在数据集clean上的分类准确率变化趋势见 不同维度下,算法New-MRMR-L-NI、New- 图13。 MRMR-L-P、传统特征选择算法MRMR、Fisher 0.9 Score在数据集clean上的分类准确率变化趋势见 图12。 08 09 08 Information-Gain MRMr ew-MRMR-IG-NI New-MRMR-IG-P 0.6 40 80 120 160 Laplacian-Score 数据维度K MRMR New-MRMR-L-NI New-MRMR-L-P 图13New-MRMR-lG-NI、New-MRMR-lG-P、Informa- 0.6 0 40 80 120 160 tion-Gain、MRMR在数据集clean上分类准确率 数据维度K 的变化趋势 Fig.13 Correct classification trend of New-MRMR-IG-NI, 图I2New-MRMR-L-NI、New-MRMR-L-P、Laplacian- New-MRMR-IG-P,Information-Gain,MRMR on Score、MRMR在数据集clean上分类准确率的变 the dataset clean 化趋势 Fig.12 Correct classification trend of New-MRMR-L-NI, 图13显示,本文新提算法New-MRMR-IG- New-MRMR-L-P,Laplacian-Score,MRMR on the NI、New-MRMR-IG-P的分类准确率曲线均在传 dataset clean 统算法的分类准确率曲线之上。所以,对于数据 图12可以看出,维度为40时,算法New-MRMR- 集clean,本文新提出的两种特征选择算法New- L-I就达到了最大分类准确率,且高于传统算法 MRMR-IG-NI、New-MRMR-IG-P所选择的特征子 MRMR、Laplacian-Score的分类准确率。此外,虽 集更加有效。 然在维度为I10时,New-MRMR-L-P的分类准确 表6给出了以上各种算法在数据集Parkinson's 率略低于MRMR,但在其余维度上的分类准确率 Disease上的实验结果,即经支持向量机分类后, 均高于MRMR、Laplacian-Score的分类准确率。 得到的分类准确率达到最大时所选择的特征数。 表6分类准确率最大时,数据集Parkinson's Disease上各种算法分别所选择的特征数 Table 6 Number of features selected by various algorithms when the Classification precision is maximum on the Parkinson's Disease dataset 对比算法 特征选择算法 所选特征数 分类准确率 New-MRMR-F-P 150 0.9142 New-MRMR-F-NI 210 0.8779 New-MRMR-IG-P 180 0.8834 New-MRMR-IG-NI 210 0.9142 本文新提出的8种算法 New-MRMR-K-P 300 0.8624 New-MRMR-K-NI 120 0.8874 New-MRMR-L-P 150 0.8816 New-MRMR-L-NI 240 0.9016 MRMR 540 0.8670 传统算法 Fisher Score 540 0.8253MRMR、Chi-quare-Test 之上,尤其是 New-MRMR￾K-NI,当分类准确率达到最大时,所选的特征子集 数为 20,远小于两种传统算法所选择的最优特征 子集数。可见,在数据集 clean 上,算法 New-MRMR￾K-NI、New-MRMR-K-P 的特征选择效果更优。 不同维度下,算法 New-MRMR-L-NI、New￾MRMR-L-P、传统特征选择算法 MRMR、Fisher Score 在数据集 clean 上的分类准确率变化趋势见 图 12。 0.8 0.9 0.7 0.6 分类准确率 0 80 120 160 40 数据维度 K MRMR Laplacian-Score New-MRMR-L-NI New-MRMR-L-P 图 12 New-MRMR-L-NI、New-MRMR-L-P、Laplacian￾Score、MRMR 在数据集 clean 上分类准确率的变 化趋势 Fig. 12 Correct classification trend of New-MRMR-L-NI, New-MRMR-L-P, Laplacian-Score, MRMR on the dataset clean 图 12 可以看出,维度为 40 时,算法 New-MRMR￾L-NI 就达到了最大分类准确率,且高于传统算法 MRMR、Laplacian-Score 的分类准确率。此外,虽 然在维度为 110 时,New-MRMR-L-P 的分类准确 率略低于 MRMR,但在其余维度上的分类准确率 均高于 MRMR、Laplacian-Score 的分类准确率。 可见,在数据集 clean 上,新提算法 New￾MRMR-L-NI、New-MRMR-L-P 的特征选择效果更好。 不同维度下,算法 New-MRMR-IG-NI、New￾MRMR-IG-P、传统特征选择算法 MRMR、Fisher Score 在数据集 clean 上的分类准确率变化趋势见 图 13。 0.8 0.9 0.7 0.6 分类准确率 0 40 80 120 160 数据维度 K MRMR Information-Gain New-MRMR-IG-NI New-MRMR-IG-P 图 13 New-MRMR-IG-NI、New-MRMR-IG-P、Informa￾tion-Gain、MRMR 在数据集 clean 上分类准确率 的变化趋势 Fig. 13 Correct classification trend of New-MRMR-IG-NI, New-MRMR-IG-P, Information-Gain, MRMR on the dataset clean 图 13 显示,本文新提算法 New-MRMR-IG￾NI、New-MRMR-IG-P 的分类准确率曲线均在传 统算法的分类准确率曲线之上。所以,对于数据 集 clean,本文新提出的两种特征选择算法 New￾MRMR-IG-NI、New-MRMR-IG-P 所选择的特征子 集更加有效。 表 6 给出了以上各种算法在数据集 Parkinson’s Disease 上的实验结果,即经支持向量机分类后, 得到的分类准确率达到最大时所选择的特征数。 表 6 分类准确率最大时,数据集 Parkinson’s Disease 上各种算法分别所选择的特征数 Table 6 Number of features selected by various algorithms when the Classification precision is maximum on the Parkinson’s Disease dataset 对比算法 特征选择算法 所选特征数 分类准确率 本文新提出的8种算法 New-MRMR-F-P 150 0.914 2 New-MRMR-F-NI 210 0.877 9 New-MRMR-IG-P 180 0.883 4 New-MRMR-IG-NI 210 0.914 2 New-MRMR-K-P 300 0.862 4 New-MRMR-K-NI 120 0.887 4 New-MRMR-L-P 150 0.881 6 New-MRMR-L-NI 240 0.901 6 传统算法 MRMR 540 0.867 0 Fisher Score 540 0.825 3 第 4 期 李顺勇,等:一种新的最大相关最小冗余特征选择算法 ·657·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有