正在加载图片...
·660. 智能系统学报 第16卷 由表7可以看出,成对单边T检验的P值均 选择方法).计算机应用,2019,39(10小:2815-2821 小于0.05,所以拒绝原假设,故认为本文新提出 XU Hongfeng,SUN Zhenqiang.Fast feature selection 的8种特征选择算法的特征选择结果优于传统特 method based on mutual information in multi-label learn- 征选择算法的特征选择结果。 ing[J].Journal of computer applications,2019,39(10): 综上分析,从分类准确率以及假设检验的结 2815-2821. 果可以看出,本文新提出的8种特征选择算法所 [4]计智伟,胡珉.一种双重过滤式特征选择算法.计算机 工程与应用,2011.47(19少:190-193,206 选择的特征子集更优,特征选择效果更好。 JI Zhiwei.HU Min.A double-filtered feature selection al- 3结束语 gorithm[J].Computer engineering and applications,2011, 47(19):190-193.206. 虽然传统的基于特征选择的分类算法的理念 [s]吴红霞,吴悦,刘宗田,等.基于Relief和SVM-RFE的组 已较为新颖,但是还是存在一定的提升空间。 合式SNP特征选择).计算机应用研究,2012,29(6): 方面,传统的基于特征选择的分类算法在特征选 2074-2077 择过程中采用的度量特征之间冗余度以及与类别 WU Hongxia,WU Yue,LIU Zongtian,et al.Combined 的相关度的评价准则单一;另一方面,它只考虑 SNP feature selection based on Relief and SVM-RFE[J]. 了特征与类别之间的相关度而忽略了冗余度;最 Application research of computers,2012,29(6): 2074-2077. 后,其目标函数也存在缺陷,不能根据用户实际 [6]肖忆南,谢榕,杜娟.基于1检验和弹性网的数据分类特 的维度需求来选择特征子集。本文针对这些问题 征选择方法[).小型微型计算机系统,2015,36(10): 引入了4种不同的相关度评价准则以及两种不同 2213-2217. 的冗余度评价准则,目标函数中引入了指示向量 XIAO Yinan,XIE Rong,DU Juan.Feature selection meth- 入来刻画用户实际的数据维度需求,从而组合成 od for data classification based on t-test and elastic net[J]. 8种新的特征选择算法,利用支持向量机对这 Journal of Chinese computer systems,2015,36(10): 8种算法选择得到的特征子集分类。在4个真实 2213-2217. 的UCI数据集上进行了实验,利用分类准确率和 [7]SRIVIDHYA S,MALLIKA R.Feature selection for high T检验验证了新提出的算法的有效性。 dimensional imbalanced datasets using game theory and 最后需要指出,评价特征冗余度和相关度的 fisher score[J.Journal of advanced research in dynamical 方法有多种,本文仅用了2种评价冗余度的方法 and control systems,2017,9(8):195-202. 和4种评价相关度的方法,但是其他评价冗余度 [8]SAINZ L V,SAINZ J S,LAZARO M.Oscillatory brain 和相关度的方法也可以适用于New-MRMR框 activity in morphological parsing of complex words[J].In- formation gain from stems and suffixes,2018,9(5):271 架,此外,新提特征选择算法在不同数据集上表 [9]MALDONADO S,WEBER R.A wrapper method for fea- 现性能不同。因此,后续研究中,会更深人地研 ture selection using support vector machines[J].Informa- 究和挖掘数据本质,尝试利用足够多的数据集以 tion sciences,2009,179(13y:2208-2217. 及评价相关度和冗余度的方法来深入探索具体哪 [1O]林棋,张宏,李千目.一种基于MA-LSSVM的封装式特 种算法更适合哪种领域。 征选择算法.南京理工大学学报,2016,40(1:10-16. 参考文献: LIN Qi,ZHANG Hong,LI Qianmu.Wrapper feature se- lection algorithm based on MA-LSSVM[J].Journal of [1]王娟,慈林林,姚康泽.特征选择方法综述).计算机工 Nanjing University of Science and Technology,2016, 程与科学,2005,2712):68-71 40(1):10-16. WANG Juan,CI Linlin,YAO Kangze.A survey of feature [11]胡峰,杨梦.基于特征聚类的封装特征选择算法.计 selection[J].Computer engineering and science,2005, 算机工程与设计,2018,39(1230-237 27(12):68-71. HU Feng,YANG Meng.Algorithm for wrapper feature [2]周红标,乔俊飞.基于高维k近邻互信息的特征选择方 selection based on feature clustering[J].Computer engin- 法[J.智能系统学报,2017,12(5):595-600 eering and design,2018,39(1):230-237. ZHOU Hongbiao,QIAO Junfei.Feature selection method [12]王晓初,王士同,包芳,等.最小化类内距离和分类算法 based on high dimensional k-nearest neighbors mutual in- .电子与信息学报,2016,38(3):532-540 formation[J].CAAI transactions on intelligent systems, WANG Xiaochu,WANG Shitong,BAO Fang,et al.Min- 2017,12(5):595-600. imize intra-class distance and classification algorithm[J]. [3]徐洪峰,孙振强.多标签学习中基于互信息的快速特征 Journal of electronics information technology,2016.由表 7 可以看出,成对单边 T 检验的 P 值均 小于 0.05,所以拒绝原假设,故认为本文新提出 的 8 种特征选择算法的特征选择结果优于传统特 征选择算法的特征选择结果。 综上分析,从分类准确率以及假设检验的结 果可以看出,本文新提出的 8 种特征选择算法所 选择的特征子集更优,特征选择效果更好。 3 结束语 λ 虽然传统的基于特征选择的分类算法的理念 已较为新颖,但是还是存在一定的提升空间。一 方面,传统的基于特征选择的分类算法在特征选 择过程中采用的度量特征之间冗余度以及与类别 的相关度的评价准则单一;另一方面,它只考虑 了特征与类别之间的相关度而忽略了冗余度;最 后,其目标函数也存在缺陷,不能根据用户实际 的维度需求来选择特征子集。本文针对这些问题 引入了 4 种不同的相关度评价准则以及两种不同 的冗余度评价准则,目标函数中引入了指示向量 来刻画用户实际的数据维度需求,从而组合成 8 种新的特征选择算法,利用支持向量机对这 8 种算法选择得到的特征子集分类。在 4 个真实 的 UCI 数据集上进行了实验,利用分类准确率和 T 检验验证了新提出的算法的有效性。 最后需要指出,评价特征冗余度和相关度的 方法有多种,本文仅用了 2 种评价冗余度的方法 和 4 种评价相关度的方法,但是其他评价冗余度 和相关度的方法也可以适用于 New-MRMR 框 架,此外,新提特征选择算法在不同数据集上表 现性能不同。因此,后续研究中,会更深入地研 究和挖掘数据本质,尝试利用足够多的数据集以 及评价相关度和冗余度的方法来深入探索具体哪 种算法更适合哪种领域。 参考文献: 王娟, 慈林林, 姚康泽. 特征选择方法综述 [J]. 计算机工 程与科学, 2005, 27(12): 68–71. WANG Juan, CI Linlin, YAO Kangze. A survey of feature selection[J]. Computer engineering and science, 2005, 27(12): 68–71. [1] 周红标, 乔俊飞. 基于高维 k-近邻互信息的特征选择方 法 [J]. 智能系统学报, 2017, 12(5): 595–600. ZHOU Hongbiao, QIAO Junfei. Feature selection method based on high dimensional k-nearest neighbors mutual in￾formation[J]. CAAI transactions on intelligent systems, 2017, 12(5): 595–600. [2] [3] 徐洪峰, 孙振强. 多标签学习中基于互信息的快速特征 选择方法 [J]. 计算机应用, 2019, 39(10): 2815–2821. XU Hongfeng, SUN Zhenqiang. Fast feature selection method based on mutual information in multi-label learn￾ing[J]. Journal of computer applications, 2019, 39(10): 2815–2821. 计智伟, 胡珉. 一种双重过滤式特征选择算法 [J]. 计算机 工程与应用, 2011, 47(19): 190–193, 206. JI Zhiwei, HU Min. A double-filtered feature selection al￾gorithm[J]. Computer engineering and applications, 2011, 47(19): 190–193, 206. [4] 吴红霞, 吴悦, 刘宗田, 等. 基于 Relief 和 SVM-RFE 的组 合式 SNP 特征选择 [J]. 计算机应用研究, 2012, 29(6): 2074–2077. WU Hongxia, WU Yue, LIU Zongtian, et al. Combined SNP feature selection based on Relief and SVM-RFE[J]. Application research of computers, 2012, 29(6): 2074–2077. [5] 肖忆南, 谢榕, 杜娟. 基于 t 检验和弹性网的数据分类特 征选择方法 [J]. 小型微型计算机系统, 2015, 36(10): 2213–2217. XIAO Yinan, XIE Rong, DU Juan. Feature selection meth￾od for data classification based on t-test and elastic net[J]. Journal of Chinese computer systems, 2015, 36(10): 2213–2217. [6] SRIVIDHYA S, MALLIKA R. Feature selection for high dimensional imbalanced datasets using game theory and fisher score[J]. Journal of advanced research in dynamical and control systems, 2017, 9(8): 195–202. [7] SAINZ L V, SAINZ J S, LÁZARO M. Oscillatory brain activity in morphological parsing of complex words[J]. In￾formation gain from stems and suffixes, 2018, 9(5): 271. [8] MALDONADO S, WEBER R. A wrapper method for fea￾ture selection using support vector machines[J]. Informa￾tion sciences, 2009, 179(13): 2208–2217. [9] 林棋, 张宏, 李千目. 一种基于 MA-LSSVM 的封装式特 征选择算法 [J]. 南京理工大学学报, 2016, 40(1): 10–16. LIN Qi, ZHANG Hong, LI Qianmu. Wrapper feature se￾lection algorithm based on MA-LSSVM[J]. Journal of Nanjing University of Science and Technology, 2016, 40(1): 10–16. [10] 胡峰, 杨梦. 基于特征聚类的封装特征选择算法 [J]. 计 算机工程与设计, 2018, 39(1): 230–237. HU Feng, YANG Meng. Algorithm for wrapper feature selection based on feature clustering[J]. Computer engin￾eering and design, 2018, 39(1): 230–237. [11] 王晓初, 王士同, 包芳, 等. 最小化类内距离和分类算法 [J]. 电子与信息学报, 2016, 38(3): 532–540. WANG Xiaochu, WANG Shitong, BAO Fang, et al. Min￾imize intra-class distance and classification algorithm[J]. Journal of electronics & information technology, 2016, [12] ·660· 智 能 系 统 学 报 第 16 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有