【机器学习】面向特征选择问题的协同演化方法

团购合买资源类别：文库，文档格式：PDF，文档页数：8，文件大小：1.26MB

第12卷第1期智能系统学报 Vol.12 No.1 2017年2月 CAAI Transactions on Intelligent Systems Feb.2017 D0I:10.1992/tis.201611029 网络出版地址：http://kns.cmki.net/kcms/detail/23.1538.TP.20170302.1522.002.html 面向特征选择问题的协同演化方法滕旭阳，董红斌，孙静 (哈尔滨工程大学计算机科学与技术学院，黑龙江哈尔滨150001) 摘要：特征选择技术是机器学习和数据挖掘任务的关键预处理技术。传统贪婪式特征选择方法仅考虑本轮最佳特征，从而导致获取的特征子集仅为局部最优，无法获得最优或者近似最优的特征集合。进化搜索方式则有效地对特征空间进行搜索，然而不同的进化算法在搜索过程中存在自身的局限。本文吸取遗传算法(GA)和粒子群优化算法(P$0)的进化优势，以信息嫡度量为评价，通过协同演化的方式获取最终特征子集。并提出适用于特征选择问题特有的比特率交叉算子和信息交换策略。实验结果显示，遗传算法和粒子群协同进化(GAP$0)在进化搜索特征子集的能力和具体分类学习任务上都优于单独的演化搜索方式。进化搜索提供的组合判断能力优于贪婪式特征选择方法。关键词：特征选择：遗传算法：粒子群优化；协同演化：比特率交叉中图分类号：TP301文献标志码：A文章编号：1673-4785(2017)01-0024-08 中文引用格式：滕旭阳，董红斌，孙静.面向特征选择问题的协同演化方法[J].智能系统学报，2017,12(1)：24-31. 英文引用格式：TENG Xuyang,DONG Hongbin,SUN Jing.Co-evolutionary algorithm for feature selection[J].CAAI transactions on intelligent systems,2017,12(1):24-31. Co-evolutionary algorithm for feature selection TENG Xuyang,DONG Hongbin,SUN Jing (College of Computer Science and Technology,Harbin Engineering University,Harbin 150001,China) Abstract:Feature selection is a key preprocessing technology of machine learning and data mining.The traditional greed type of feature selection methods only considers the best feature of the current round,thereby leading to the feature subset that is only locally optimal.Realizing an optimal or nearly optimal feature set is difficult.Evolutionary search means can effectively search for a feature space,but different evolutionary algorithms have their own limitations in search processes.The evolutionary advantages of genetic algorithms (GA)and particle swarm optimization(PSO)are absorbed in this study.The final feature subset is obtained by co-evolution,with the information entropy measure as an assessment function.A specific bit rate cross operator and an information exchange strategy applicable for a feature selection problem are proposed.The experimental results show that the co- evolutionary method(GA-PSO)is superior to the single evolutionary search method in the search ability of the feature subsets and classification learning.In conclusion,the ability of combined evaluation,which is provided by an evolutionary search,is better than that of the traditional greedy feature selection method. Keywords:feature selection;genetic algorithm (GA);particle swarm optimization (PSO);co-evolution;bit rate cross 特征选择在数据挖掘和机器学习中不仅可以减少数据的维度，降低所需处理的数据量，而且还可以提升某些学习算法的表现山，比如：分类学习、收稿日期：2016-11-19.网络出版日期：2017-03-02. 聚类、回归问题和时间序列预测等。然而维数据特基金项目：国家自然科学基金项目(61472095,61502116)：黑龙江省教育厅智能教育与信息工程重点实验室开放基金项目. 征选择面临着特别庞大的搜索空间等，当存在n维通信作者：孙静.E-mail:sunjing(@hrbeu..cdu.cn. 特征时解的搜索空间为2“，因此穷举搜索是不可行

第１２卷第１期智能系统学报Ｖｏｌ．１２ №．１２０１７年２月ＣＡＡＩＴｒａｎｓａｃｔｉｏｎｓｏｎＩｎｔｅｌｌｉｇｅｎｔＳｙｓｔｅｍｓＦｅｂ．２０１７ＤＯＩ：１０．１９９２／ｔｉｓ．２０１６１１０２９网络出版地址：ｈｔｔｐ：／／ｋｎｓ．ｃｎｋｉ．ｎｅｔ／ｋｃｍｓ／ｄｅｔａｉｌ／２３．１５３８．ＴＰ．２０１７０３０２．１５２２．００２．ｈｔｍｌ面向特征选择问题的协同演化方法滕旭阳，董红斌，孙静（哈尔滨工程大学计算机科学与技术学院，黑龙江哈尔滨１５０００１）摘要：特征选择技术是机器学习和数据挖掘任务的关键预处理技术。传统贪婪式特征选择方法仅考虑本轮最佳特征，从而导致获取的特征子集仅为局部最优，无法获得最优或者近似最优的特征集合。进化搜索方式则有效地对特征空间进行搜索，然而不同的进化算法在搜索过程中存在自身的局限。本文吸取遗传算法（ＧＡ）和粒子群优化算法（ＰＳＯ）的进化优势，以信息熵度量为评价，通过协同演化的方式获取最终特征子集。并提出适用于特征选择问题特有的比特率交叉算子和信息交换策略。实验结果显示，遗传算法和粒子群协同进化（ＧＡ⁃ＰＳＯ）在进化搜索特征子集的能力和具体分类学习任务上都优于单独的演化搜索方式。进化搜索提供的组合判断能力优于贪婪式特征选择方法。关键词：特征选择；遗传算法；粒子群优化；协同演化：比特率交叉中图分类号：ＴＰ３０１文献标志码：Ａ文章编号：１６７３－４７８５（２０１７）０１－００２４－０８中文引用格式：滕旭阳，董红斌，孙静．面向特征选择问题的协同演化方法［Ｊ］．智能系统学报，２０１７，１２（１）：２４－３１．英文引用格式：ＴＥＮＧＸｕｙａｎｇ，ＤＯＮＧＨｏｎｇｂｉｎ，ＳＵＮＪｉｎｇ．Ｃｏ⁃ｅｖｏｌｕｔｉｏｎａｒｙａｌｇｏｒｉｔｈｍｆｏｒｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎ［Ｊ］．ＣＡＡＩｔｒａｎｓａｃｔｉｏｎｓｏｎｉｎｔｅｌｌｉｇｅｎｔｓｙｓｔｅｍｓ，２０１７，１２（１）：２４－３１．Ｃｏ⁃ｅｖｏｌｕｔｉｏｎａｒｙａｌｇｏｒｉｔｈｍｆｏｒｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎＴＥＮＧＸｕｙａｎｇ，ＤＯＮＧＨｏｎｇｂｉｎ，ＳＵＮＪｉｎｇ（ＣｏｌｌｅｇｅｏｆＣｏｍｐｕｔｅｒＳｃｉｅｎｃｅａｎｄＴｅｃｈｎｏｌｏｇｙ，ＨａｒｂｉｎＥｎｇｉｎｅｅｒｉｎｇＵｎｉｖｅｒｓｉｔｙ，Ｈａｒｂｉｎ１５０００１，Ｃｈｉｎａ）Ａｂｓｔｒａｃｔ：Ｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｉｓａｋｅｙｐｒｅｐｒｏｃｅｓｓｉｎｇｔｅｃｈｎｏｌｏｇｙｏｆｍａｃｈｉｎｅｌｅａｒｎｉｎｇａｎｄｄａｔａｍｉｎｉｎｇ．Ｔｈｅｔｒａｄｉｔｉｏｎａｌｇｒｅｅｄｔｙｐｅｏｆｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｍｅｔｈｏｄｓｏｎｌｙｃｏｎｓｉｄｅｒｓｔｈｅｂｅｓｔｆｅａｔｕｒｅｏｆｔｈｅｃｕｒｒｅｎｔｒｏｕｎｄ，ｔｈｅｒｅｂｙｌｅａｄｉｎｇｔｏｔｈｅｆｅａｔｕｒｅｓｕｂｓｅｔｔｈａｔｉｓｏｎｌｙｌｏｃａｌｌｙｏｐｔｉｍａｌ．Ｒｅａｌｉｚｉｎｇａｎｏｐｔｉｍａｌｏｒｎｅａｒｌｙｏｐｔｉｍａｌｆｅａｔｕｒｅｓｅｔｉｓｄｉｆｆｉｃｕｌｔ．Ｅｖｏｌｕｔｉｏｎａｒｙｓｅａｒｃｈｍｅａｎｓｃａｎｅｆｆｅｃｔｉｖｅｌｙｓｅａｒｃｈｆｏｒａｆｅａｔｕｒｅｓｐａｃｅ，ｂｕｔｄｉｆｆｅｒｅｎｔｅｖｏｌｕｔｉｏｎａｒｙａｌｇｏｒｉｔｈｍｓｈａｖｅｔｈｅｉｒｏｗｎｌｉｍｉｔａｔｉｏｎｓｉｎｓｅａｒｃｈｐｒｏｃｅｓｓｅｓ．Ｔｈｅｅｖｏｌｕｔｉｏｎａｒｙａｄｖａｎｔａｇｅｓｏｆｇｅｎｅｔｉｃａｌｇｏｒｉｔｈｍｓ（ＧＡ）ａｎｄｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｚａｔｉｏｎ（ＰＳＯ）ａｒｅａｂｓｏｒｂｅｄｉｎｔｈｉｓｓｔｕｄｙ．Ｔｈｅｆｉｎａｌｆｅａｔｕｒｅｓｕｂｓｅｔｉｓｏｂｔａｉｎｅｄｂｙｃｏ⁃ｅｖｏｌｕｔｉｏｎ，ｗｉｔｈｔｈｅｉｎｆｏｒｍａｔｉｏｎｅｎｔｒｏｐｙｍｅａｓｕｒｅａｓａｎａｓｓｅｓｓｍｅｎｔｆｕｎｃｔｉｏｎ．Ａｓｐｅｃｉｆｉｃｂｉｔｒａｔｅｃｒｏｓｓｏｐｅｒａｔｏｒａｎｄａｎｉｎｆｏｒｍａｔｉｏｎｅｘｃｈａｎｇｅｓｔｒａｔｅｇｙａｐｐｌｉｃａｂｌｅｆｏｒａｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｐｒｏｂｌｅｍａｒｅｐｒｏｐｏｓｅｄ．Ｔｈｅｅｘｐｅｒｉｍｅｎｔａｌｒｅｓｕｌｔｓｓｈｏｗｔｈａｔｔｈｅｃｏ⁃ ｅｖｏｌｕｔｉｏｎａｒｙｍｅｔｈｏｄ（ＧＡ⁃ＰＳＯ）ｉｓｓｕｐｅｒｉｏｒｔｏｔｈｅｓｉｎｇｌｅｅｖｏｌｕｔｉｏｎａｒｙｓｅａｒｃｈｍｅｔｈｏｄｉｎｔｈｅｓｅａｒｃｈａｂｉｌｉｔｙｏｆｔｈｅｆｅａｔｕｒｅｓｕｂｓｅｔｓａｎｄｃｌａｓｓｉｆｉｃａｔｉｏｎｌｅａｒｎｉｎｇ．Ｉｎｃｏｎｃｌｕｓｉｏｎ，ｔｈｅａｂｉｌｉｔｙｏｆｃｏｍｂｉｎｅｄｅｖａｌｕａｔｉｏｎ，ｗｈｉｃｈｉｓｐｒｏｖｉｄｅｄｂｙａｎｅｖｏｌｕｔｉｏｎａｒｙｓｅａｒｃｈ，ｉｓｂｅｔｔｅｒｔｈａｎｔｈａｔｏｆｔｈｅｔｒａｄｉｔｉｏｎａｌｇｒｅｅｄｙｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｍｅｔｈｏｄ．Ｋｅｙｗｏｒｄｓ：ｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎ；ｇｅｎｅｔｉｃａｌｇｏｒｉｔｈｍ（ＧＡ）；ｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｚａｔｉｏｎ（ＰＳＯ）；ｃｏ⁃ｅｖｏｌｕｔｉｏｎ；ｂｉｔｒａｔｅｃｒｏｓｓ收稿日期：２０１６－１１－１９．网络出版日期：２０１７－０３－０２．基金项目：国家自然科学基金项目（６１４７２０９５，６１５０２１１６）；黑龙江省教育厅智能教育与信息工程重点实验室开放基金项目．通信作者：孙静．Ｅ⁃ｍａｉｌ：ｓｕｎｊｉｎｇ＠ｈｒｂｅｕ．ｅｄｕ．ｃｎ．特征选择在数据挖掘和机器学习中不仅可以减少数据的维度，降低所需处理的数据量，而且还可以提升某些学习算法的表现［１］，比如：分类学习、聚类、回归问题和时间序列预测等。然而维数据特征选择面临着特别庞大的搜索空间等，当存在ｎ维特征时解的搜索空间为２ｎ，因此穷举搜索是不可行

第1期膝旭阳，等：面向特征选择问题的协同演化方法 25· 的。特征选择方法大致可分为3类：过滤式并且D中的每个样本都有特征集合F,F包含n维 (filter)、包裹式(wrapper)和嵌入式(embedding)[)。特征，x:∈R“。对于分类问题，可将D中样本划分为过滤式方法与具体学习方法无关，主要依据数据的目标向量C中的m个不同的类C={C,C2,…, 内在属性对特征进行过滤，再用选择出的特征训练 C{。特征选择的目的，是在原始特征集合N中寻模型。包裹式方法将最终要使用的学习器的学习找到一个最佳特征子集P,其中含有p维特征(p< 性能作为评价子集评价标准。嵌入式方法将特征 n),在该特征子集下能最大化分类任务（或其他学选择过程与学习器训练过程融为一体，两者在同一习任务)的预测正确率。过程中优化。wrapper方法对于具体学习器效果好，特征选择处理包括4个组件：特征子集生成、子但其计算代价高，泛化能力差。filter方法虽然在具集评估、终止条件和结果验证。如图1所示，在阶段体学习方法中精度低于wrapper方法，但其泛化能 1中根据一个确定的搜索策略特征子集生成组件会力强，计算效率高，在大规模数据集上更加适用。预先产生候选特征子集。每一个候选特征子集都因此，本文选用基于信息熵度量的filter评价方式。会被一个确定的评估方式所度量，并与之前最佳的为了保证搜索的高效，许多学者选择了贪婪式候选特征子集做比较，如果新的特征子集表现得更搜索方法来选择子集，代表性方法有基于信息增益加优越，那么替换原有的最佳特征子集。当满足设的方法(IG)【和基于信息比率的方法(GR)[。然定的终止条件时，生成和评估这两个过程将不再循环。而贪婪方法无可避免地导致其结果为局部最优，因在阶段2中，最终所选的特征子集需要被一些给定的学为其在选择过程中仅考虑当前轮的单个最佳或最习算法进行结果验证，其中ACC为学习正确率[)」差特征6。为了解决上述问题，全局搜索的方式则特征选择阶段1 成为特征选择问题中一种有效的寻优方式。演化计算作为一种具有良好全局搜索能力的代表技术特征子集子集终止近年来被越来越多地使用在特征选择技术中[)。生成 :评估条件训练数据随着各个领域内数据维度不断地增加，自2007后遗传算法（genetic algorithm,GA)与粒子群优化最佳 (particle swarm optimization,PSO)成为特征选择进测试数据测试学习训练学特征模型习模型子集化搜索策略中两个主流的全局搜索方法，特别是模型拟合表现评估 PSO方法因其搜索速度得到了广泛的使用。Peng ACO 阶段2 等[]在2005年提出了最大相关最小冗余的特征选图1特征选择处理的统一视角择方法(mRmR),该方法使用了贪婪式搜索方式。 Fig.1 A unified view of feature selection process 在2011年和2012年学者们验证了使用mRmR进行 1.2 遗传算法基本原理度量并采取群智能进化搜索的方式可以获得更优遗传算法作为一种自适应全局优化搜索算法，的特征子集[9,0 其选择、交叉与变异的3个算子成为种群寻优和保虽然在特征选择问题中演化算法的搜索能力持解多样性的关键。其基本执行过程如下。优于贪婪式搜索，但不同的演化算法自身也存在局 I)初始化：确定种群规模N,交叉概率P、变限性。因此更多的学者开始研究协同演化的方法，异概率Pion和终止进化准则。其中包括策略的协同)和种群的协同2]。本文选 2)个体评价：计算每个个体的适应度。用GA与PS0两种进化种群的协同。PSO的优势 3)种群进化：在于对解的记忆能力强及高效的收敛速度，但该方 ①选择算子：个体被选中的概率与其适应度函法极容易陷入到局部最优解，表现出极强的趋同性数值成正比。和较低的种群多样性。GA方法中染色体之间共享 ②交叉算子：根据交叉概率P对2条染色体信息，种群较为均匀地移动并保持多样性，但其收交换部分基因，构造下一代新的染色体。敛速度相对较慢。因此，本文提出了一种面向特征 ③变异算子：根据概率Pmim对群体中的不同选择问题的协同演化方法(GA-PS0),演化过程中个体指定的基因位进行改造。既保证了全局搜索能力以防止陷入局部最优，又提 ④终止检验：如已满足终止准则，则输出最优升了演化速度。解：否则转到2)。 1 基础知识 1.3二元粒子群优化基本原理粒子群优化算法，源于对鸟群捕食的行为研 1.1特征选择究，是由Kennedy和Eberhart等Ia)开发的一种新的数据集D中含有k个样本D={x1,x2,…,x4}, 进化算法。粒子在搜索空间内寻优，并定位当前路

的［２］。特征选择方法大致可分为３类：过滤式（ｆｉｌｔｅｒ）、包裹式（ｗｒａｐｐｅｒ）和嵌入式（ｅｍｂｅｄｄｉｎｇ）［３］。过滤式方法与具体学习方法无关，主要依据数据的内在属性对特征进行过滤，再用选择出的特征训练模型。包裹式方法将最终要使用的学习器的学习性能作为评价子集评价标准。嵌入式方法将特征选择过程与学习器训练过程融为一体，两者在同一过程中优化。ｗｒａｐｐｅｒ方法对于具体学习器效果好，但其计算代价高，泛化能力差。ｆｉｌｔｅｒ方法虽然在具体学习方法中精度低于ｗｒａｐｐｅｒ方法，但其泛化能力强，计算效率高，在大规模数据集上更加适用。因此，本文选用基于信息熵度量的ｆｉｌｔｅｒ评价方式。为了保证搜索的高效，许多学者选择了贪婪式搜索方法来选择子集，代表性方法有基于信息增益的方法（ＩＧ）［４］和基于信息比率的方法（ＧＲ）［５］。然而贪婪方法无可避免地导致其结果为局部最优，因为其在选择过程中仅考虑当前轮的单个最佳或最差特征［６］。为了解决上述问题，全局搜索的方式则成为特征选择问题中一种有效的寻优方式。演化计算作为一种具有良好全局搜索能力的代表技术近年来被越来越多地使用在特征选择技术中［７］。随着各个领域内数据维度不断地增加，自２００７后遗传算法（ｇｅｎｅｔｉｃａｌｇｏｒｉｔｈｍ，ＧＡ）与粒子群优化（ｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｚａｔｉｏｎ，ＰＳＯ）成为特征选择进化搜索策略中两个主流的全局搜索方法，特别是ＰＳＯ方法因其搜索速度得到了广泛的使用。Ｐｅｎｇ等［８］在２００５年提出了最大相关最小冗余的特征选择方法（ｍＲｍＲ），该方法使用了贪婪式搜索方式。在２０１１年和２０１２年学者们验证了使用ｍＲｍＲ进行度量并采取群智能进化搜索的方式可以获得更优的特征子集［９，１０］。虽然在特征选择问题中演化算法的搜索能力优于贪婪式搜索，但不同的演化算法自身也存在局限性。因此更多的学者开始研究协同演化的方法，其中包括策略的协同［１１］和种群的协同［１２］。本文选用ＧＡ与ＰＳＯ两种进化种群的协同。ＰＳＯ的优势在于对解的记忆能力强及高效的收敛速度，但该方法极容易陷入到局部最优解，表现出极强的趋同性和较低的种群多样性。ＧＡ方法中染色体之间共享信息，种群较为均匀地移动并保持多样性，但其收敛速度相对较慢。因此，本文提出了一种面向特征选择问题的协同演化方法（ＧＡ⁃ＰＳＯ），演化过程中既保证了全局搜索能力以防止陷入局部最优，又提升了演化速度。１基础知识１．１特征选择数据集Ｄ中含有ｋ个样本Ｄ＝｛ｘ１，ｘ２，…，ｘｋ｝，并且Ｄ中的每个样本都有特征集合Ｆ，Ｆ包含ｎ维特征，ｘｉ∈Ｒｎ。对于分类问题，可将Ｄ中样本划分为目标向量Ｃ中的ｍ个不同的类Ｃ＝｛Ｃ１，Ｃ２，…，Ｃｍ｝。特征选择的目的，是在原始特征集合Ｎ中寻找到一个最佳特征子集Ｐ，其中含有ｐ维特征（ｐ＜ｎ），在该特征子集下能最大化分类任务（或其他学习任务）的预测正确率。特征选择处理包括４个组件：特征子集生成、子集评估、终止条件和结果验证。如图１所示，在阶段１中根据一个确定的搜索策略特征子集生成组件会预先产生候选特征子集。每一个候选特征子集都会被一个确定的评估方式所度量，并与之前最佳的候选特征子集做比较，如果新的特征子集表现得更加优越，那么替换原有的最佳特征子集。当满足设定的终止条件时，生成和评估这两个过程将不再循环。在阶段２中，最终所选的特征子集需要被一些给定的学习算法进行结果验证，其中ＡＣＣ为学习正确率［３］。图１特征选择处理的统一视角Ｆｉｇ．１Ａｕｎｉｆｉｅｄｖｉｅｗｏｆｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｐｒｏｃｅｓｓ１．２遗传算法基本原理遗传算法作为一种自适应全局优化搜索算法，其选择、交叉与变异的３个算子成为种群寻优和保持解多样性的关键。其基本执行过程如下。１）初始化：确定种群规模Ｎ、交叉概率Ｐｃｒｏｓｓ、变异概率Ｐｍｕｔａｔｉｏｎ和终止进化准则。２）个体评价：计算每个个体的适应度。３）种群进化： ①选择算子：个体被选中的概率与其适应度函数值成正比。 ②交叉算子：根据交叉概率Ｐｃｒｏｓｓ对２条染色体交换部分基因，构造下一代新的染色体。 ③变异算子：根据概率Ｐｍｕｔａｔｉｏｎ对群体中的不同个体指定的基因位进行改造。 ④终止检验：如已满足终止准则，则输出最优解；否则转到２）。１．３二元粒子群优化基本原理粒子群优化算法，源于对鸟群捕食的行为研究，是由Ｋｅｎｎｅｄｙ和Ｅｂｅｒｈａｒｔ等［１３］开发的一种新的进化算法。粒子在搜索空间内寻优，并定位当前路第１期滕旭阳，等：面向特征选择问题的协同演化方法 ·２５·

·26 智能系统学报第12卷径中的最佳位置。每一个粒子都需要考虑自身当 2.2适应度函数前的位置和速度，记录它们自己的最优解（最佳位本文使用互信息嫡理论对特征子集进行整体置)p,并根据粒子群体内全局最优解ga调整当评估，两个变量的互信息值越大，则意味着两个变前自身位置，粒子的具体更新如下：量相关程度越紧密：当互信息为零时，则意味着两 1=wr片+c1×rand(Phe-xa)+c2× 个变量完全不相关。特征集合F={f,,…,f}中 rand(ghet-xh） (1) 某一特征与类别的互信息度量如下： xl= (2) I(f,C)=H(f)+(C)-H(fi,C) (5) 速度和位置的更新过程中，t是粒子h在第t 式中：H为变量的嫡值，用以度量随机变量信息的不轮迭代中的速度；0为惯性系数：c1与c2为加速系确定性。以类别向量为例，H(C)通常用作描述离散数；x是粒子h在第t轮迭代中的位置；P,是第h 个粒子目前的最佳位置。其中，w提供了粒子的随机变量C={c1,c2,…,cn}熵值，c是变量C的可能搜索能力，c,×rand(Pet)和c2,×rand(ge-xi)分取值，P(c:)为概率密度函数。别表达了粒子自身的演化和粒子间的合作。 H(C)=- (6) 基于上述研究，学者Kennedy调整了连续PSO p(e,)lgp(ce)） = 方法中速度和位置的更新方式，提出了适用于解决离当已知特征变量和类别变量∫和C的联合概率散问题的二元粒子群算法(binary particle swarm 密度时（对于离散数据意味着两个变量对应的属性 optimization,BPSO)[w。该思想中的粒子仅可以在二值联合出现的频度)，两者的联合嫡为元空间中进行搜索，粒子的位置向量仅可以用0或1 HU,C)=-∑∑p,c)logp(,c)(7) 表示。BPSO方法中影响其寻优能力的关键之一就是 f月efi,Hec 转换函数，利用该函数将连续的速度值转化为离散的基于特征与类别向量的信息嫡度量构建适应位置。在最初的研究中使用式(3)中的sigmoid函数度函数，适应度函数的度量体现了进化过程对优良作为转换函数将实值的速度映射为[0,1]之间的值。个体的保留，对低劣个体的淘汰。本文在设计适应 T((t)=1 (3) 度函数时不仅考虑了特征与类别的相关性，而且将 I +e( 特征子集规模也作为影响个体（粒子）适应度的一式中：t(t)为粒子h在第t轮迭代中第k维的速部分，适应度函数的设计试图找出子集规模小，并度。在将粒子速度转换为概率值后，位置向量将依且特征与类别高度相关的特征集合。具体适应度据概率值进行更新：函数设计如下： (0,rand T((t+1)) x(t+1)= (4) Fit,MI x S (8) 1. rand≥T((t+1) MI Fit,=Mx S (9) 2 求解特征子集的协同演化方法式中：MI部分为特征与类别关联性度量；S部分为 2.1编码方式特征子集规模控制。假设当前候选特征子集为在本文使用了二进制比特串的编码方式，该编码方式通用于遗传算法和二元粒子群方法，如图2所全部n维特征中选出的p维特征：示。将每个二进制串作为一个个体（粒子），个体 MI= I(f,c) (10) (粒子)中的每一维（每一比特）都代表一个候选特 i=1 征，当该位为1时表示该特征被选中，并添加到候选 s=n-p (11) 的特征子集中：当该位为0时表示该特征未被选中。依据此编码方式将特征选择问题转换为寻找最佳本文设计式(8)和式(9)两个适应度函数，在寻个体（粒子）的问题。优过程中试图寻找最大值。其原理在于，小规模数 01 1 0 1 据集特征维度较少，在进化过程中对特征空间搜索较为全面。采用式(8)重点考察特征与类别的相关 n bit …●被选中的特征性。而对于大规模数据集，特征维度较大，进化搜 ……●未被选中的特征索特征空间的过程中很难控制特征子集规模，并且图2二元粒子群的编码方式容易在候选特征较多时形成局部最优，所以在式 Fig.2 Coding scheme of BPSO (9)中增大了对特征子集规模的惩罚系数。假设式

径中的最佳位置。每一个粒子都需要考虑自身当前的位置和速度，记录它们自己的最优解（最佳位置）ｐｂｓｅｔ，并根据粒子群体内全局最优解ｇｂｅｓｔ调整当前自身位置，粒子的具体更新如下：ｖｔ＋１ｈ＝ｗｖｔｈ＋ｃ１ × ｒａｎｄ（ｐｂｅｓｔｈ－ｘｔｈ）＋ｃ２ × ｒａｎｄ（ｇｂｅｓｔ－ｘｔｈ）（１）ｘｔ＋１ｈ＝ｘｔｈ＋ｖｔ＋１ｈ（２）速度和位置的更新过程中，ｖｔｈ是粒子ｈ在第ｔ轮迭代中的速度；ｗ为惯性系数；ｃ１与ｃ２为加速系数；ｘｔｈ是粒子ｈ在第ｔ轮迭代中的位置；ｐｂｅｓｔｈ是第ｈ个粒子目前的最佳位置。其中，ｗｖｔｈ提供了粒子的搜索能力，ｃ１ ×ｒａｎｄ（ｐｂｅｓｔｈ－ｘｔｈ）和ｃ２ ×ｒａｎｄ（ｇｂｅｓｔ－ｘｔｈ）分别表达了粒子自身的演化和粒子间的合作。基于上述研究，学者Ｋｅｎｎｅｄｙ调整了连续ＰＳＯ方法中速度和位置的更新方式，提出了适用于解决离散问题的二元粒子群算法（ｂｉｎａｒｙｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｚａｔｉｏｎ，ＢＰＳＯ）［１４］。该思想中的粒子仅可以在二元空间中进行搜索，粒子的位置向量仅可以用０或１表示。ＢＰＳＯ方法中影响其寻优能力的关键之一就是转换函数，利用该函数将连续的速度值转化为离散的位置。在最初的研究中使用式（３）中的ｓｉｇｍｏｉｄ函数作为转换函数将实值的速度映射为［０，１］之间的值。Ｔｖｋ ( ｈ（ｔ） ) ＝１１＋ｅ－ｖｋｈ（ｔ）（３）式中：ｖｋｈ（ｔ）为粒子ｈ在第ｔ轮迭代中第ｋ维的速度。在将粒子速度转换为概率值后，位置向量将依据概率值进行更新：ｘｋｈ（ｔ＋１）＝０，ｒａｎｄ＜Ｔｖｋ ( ｈ（ｔ＋１） ) １，ｒａｎｄ ≥ Ｔｖｋ { ( ｈ（ｔ＋１） ) （４）２求解特征子集的协同演化方法２．１编码方式本文使用了二进制比特串的编码方式，该编码方式通用于遗传算法和二元粒子群方法，如图２所示。将每个二进制串作为一个个体（粒子），个体（粒子）中的每一维（每一比特）都代表一个候选特征，当该位为１时表示该特征被选中，并添加到候选的特征子集中；当该位为０时表示该特征未被选中。依据此编码方式将特征选择问题转换为寻找最佳个体（粒子）的问题。图２二元粒子群的编码方式Ｆｉｇ．２ＣｏｄｉｎｇｓｃｈｅｍｅｏｆＢＰＳＯ２．２适应度函数本文使用互信息熵理论对特征子集进行整体评估，两个变量的互信息值越大，则意味着两个变量相关程度越紧密；当互信息为零时，则意味着两个变量完全不相关。特征集合Ｆ＝｛ｆ１，ｆ２，…，ｆｎ｝中某一特征ｆｉ与类别的互信息度量如下：Ｉ（ｆｉ，Ｃ）＝Ｈ（ｆｉ）＋Ｈ（Ｃ）－Ｈ（ｆｉ，Ｃ）（５）式中：Ｈ为变量的熵值，用以度量随机变量信息的不确定性。以类别向量为例，Ｈ（Ｃ）通常用作描述离散随机变量Ｃ＝｛ｃ１，ｃ２，…，ｃｎ｝熵值，ｃｉ是变量Ｃ的可能取值，ｐ（ｃｉ）为概率密度函数。Ｈ（Ｃ）＝－ ∑ ｍｉ＝１ｐ（ｃｉ）ｌｏｇ（ｐ（ｃｉ））（６）当已知特征变量和类别变量ｆｉ和Ｃ的联合概率密度时（对于离散数据意味着两个变量对应的属性值联合出现的频度），两者的联合熵为Ｈｆ( ｉ，Ｃ) ＝－ ∑ ｆｊｉ ∈ｆｉ， ∑ｃｉ∈Ｃｐｆｊｉ，ｃｉ ( ) ｌｏｇｐｆｊｉ，ｃｉ ( ( ) ) （７）基于特征与类别向量的信息熵度量构建适应度函数，适应度函数的度量体现了进化过程对优良个体的保留，对低劣个体的淘汰。本文在设计适应度函数时不仅考虑了特征与类别的相关性，而且将特征子集规模也作为影响个体（粒子）适应度的一部分，适应度函数的设计试图找出子集规模小，并且特征与类别高度相关的特征集合。具体适应度函数设计如下：Ｆｉｔ１＝ＭＩ × Ｓ（８）Ｆｉｔ２＝ＭＩｐ × Ｓ（９）式中：ＭＩ部分为特征与类别关联性度量；Ｓ部分为特征子集规模控制。假设当前候选特征子集为在全部ｎ维特征中选出的ｐ维特征：ＭＩ＝ ∑ ｐｉ＝１Ｉｆ( ｉ，Ｃ) （１０）Ｓ＝ｎ－ｐｎ（１１）本文设计式（８）和式（９）两个适应度函数，在寻优过程中试图寻找最大值。其原理在于，小规模数据集特征维度较少，在进化过程中对特征空间搜索较为全面。采用式（８）重点考察特征与类别的相关性。而对于大规模数据集，特征维度较大，进化搜索特征空间的过程中很难控制特征子集规模，并且容易在候选特征较多时形成局部最优，所以在式（９）中增大了对特征子集规模的惩罚系数。假设式 ·２６· 智能系统学报第１２卷

第1期膝旭阳，等：面向特征选择问题的协同演化方法 ·27. (8)和式(9)获得相同的适应度函数值，式(9)需要较容易陷入全局最优解并且过早收敛，进化过程中尽量减小k值，使得选择特征尽量少以取得关联性会将搜索引向本次迭代的全局和个体最佳位置，因度量和子集规模的平衡。此进化的多样性差。协同的思想对于P$0特征选 2.3比特率交叉算子择方法的帮助在于，通过本文提出的最佳个体比特在遗传算法中，交叉算子通过模拟自然界生物信息位交换策略，每次进化产生最佳个体的比特信的杂交过程对个体进行交叉操作，不断产生新个息位不仅仅由PSO决定，事实上它和GA中的最佳体、增加种群的多样性、扩大寻优范围，从而使得遗个体共享那些能够引起适应度值增加的优秀比特传算法具有较强的搜索能力。直观地讲，交叉算子信息位。将这些优秀的比特基因随机地插入到粒影响了遗传算法对求解空间影响的搜索能力，并对子群中最佳个体对应的信息位上。这种方法不仅能否找到全局最优解发挥了至关重要的作用1]。有可能使最佳个体变得更优秀，还为PS0算法增加传统的GA算法交叉操作采用的是单点交叉，了多样性，避免过早地陷入局部最优解。对于GA 但是在该交叉操作中很可能出现“近亲繁殖”的现特征选择方法来说，寻优速度较慢，尤其在高维特象，即进行交叉操作的一对个体基因型相似，减缓征下往往不能获得令人满意的结果。从信息共享了遗传算法的搜索速度，或者会出现局部收敛或早机制来说，遗传算法的信息共享方式主要是通过两熟收敛，从而影响种群的进化方向。因此本文针对个个体之间的交叉操作，而粒子群算法的信息共享特征选择问题提出了比特概率交叉算子，在基因交方式是通过种群中的最优个体传递信息给其余个叉的过程中，首先判断两个个体的基因相似比特体。这两种信息共享机制就相应地决定了两种算率，并将比特率与交叉概率作比较，若小于该概率法的表现，粒子群算法每代都选出当前最优个体，则进行个体基因交叉操作。具体过程如算法1 并进行全局范围的信息共享，使得整个粒子群能向所示。着最优的方向快速趋近：而遗传算法的交叉操作具算法1比特概率交叉算子有一定的随机性，且由于是一对一进行交叉，每一输入两个个体的二进制比特基因信息位次迭代中作用的范围相对较小，使得种群中的优秀 f(i,:)和f(Gj,:),染色体长度n,交叉概率Pmso 基因交流较慢，整个种群的进化比较漫长，所以PS0 输出交叉后两个个体的基因型f(i,:) 特征选择寻优速度较快，效率更高。通过信息交和f,:)。互，在迭代过程中种群可以获得更为优秀的个体基 1)m=0. 因型，这有助于加速GA种群的进化过程，提高收敛 2)For k=1:no 速度。同时，通过上文的比特率交叉算子可以避免 3)若两个体的第k位比特位相同则m=m+1。相近的基因型交叉产生不“健康”的后代个体。具 4)End For 体的GA-PSO协同演化算法如算法2和算法3 5)计算个体间基因型相似比s=m/n。所示。 6)fs<P交叉概率。算法2协同演化算法 7)随机选定基因型个体的某一位Posm 输入粒子群和种群初始化参数。 8)For h=Poserom:no 输出最佳个体。 9)交换个体Posm位到第n位的基因。 1)初始化粒子群和种群。 l0)End For。 2)协同演化。 11)End If。 ①计算各个粒子的适应度值。通过比特率交叉算子可以避免基因型相近的 ②选择粒子群算法最佳个体PSO。个体进行交叉操作，即可以避免产生“隐性致病基 ③选出遗传算法最佳个体GA 因”，防止相近个体的近亲繁殖，并增强种群个体的 ④最佳个体比特信息位交换。多样性。 ⑤PS0:更新粒子速度及位置。 2.4GA-PS0协同演化方法的实现 ⑥GA:选择、比特率交叉（算法1）和变异。本文提出的GA-PSO算法的主要思想是比特位 3)判断终止条件，若不满足返回2)，满足进入4)。信息交互。传统的PS0特征选择有一定的缺陷，比 4)比较GA与PS0,输出最佳个体

（８）和式（９）获得相同的适应度函数值，式（９）需要尽量减小ｋ值，使得选择特征尽量少以取得关联性度量和子集规模的平衡。２．３比特率交叉算子在遗传算法中，交叉算子通过模拟自然界生物的杂交过程对个体进行交叉操作，不断产生新个体、增加种群的多样性、扩大寻优范围，从而使得遗传算法具有较强的搜索能力。直观地讲，交叉算子影响了遗传算法对求解空间影响的搜索能力，并对能否找到全局最优解发挥了至关重要的作用［１５］。传统的ＧＡ算法交叉操作采用的是单点交叉，但是在该交叉操作中很可能出现“近亲繁殖” 的现象，即进行交叉操作的一对个体基因型相似，减缓了遗传算法的搜索速度，或者会出现局部收敛或早熟收敛，从而影响种群的进化方向。因此本文针对特征选择问题提出了比特概率交叉算子，在基因交叉的过程中，首先判断两个个体的基因相似比特率，并将比特率与交叉概率作比较，若小于该概率则进行个体基因交叉操作。具体过程如算法１所示。算法１比特概率交叉算子输入两个个体的二进制比特基因信息位ｆ（ｉ，：）和ｆ（ｊ，：），染色体长度ｎ，交叉概率Ｐｃｒｏｓｓ。输出交叉后两个个体的基因型ｆ（ｉ，：）和ｆ（ｊ，：）。１）ｍ＝０。２）Ｆｏｒｋ＝１：ｎ。３）若两个体的第ｋ位比特位相同则ｍ＝ｍ＋１。４）ＥｎｄＦｏｒ。５）计算个体间基因型相似比ｓ＝ｍ／ｎ。６）Ｉｆｓ＜Ｐｃｒｏｓｓ交叉概率。７）随机选定基因型个体的某一位Ｐｏｓｃｒｏｓｓ。８）Ｆｏｒｈ＝Ｐｏｓｃｒｏｓｓ：ｎ。９）交换个体Ｐｏｓｃｒｏｓｓ位到第ｎ位的基因。１０）ＥｎｄＦｏｒ。１１）ＥｎｄＩｆ。通过比特率交叉算子可以避免基因型相近的个体进行交叉操作，即可以避免产生“隐性致病基因”，防止相近个体的近亲繁殖，并增强种群个体的多样性。２．４ＧＡ⁃ＰＳＯ协同演化方法的实现本文提出的ＧＡ⁃ＰＳＯ算法的主要思想是比特位信息交互。传统的ＰＳＯ特征选择有一定的缺陷，比较容易陷入全局最优解并且过早收敛，进化过程中会将搜索引向本次迭代的全局和个体最佳位置，因此进化的多样性差。协同的思想对于ＰＳＯ特征选择方法的帮助在于，通过本文提出的最佳个体比特信息位交换策略，每次进化产生最佳个体的比特信息位不仅仅由ＰＳＯ决定，事实上它和ＧＡ中的最佳个体共享那些能够引起适应度值增加的优秀比特信息位。将这些优秀的比特基因随机地插入到粒子群中最佳个体对应的信息位上。这种方法不仅有可能使最佳个体变得更优秀，还为ＰＳＯ算法增加了多样性，避免过早地陷入局部最优解。对于ＧＡ特征选择方法来说，寻优速度较慢，尤其在高维特征下往往不能获得令人满意的结果。从信息共享机制来说，遗传算法的信息共享方式主要是通过两个个体之间的交叉操作，而粒子群算法的信息共享方式是通过种群中的最优个体传递信息给其余个体。这两种信息共享机制就相应地决定了两种算法的表现，粒子群算法每代都选出当前最优个体，并进行全局范围的信息共享，使得整个粒子群能向着最优的方向快速趋近；而遗传算法的交叉操作具有一定的随机性，且由于是一对一进行交叉，每一次迭代中作用的范围相对较小，使得种群中的优秀基因交流较慢，整个种群的进化比较漫长，所以ＰＳＯ特征选择寻优速度较快，效率更高。通过信息交互，在迭代过程中种群可以获得更为优秀的个体基因型，这有助于加速ＧＡ种群的进化过程，提高收敛速度。同时，通过上文的比特率交叉算子可以避免相近的基因型交叉产生不“健康” 的后代个体。具体的ＧＡ⁃ＰＳＯ协同演化算法如算法２和算法３所示。算法２协同演化算法输入粒子群和种群初始化参数。输出最佳个体。１）初始化粒子群和种群。２）协同演化。 ①计算各个粒子的适应度值。 ②选择粒子群算法最佳个体ＰＳＯｂｅｓｔ。 ③选出遗传算法最佳个体ＧＡｂｅｓｔ。 ④最佳个体比特信息位交换。 ⑤ＰＳＯ：更新粒子速度及位置。 ⑥ＧＡ：选择、比特率交叉（算法１）和变异。３）判断终止条件，若不满足返回２），满足进入４）。４）比较ＧＡｂｅｓｔ与ＰＳＯｂｅｓｔ，输出最佳个体。第１期滕旭阳，等：面向特征选择问题的协同演化方法 ·２７·

·28 智能系统学报第12卷算法3最佳个体比特信息位交换据的离散化处理采用经典的MDL方法。种群规模为输入上一代最佳个体和本轮最佳个体。 20,迭代次数为300。GA中交叉概率为0.6，变异概率输出交换比特信息位后的PSO及HSmo 为0.15；PS0中c1=c2=2,0=0.4。 1)随机选取PS0中引起最佳个体适应度值增 31算法分类准确率的结果分析加的信息位PSOpito 本文实验部分选用了UCI(UC Irvine machine 2)随机选取GA中引起最佳个体适应度值增 learning repository)数据库中的5个高维多类别数据加的信息位GAm。集，特征维度从14维升至240维，不同数据集中样 3)if PSO=优于GAt, 本的类别数目最少为2类，最多为10类。其中，将GAa中对应的信息位改为PSOm; Australian与Credit Approval为两个信用卡申请类数 else 据集，Dermatology为皮肤病数据集，Synthetic Control 将PSO中对应的信息位改为GA; 是名为合成控制图数据集，Multi-Feature Pixel是名 end 为Multi-feature“0”到“9”手写图数据集中的一个本文提出的GA-PS0协同演化算法，通过协同子集合。各数据集的详细信息如表1所示。共享的思想让PSO和GA互相弥补各自的弱点，互表1UCI数据集描述相协助从而产生更强的个体。对于本文面向的特 Table 1 Descriptions of UCI benchmark datasets 征选择问题，更好的个体可以从两个角度进行判数据集特征数样本数类别数 Australian 14 690 2 断：特征与类别相关性越高，个体适应度值越高：特 Credit Approval 15 690 征子集规模越小，个体适应度值越高。面向特征选 Dermatology 34 366 6 择问题的协同演化方法执行流程如图3所示。 Synthetic Control 60 600 6 Multi-Feature Pixel 240 2000 10 开始实验对比的特征选择算法有GA、PSO、IG以及随机初始化粒子群随机初始化种群 GR。为了验证算法性能，选取SVM、I-NN和Naive Bayes三个分类器，并且使用十折交叉验证的方法计算各粒子适应度值测试在不同数据集下各个算法所选择特征子集的计算各个个体适应度值分类。对于GA,PSO和GA-PS0三种进化搜索的方更新个体极值及群体极值法，实验得出每个算法连续运行20次时的平均分类准确率。而IG(information gain)信息增益和GR 最佳个体比特信息位交换策略 (gain ratio)增益比率都是以互信息为基础的经典的排序特征选择算法，因此在实验中分别对每个数据更新粒子速度和位置选择、交叉、变异集的特征进行排序，并且手动地选择与进化算法规模相近的排名前p个特征，P为选择的特征数量。达到最大具体的分类结果如表2~4所示。表2~4中数值表迭代次数示各特征选择算法选择的特征子集在相应的数据 TY 结束○ 集下使用分类器得到的分类准确率。Avg表示平均图3协同演化算法的流程图分类准确率，括号内数字为平均选择的子集规模。 Fig.3 Flow chart of co-evolution algorithm 从表2中可以看出，本文提出的方法在5个数据集上均取得了最好的结果，比如在Synthetic 3实验结果与分析 Control数据集中，在选出相近的特征子集下，提出的为了验证本文提出算法的有效性，实验结果从两方法的平均分类准确率比其他算法的平均分类准个方面进行分析：1)分析算法在不同数据集下分类的确率高出了平均2.98%。同样如表3和表4所示，准确率：2)提出的算法与GA和PSO进行适应度值和在1-NN和Naive Bayes分类器中，对于每个数据集本收敛性比较。本文实验特征选择部分的运行环境为文提出的方法的平均分类准确率都比其他的算法 MATLAB2014a,分类准确率运行环境为weka3.8。对数具有优势，在保证特征子集近似的情况下，能够得到较好的分类效果

算法３最佳个体比特信息位交换输入上一代最佳个体和本轮最佳个体。输出交换比特信息位后的ＰＳＯｂｅｓｔ及ＨＳｂｅｓｔ。１）随机选取ＰＳＯ中引起最佳个体适应度值增加的信息位ＰＳＯｂｉｔ。２）随机选取ＧＡ中引起最佳个体适应度值增加的信息位ＧＡｂｉｔ。３）ｉｆＰＳＯｂｅｓｔ优于ＧＡｂｅｓｔ，将ＧＡｂｅｓｔ中对应的信息位改为ＰＳＯｂｉｔ；ｅｌｓｅ将ＰＳＯｂｅｓｔ中对应的信息位改为ＧＡｂｉｔ；ｅｎｄ本文提出的ＧＡ⁃ＰＳＯ协同演化算法，通过协同共享的思想让ＰＳＯ和ＧＡ互相弥补各自的弱点，互相协助从而产生更强的个体。对于本文面向的特征选择问题，更好的个体可以从两个角度进行判断：特征与类别相关性越高，个体适应度值越高；特征子集规模越小，个体适应度值越高。面向特征选择问题的协同演化方法执行流程如图３所示。图３协同演化算法的流程图Ｆｉｇ．３Ｆｌｏｗｃｈａｒｔｏｆｃｏ⁃ｅｖｏｌｕｔｉｏｎａｌｇｏｒｉｔｈｍ３实验结果与分析为了验证本文提出算法的有效性，实验结果从两个方面进行分析：１）分析算法在不同数据集下分类的准确率；２）提出的算法与ＧＡ和ＰＳＯ进行适应度值和收敛性比较。本文实验特征选择部分的运行环境为ＭＡＴＬＡＢ２０１４ａ，分类准确率运行环境为ｗｅｋａ３．８。对数据的离散化处理采用经典的ＭＤＬ方法。种群规模为２０，迭代次数为３００。ＧＡ中交叉概率为０．６，变异概率为０．１５；ＰＳＯ中ｃ１＝ｃ２＝２，ｗ＝０．４。３．１算法分类准确率的结果分析本文实验部分选用了ＵＣＩ（ＵＣＩｒｖｉｎｅｍａｃｈｉｎｅｌｅａｒｎｉｎｇｒｅｐｏｓｉｔｏｒｙ）数据库中的５个高维多类别数据集，特征维度从１４维升至２４０维，不同数据集中样本的类别数目最少为２类，最多为１０类。其中，Ａｕｓｔｒａｌｉａｎ与ＣｒｅｄｉｔＡｐｐｒｏｖａｌ为两个信用卡申请类数据集，Ｄｅｒｍａｔｏｌｏｇｙ为皮肤病数据集，ＳｙｎｔｈｅｔｉｃＣｏｎｔｒｏｌ是名为合成控制图数据集，Ｍｕｌｔｉ⁃ＦｅａｔｕｒｅＰｉｘｅｌ是名为Ｍｕｌｔｉ⁃ｆｅａｔｕｒｅ “０”到“９” 手写图数据集中的一个子集合。各数据集的详细信息如表１所示。表１ＵＣＩ数据集描述Ｔａｂｌｅ１ＤｅｓｃｒｉｐｔｉｏｎｓｏｆＵＣＩｂｅｎｃｈｍａｒｋｄａｔａｓｅｔｓ数据集特征数样本数类别数Ａｕｓｔｒａｌｉａｎ１４６９０２ＣｒｅｄｉｔＡｐｐｒｏｖａｌ１５６９０２Ｄｅｒｍａｔｏｌｏｇｙ３４３６６６ＳｙｎｔｈｅｔｉｃＣｏｎｔｒｏｌ６０６００６Ｍｕｌｔｉ⁃ＦｅａｔｕｒｅＰｉｘｅｌ２４０２０００１０实验对比的特征选择算法有ＧＡ、ＰＳＯ、ＩＧ以及ＧＲ。为了验证算法性能，选取ＳＶＭ、１⁃ＮＮ和ＮａïｖｅＢａｙｅｓ三个分类器，并且使用十折交叉验证的方法测试在不同数据集下各个算法所选择特征子集的分类。对于ＧＡ，ＰＳＯ和ＧＡ⁃ＰＳＯ三种进化搜索的方法，实验得出每个算法连续运行２０次时的平均分类准确率。而ＩＧ（ｉｎｆｏｒｍａｔｉｏｎｇａｉｎ）信息增益和ＧＲ（ｇａｉｎｒａｔｉｏ）增益比率都是以互信息为基础的经典的排序特征选择算法，因此在实验中分别对每个数据集的特征进行排序，并且手动地选择与进化算法规模相近的排名前ｐ个特征，ｐ为选择的特征数量。具体的分类结果如表２～４所示。表２～４中数值表示各特征选择算法选择的特征子集在相应的数据集下使用分类器得到的分类准确率。Ａｖｇ表示平均分类准确率，括号内数字为平均选择的子集规模。从表２中可以看出，本文提出的方法在５个数据集上均取得了最好的结果，比如在ＳｙｎｔｈｅｔｉｃＣｏｎｔｒｏｌ数据集中，在选出相近的特征子集下，提出的方法的平均分类准确率比其他算法的平均分类准确率高出了平均２．９８％。同样如表３和表４所示，在１⁃ＮＮ和ＮａïｖｅＢａｙｅｓ分类器中，对于每个数据集本文提出的方法的平均分类准确率都比其他的算法具有优势，在保证特征子集近似的情况下，能够得到较好的分类效果。 ·２８· 智能系统学报第１２卷

第1期滕旭阳，等：面向特征选择问题的协同演化方法 .29. 表21-NN分类器的分类准确率 Table 2 The comparison of classification accuracy with 1-NN classifiers % 数据集 GA PSO IG GR GA-PSO Australian 85.51(3) 85.51(3) 83.33(4) 83.33(4) 86.33(5) Credit Approval 83.91(6) 83.91(6) 80.87(6) 79.57(6) 86.51(5) Dermatology 82.67(14) 83.30(15) 83.06(15) 83.61(15) 89.54(15) Synthetic Control 87.22(26) 86.11(25) 88.67(26) 89.83(26) 90.95(26) Multi-Feature Pixel 89.84(45) 88.09(37) 82.80(45) 81.55(45) 90.93(49) Avg 85.83 85.38 83.75 83.58 88.85 表3SVM分类器的分类准确率 Table 3 The comparison of classification accuracy with SVM classifiers 会数据集 GA PSO IG GR GA-PSO Australian 85.51(3) 85.51(3) 85.51(4) 85.51(4) 85.85(5) Credit Approval 85.51(6) 85.51(6) 85.51(6) 85.51(6) 85.65(5) Dermatology 81.87(14) 83.30(15) 84.97(15) 85.52(15) 92.22(15) Synthetic Control 91.02(26) 91.03(25) 81.67(26) 89.50(26) 94.19(26) Multi-Feature Pixel 93.69(45) 92.15(37) 87.15(45) 82.25(45) 94.40(49) Avg 87.52 87.50 84.96 85.66 90.46 表4 Naive Bayes分类器的分类准确率 Table 4 The comparison of classification accuracy with Naive Bayes classifiers % 数据集 GA PSO IG GR GA-PSO Australian 80.72(3) 83.11(3) 74.93(4) 74.93(4) 86.27(5) Credit Approval 84.93(6) 84.93(6) 76.38(6) 74.63(6) 85.30(5) Dermatology 83.61(14) 85.79(15) 86.89(15) 85.52(15) 92.30(15) Synthetic Control 85.14(26) 83.34(25) 78.33(26) 79.33(26) 94.19(26) Multi-Feature Pixel 88.40(45) 87.01(37) 79.95(45) 78.65(45) 89.87(49) Avg 84.56 84.84 79.29 78.61 89.59 综合GA-PSO在SVM、KNN和Naive Bayes三留。适应度值高的个体的基因型对种群的进化方个分类器下的表现，本实验结果验证了GA-PS0算向起着指导作用。因此对于不同的演化方法，另一法在不同规模数据集下分类性能的有效性，从分类个评定的角度是在同一个适应度函数作用下比较准确率的角度评定本文提出的GA-PSO算法优于传哪种算法能够得到更高的适应度值的个体。为了统的GA和PSO进化算法，也优于经典的特征选择分析比较提出算法在进化过程中适应度值的变化排序算法，平均分类精度有明显提升。情况，分别画出了GA-PSO、GA和PS0算法在 3.2算法适应度值的分析 Synthetic Control,Dermatology Multi-Feature Pixel 在进化算法中，对于求最大化的目标函数而数据集下单次迭代过程中适应度函数值的折线图：言，适应度值高的个体能够在最大的程度上得到保如图4~6所示

表２１⁃ＮＮ分类器的分类准确率Ｔａｂｌｅ２Ｔｈｅｃｏｍｐａｒｉｓｏｎｏｆｃｌａｓｓｉｆｉｃａｔｉｏｎａｃｃｕｒａｃｙｗｉｔｈ１⁃ＮＮｃｌａｓｓｉｆｉｅｒｓ％数据集ＧＡＰＳＯＩＧＧＲＧＡ⁃ＰＳＯＡｕｓｔｒａｌｉａｎ８５．５１（３）８５．５１（３）８３．３３（４）８３．３３（４）８６．３３（５）ＣｒｅｄｉｔＡｐｐｒｏｖａｌ８３．９１（６）８３．９１（６）８０．８７（６）７９．５７（６）８６．５１（５）Ｄｅｒｍａｔｏｌｏｇｙ８２．６７（１４）８３．３０（１５）８３．０６（１５）８３．６１（１５）８９．５４（１５）ＳｙｎｔｈｅｔｉｃＣｏｎｔｒｏｌ８７．２２（２６）８６．１１（２５）８８．６７（２６）８９．８３（２６）９０．９５（２６）Ｍｕｌｔｉ⁃ＦｅａｔｕｒｅＰｉｘｅｌ８９．８４（４５）８８．０９（３７）８２．８０（４５）８１．５５（４５）９０．９３（４９）Ａｖｇ８５．８３８５．３８８３．７５８３．５８８８．８５表３ＳＶＭ分类器的分类准确率Ｔａｂｌｅ３ＴｈｅｃｏｍｐａｒｉｓｏｎｏｆｃｌａｓｓｉｆｉｃａｔｉｏｎａｃｃｕｒａｃｙｗｉｔｈＳＶＭｃｌａｓｓｉｆｉｅｒｓ％数据集ＧＡＰＳＯＩＧＧＲＧＡ⁃ＰＳＯＡｕｓｔｒａｌｉａｎ８５．５１（３）８５．５１（３）８５．５１（４）８５．５１（４）８５．８５（５）ＣｒｅｄｉｔＡｐｐｒｏｖａｌ８５．５１（６）８５．５１（６）８５．５１（６）８５．５１（６）８５．６５（５）Ｄｅｒｍａｔｏｌｏｇｙ８１．８７（１４）８３．３０（１５）８４．９７（１５）８５．５２（１５）９２．２２（１５）ＳｙｎｔｈｅｔｉｃＣｏｎｔｒｏｌ９１．０２（２６）９１．０３（２５）８１．６７（２６）８９．５０（２６）９４．１９（２６）Ｍｕｌｔｉ⁃ＦｅａｔｕｒｅＰｉｘｅｌ９３．６９（４５）９２．１５（３７）８７．１５（４５）８２．２５（４５）９４．４０（４９）Ａｖｇ８７．５２８７．５０８４．９６８５．６６９０．４６表４ＮａïｖｅＢａｙｅｓ分类器的分类准确率Ｔａｂｌｅ４ＴｈｅｃｏｍｐａｒｉｓｏｎｏｆｃｌａｓｓｉｆｉｃａｔｉｏｎａｃｃｕｒａｃｙｗｉｔｈＮａïｖｅＢａｙｅｓｃｌａｓｓｉｆｉｅｒｓ％数据集ＧＡＰＳＯＩＧＧＲＧＡ⁃ＰＳＯＡｕｓｔｒａｌｉａｎ８０．７２（３）８３．１１（３）７４．９３（４）７４．９３（４）８６．２７（５）ＣｒｅｄｉｔＡｐｐｒｏｖａｌ８４．９３（６）８４．９３（６）７６．３８（６）７４．６３（６）８５．３０（５）Ｄｅｒｍａｔｏｌｏｇｙ８３．６１（１４）８５．７９（１５）８６．８９（１５）８５．５２（１５）９２．３０（１５）ＳｙｎｔｈｅｔｉｃＣｏｎｔｒｏｌ８５．１４（２６）８３．３４（２５）７８．３３（２６）７９．３３（２６）９４．１９（２６）Ｍｕｌｔｉ⁃ＦｅａｔｕｒｅＰｉｘｅｌ８８．４０（４５）８７．０１（３７）７９．９５（４５）７８．６５（４５）８９．８７（４９）Ａｖｇ８４．５６８４．８４７９．２９７８．６１８９．５９综合ＧＡ⁃ＰＳＯ在ＳＶＭ、ＫＮＮ和ＮａïｖｅＢａｙｅｓ三个分类器下的表现，本实验结果验证了ＧＡ⁃ＰＳＯ算法在不同规模数据集下分类性能的有效性，从分类准确率的角度评定本文提出的ＧＡ⁃ＰＳＯ算法优于传统的ＧＡ和ＰＳＯ进化算法，也优于经典的特征选择排序算法，平均分类精度有明显提升。３．２算法适应度值的分析在进化算法中，对于求最大化的目标函数而言，适应度值高的个体能够在最大的程度上得到保留。适应度值高的个体的基因型对种群的进化方向起着指导作用。因此对于不同的演化方法，另一个评定的角度是在同一个适应度函数作用下比较哪种算法能够得到更高的适应度值的个体。为了分析比较提出算法在进化过程中适应度值的变化情况，分别画出了ＧＡ⁃ＰＳＯ、ＧＡ和ＰＳＯ算法在ＳｙｎｔｈｅｔｉｃＣｏｎｔｒｏｌ、Ｄｅｒｍａｔｏｌｏｇｙ和Ｍｕｌｔｉ⁃ＦｅａｔｕｒｅＰｉｘｅｌ数据集下单次迭代过程中适应度函数值的折线图，如图４～６所示。第１期滕旭阳，等：面向特征选择问题的协同演化方法 ·２９·

·30 智能系统学报第12卷 PSO 解，尤其对于高维特征数目的数据集，PS0不能保 4.0 证良好的全局搜索：GA的全局搜索能力要优于 3.0 GA PSO:GA-PSO则一直保持着良好的搜索能力，尤其 GA-PSO 在大规模数据集中，GA-PSO的表现更为突出，在 2.0 15 300代以内，适应度值一直保持着提升，能够有效地 1.0 避免陷入全局最优解。 0.5 综上所述，本文所提出的算法在进化过程中能 0 50100 200250300 够产生比较优秀的个体，获得比较高的适应度值，从而可以取得更好的分类准确率。这证明了，GA 图4 Dermatology数据集中的对比 PS0算法在进化过程中逐步寻优的能力，能够找出 Fig.4 Comparison on Dermatology 相对优秀的特征子集。 14 GA-PSO PSO 4结束语 12 10 本文提出了面向特征选择问题的协同演化算法GA-PSO。为了保证种群多样性，提出了一种基 6 于比特率的交叉算子。针对GA和PS0寻优的不同特点进行共同演化，并将影响最佳个体形成的比特基因位作为公共信息实现共享。通过实验对比验 50 100150200250300 代数证了协同演化的方法要优于单一进化的方法，并且验证了全局搜索的特征选择方法优于传统的贪婪图5 Synthetic Control数据集中的对比式特征选择方法。本文的研究不仅可以有效地解 Fig.5 Comparison on Synthetic Control 决特征选择问题，在其他的组合优化离散问题中也 1.4 可以使用该思路进行协同演化。未来将进一步研 1.2 PSO 1.0 究子集规模的自适应控制以及其他适应度评价 08 方法。 GA GA-PSO 0.6 0.4 参考文献： [1]DASH M,LIU H.Feature selection for classification [J]. 50100150200250300 Intelligent data analysis,1997,1(1/2/3/4):131-156. 代数 [2]GUYON I,ELISSEEFF A.An introduction to variable and 图6 Multi.-Feature Pixel数据集中的对比 feature selection [J].The journal of machine learning Fig.6 Comparison on Multi-Feature Pixel research,2002,3(6):1157-1182 [3]ZHAO Zheng,MORSTATTER F,SHARMA S,et al.Advancing 对适应度值的分析：通过图4可以看出，在0~ feature selection research.ASU feature selection repository[R]. 150代GA-PS0保持着GA近似水平的适应度值， Phoenix:School of Computing,Informatics,and Decision PS0的适应度值稍高，在150代以后GA-PS0和GA Systems Engineering,Arizona State University,Tempe,2010. 适应度值逐步提升，超过PSO,最终GA-PSO得到最 [4]BATTITI R.Using mutual information for selecting features 高的适应度值：在图5中，在240代后GA-PS0超过 in supervised neural net learning[J].IEEE transactions on GA和PSO,最终GA-PSO取得最高的适应度值：在 neural networks,1994,5(4):537-550 图6的超高维数据集中，GA-PSO的寻优优势更加 [5]YANG Yiming,PEDEREN J O.A comparative study on 明显。GA-PSO比传统的进化算法PSO和GA具有 feature selection in text categorization[C]//Proceedings of the 14th International Conference on Machine Learning.San 更强的搜索能力，在相同条件下总是能保持进化以 Francisco,CA,USA 1997:412-420. 找到更优的个体。 [6]周志华.机器学习[M].北京：清华大学出版社，2016：对收敛性的分析：随着特征规模的增大，PSO 247-266. 总是过早收敛，这说明P$0算法容易陷入局部最优 [7]XUE Bing,ZHANG Mengjie,BROWNE W N,et al

图４Ｄｅｒｍａｔｏｌｏｇｙ数据集中的对比Ｆｉｇ．４ＣｏｍｐａｒｉｓｏｎｏｎＤｅｒｍａｔｏｌｏｇｙ图５ＳｙｎｔｈｅｔｉｃＣｏｎｔｒｏｌ数据集中的对比Ｆｉｇ．５ＣｏｍｐａｒｉｓｏｎｏｎＳｙｎｔｈｅｔｉｃＣｏｎｔｒｏｌ图６Ｍｕｌｔｉ⁃ＦｅａｔｕｒｅＰｉｘｅｌ数据集中的对比Ｆｉｇ．６ＣｏｍｐａｒｉｓｏｎｏｎＭｕｌｔｉ⁃ＦｅａｔｕｒｅＰｉｘｅｌ对适应度值的分析：通过图４可以看出，在０～１５０代ＧＡ⁃ＰＳＯ保持着ＧＡ近似水平的适应度值，ＰＳＯ的适应度值稍高，在１５０代以后ＧＡ⁃ＰＳＯ和ＧＡ适应度值逐步提升，超过ＰＳＯ，最终ＧＡ⁃ＰＳＯ得到最高的适应度值；在图５中，在２４０代后ＧＡ⁃ＰＳＯ超过ＧＡ和ＰＳＯ，最终ＧＡ⁃ＰＳＯ取得最高的适应度值；在图６的超高维数据集中，ＧＡ⁃ＰＳＯ的寻优优势更加明显。ＧＡ⁃ＰＳＯ比传统的进化算法ＰＳＯ和ＧＡ具有更强的搜索能力，在相同条件下总是能保持进化以找到更优的个体。对收敛性的分析：随着特征规模的增大，ＰＳＯ总是过早收敛，这说明ＰＳＯ算法容易陷入局部最优解，尤其对于高维特征数目的数据集，ＰＳＯ不能保证良好的全局搜索；ＧＡ的全局搜索能力要优于ＰＳＯ；ＧＡ⁃ＰＳＯ则一直保持着良好的搜索能力，尤其在大规模数据集中，ＧＡ⁃ＰＳＯ的表现更为突出，在３００代以内，适应度值一直保持着提升，能够有效地避免陷入全局最优解。综上所述，本文所提出的算法在进化过程中能够产生比较优秀的个体，获得比较高的适应度值，从而可以取得更好的分类准确率。这证明了，ＧＡ⁃ ＰＳＯ算法在进化过程中逐步寻优的能力，能够找出相对优秀的特征子集。４结束语本文提出了面向特征选择问题的协同演化算法ＧＡ⁃ＰＳＯ。为了保证种群多样性，提出了一种基于比特率的交叉算子。针对ＧＡ和ＰＳＯ寻优的不同特点进行共同演化，并将影响最佳个体形成的比特基因位作为公共信息实现共享。通过实验对比验证了协同演化的方法要优于单一进化的方法，并且验证了全局搜索的特征选择方法优于传统的贪婪式特征选择方法。本文的研究不仅可以有效地解决特征选择问题，在其他的组合优化离散问题中也可以使用该思路进行协同演化。未来将进一步研究子集规模的自适应控制以及其他适应度评价方法。参考文献：［１］ＤＡＳＨＭ，ＬＩＵＨ．Ｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｆｏｒｃｌａｓｓｉｆｉｃａｔｉｏｎ［Ｊ］．Ｉｎｔｅｌｌｉｇｅｎｔｄａｔａａｎａｌｙｓｉｓ，１９９７，１（１／２／３／４）：１３１－１５６．［２］ＧＵＹＯＮＩ，ＥＬＩＳＳＥＥＦＦＡ．Ａｎｉｎｔｒｏｄｕｃｔｉｏｎｔｏｖａｒｉａｂｌｅａｎｄｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎ［Ｊ］．Ｔｈｅｊｏｕｒｎａｌｏｆｍａｃｈｉｎｅｌｅａｒｎｉｎｇｒｅｓｅａｒｃｈ，２００２，３（６）：１１５７－１１８２．［３］ＺＨＡＯＺｈｅｎｇ，ＭＯＲＳＴＡＴＴＥＲＦ，ＳＨＡＲＭＡＳ，ｅｔａｌ．Ａｄｖａｎｃｉｎｇｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｒｅｓｅａｒｃｈ．ＡＳＵｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｒｅｐｏｓｉｔｏｒｙ［Ｒ］．Ｐｈｏｅｎｉｘ：ＳｃｈｏｏｌｏｆＣｏｍｐｕｔｉｎｇ，Ｉｎｆｏｒｍａｔｉｃｓ，ａｎｄＤｅｃｉｓｉｏｎＳｙｓｔｅｍｓＥｎｇｉｎｅｅｒｉｎｇ，ＡｒｉｚｏｎａＳｔａｔｅＵｎｉｖｅｒｓｉｔｙ，Ｔｅｍｐｅ，２０１０．［４］ＢＡＴＴＩＴＩＲ．Ｕｓｉｎｇｍｕｔｕａｌｉｎｆｏｒｍａｔｉｏｎｆｏｒｓｅｌｅｃｔｉｎｇｆｅａｔｕｒｅｓｉｎｓｕｐｅｒｖｉｓｅｄｎｅｕｒａｌｎｅｔｌｅａｒｎｉｎｇ［Ｊ］．ＩＥＥＥｔｒａｎｓａｃｔｉｏｎｓｏｎｎｅｕｒａｌｎｅｔｗｏｒｋｓ，１９９４，５（４）：５３７－５５０．［５］ＹＡＮＧＹｉｍｉｎｇ，ＰＥＤＥＲＥＮＪＯ．Ａｃｏｍｐａｒａｔｉｖｅｓｔｕｄｙｏｎｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｉｎｔｅｘｔｃａｔｅｇｏｒｉｚａｔｉｏｎ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ１４ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＭａｃｈｉｎｅＬｅａｒｎｉｎｇ．ＳａｎＦｒａｎｃｉｓｃｏ，ＣＡ，ＵＳＡ１９９７：４１２－４２０．［６］周志华．机器学习［Ｍ］．北京：清华大学出版社，２０１６：２４７－２６６．［７］ＸＵＥＢｉｎｇ，ＺＨＡＮＧＭｅｎｇｊｉｅ，ＢＲＯＷＮＥＷＮ，ｅｔａｌ． ·３０· 智能系统学报第１２卷

第1期膝旭阳，等：面向特征选择问题的协同演化方法 ·31 A survey on evolutionary computation approaches to feature [14]KENNEDY J,EBERHART R.A discrete binary version of selection J ]IEEE transactions on evolutionary the particle swarm algorithm [C]//Proceedings of 1997 computation,2016,20(4):606-626. IEEE International Systems,Man,and Cybernetics.Orlando, [8]PENG Hanchuan,LONG Fuhui,DING C.Feature selection USA,1997:4104-4108. based on mutual information criteria of max-dependency, [15]李书全，孙雪，孙德辉，等.遗传算法中的交叉算子的 max-relevance,and min-redundancy[J].IEEE transactions 述评[J].计算机工程与应用.2012,48(1)：36-39. on pattern analysis and machine intelligence,2005,27 LI Shuquan,SUN Xue,SUN Dehui,et al.Summary of (8):1226-1238. crossover operator of genetic algorithm [J].Computer [9]UNLER A,MURAT A,CHINNAM R B.Mr2PSO:a engineering and applications,2012,48(1):36-39. maximum relevance minimum redundancy feature selection 作者简介： method based on swarm intelligence for support vector 滕旭阳，男，1987年生，博士研究 machine classification [J].Information sciences,2011, 生，主要研究方向为机器学习、智能优 181(20):4625-4641. 化算法。 [10]CERVANTE L,XUE Bing,ZHANG Mengjie,et al. Binary particle swarm optimisation for feature selection:a filter based approach [C]//Proceedings of 2012 IEEE Congress on Evolutionary Computation.Piscataway.Brisbane, Australia,2012:1-8. 董红斌，男.1963年生，教授.博士 [11]DONG Hongbin,TENG Xuyang,ZHOU Yang,et al.Feature 生导师，主要研究方向为多智能体系 subset selection using dynamic mixed strategy [C]/ 统、机器学习。 Proceedings of 2015 IEEE Congress on Evolutionary Computation.Sendai,Japan,2015:672-679. [12]NEMATI S.BASIRI M E.GHASEM-AGHAEE N.et al. A novel ACO-GA hybrid algorithm for feature selection in protein function prediction [J].Expert systems with 孙静，女，1993年生，硕士研究生， applications,2009,36(10):12086-12094. 主要研究方向为机器学习、数据挖掘。 [13]KENNEDY J,EBERHART R.Particle swarm optimization [C]//Proceedings of 1995 IEEE International Conference on Neural Networks.Perth,Australia,1995:1942-1948

Ａｓｕｒｖｅｙｏｎｅｖｏｌｕｔｉｏｎａｒｙｃｏｍｐｕｔａｔｉｏｎａｐｐｒｏａｃｈｅｓｔｏｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎ［Ｊ］．ＩＥＥＥｔｒａｎｓａｃｔｉｏｎｓｏｎｅｖｏｌｕｔｉｏｎａｒｙｃｏｍｐｕｔａｔｉｏｎ，２０１６，２０（４）：６０６－６２６．［８］ＰＥＮＧＨａｎｃｈｕａｎ，ＬＯＮＧＦｕｈｕｉ，ＤＩＮＧＣ．Ｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｂａｓｅｄｏｎｍｕｔｕａｌｉｎｆｏｒｍａｔｉｏｎｃｒｉｔｅｒｉａｏｆｍａｘ⁃ｄｅｐｅｎｄｅｎｃｙ，ｍａｘ⁃ｒｅｌｅｖａｎｃｅ，ａｎｄｍｉｎ－ｒｅｄｕｎｄａｎｃｙ［Ｊ］．ＩＥＥＥｔｒａｎｓａｃｔｉｏｎｓｏｎｐａｔｔｅｒｎａｎａｌｙｓｉｓａｎｄｍａｃｈｉｎｅｉｎｔｅｌｌｉｇｅｎｃｅ，２００５，２７（８）：１２２６－１２３８．［９］ＵＮＬＥＲＡ，ＭＵＲＡＴＡ，ＣＨＩＮＮＡＭＲＢ．Ｍｒ２ＰＳＯ：ａｍａｘｉｍｕｍｒｅｌｅｖａｎｃｅｍｉｎｉｍｕｍｒｅｄｕｎｄａｎｃｙｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｍｅｔｈｏｄｂａｓｅｄｏｎｓｗａｒｍｉｎｔｅｌｌｉｇｅｎｃｅｆｏｒｓｕｐｐｏｒｔｖｅｃｔｏｒｍａｃｈｉｎｅｃｌａｓｓｉｆｉｃａｔｉｏｎ［Ｊ］．Ｉｎｆｏｒｍａｔｉｏｎｓｃｉｅｎｃｅｓ，２０１１，１８１（２０）：４６２５－４６４１．［１０］ＣＥＲＶＡＮＴＥＬ，ＸＵＥＢｉｎｇ，ＺＨＡＮＧＭｅｎｇｊｉｅ，ｅｔａｌ．Ｂｉｎａｒｙｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｓａｔｉｏｎｆｏｒｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎ：ａｆｉｌｔｅｒｂａｓｅｄａｐｐｒｏａｃｈ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆ２０１２ＩＥＥＥＣｏｎｇｒｅｓｓｏｎＥｖｏｌｕｔｉｏｎａｒｙＣｏｍｐｕｔａｔｉｏｎ．Ｐｉｓｃａｔａｗａｙ．Ｂｒｉｓｂａｎｅ，Ａｕｓｔｒａｌｉａ，２０１２：１－８．［１１］ＤＯＮＧＨｏｎｇｂｉｎ，ＴＥＮＧＸｕｙａｎｇ，ＺＨＯＵＹａｎｇ，ｅｔａｌ．Ｆｅａｔｕｒｅｓｕｂｓｅｔｓｅｌｅｃｔｉｏｎｕｓｉｎｇｄｙｎａｍｉｃｍｉｘｅｄｓｔｒａｔｅｇｙ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆ２０１５ＩＥＥＥＣｏｎｇｒｅｓｓｏｎＥｖｏｌｕｔｉｏｎａｒｙＣｏｍｐｕｔａｔｉｏｎ．Ｓｅｎｄａｉ，Ｊａｐａｎ，２０１５：６７２－６７９．［１２］ＮＥＭＡＴＩＳ，ＢＡＳＩＲＩＭＥ，ＧＨＡＳＥＭ⁃ＡＧＨＡＥＥＮ，ｅｔａｌ．ＡｎｏｖｅｌＡＣＯ⁃ＧＡｈｙｂｒｉｄａｌｇｏｒｉｔｈｍｆｏｒｆｅａｔｕｒｅｓｅｌｅｃｔｉｏｎｉｎｐｒｏｔｅｉｎｆｕｎｃｔｉｏｎｐｒｅｄｉｃｔｉｏｎ［Ｊ］．Ｅｘｐｅｒｔｓｙｓｔｅｍｓｗｉｔｈａｐｐｌｉｃａｔｉｏｎｓ，２００９，３６（１０）：１２０８６－１２０９４．［１３］ＫＥＮＮＥＤＹＪ，ＥＢＥＲＨＡＲＴＲ．Ｐａｒｔｉｃｌｅｓｗａｒｍｏｐｔｉｍｉｚａｔｉｏｎ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆ１９９５ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＮｅｕｒａｌＮｅｔｗｏｒｋｓ．Ｐｅｒｔｈ，Ａｕｓｔｒａｌｉａ，１９９５：１９４２－１９４８．［１４］ＫＥＮＮＥＤＹＪ，ＥＢＥＲＨＡＲＴＲ．Ａｄｉｓｃｒｅｔｅｂｉｎａｒｙｖｅｒｓｉｏｎｏｆｔｈｅｐａｒｔｉｃｌｅｓｗａｒｍａｌｇｏｒｉｔｈｍ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆ１９９７ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＳｙｓｔｅｍｓ，Ｍａｎ，ａｎｄＣｙｂｅｒｎｅｔｉｃｓ．Ｏｒｌａｎｄｏ，ＵＳＡ，１９９７：４１０４－４１０８．［１５］李书全，孙雪，孙德辉，等．遗传算法中的交叉算子的述评［Ｊ］．计算机工程与应用，２０１２，４８（１）：３６－３９．ＬＩＳｈｕｑｕａｎ，ＳＵＮＸｕｅ，ＳＵＮＤｅｈｕｉ，ｅｔａｌ．Ｓｕｍｍａｒｙｏｆｃｒｏｓｓｏｖｅｒｏｐｅｒａｔｏｒｏｆｇｅｎｅｔｉｃａｌｇｏｒｉｔｈｍ［Ｊ］．Ｃｏｍｐｕｔｅｒｅｎｇｉｎｅｅｒｉｎｇａｎｄａｐｐｌｉｃａｔｉｏｎｓ，２０１２，４８（１）：３６－３９．作者简介：滕旭阳，男，１９８７年生，博士研究生，主要研究方向为机器学习、智能优化算法。董红斌，男，１９６３年生，教授，博士生导师，主要研究方向为多智能体系统、机器学习。孙静，女，１９９３年生，硕士研究生，主要研究方向为机器学习、数据挖掘。第１期滕旭阳，等：面向特征选择问题的协同演化方法 ·３１·

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录