遗忘遗传算法及其在信用评分中的应用

为解决局部最优问题,将遗忘机制引入传统遗传算法中,提出了一种改进的遗忘遗传算法,给出了一种遗忘算子及其遗忘概率,通过在遗传过程中遗忘某些基因,增加了算法的搜索空间,使算法跳出局部最优,从而最大限度地避免早熟收敛.将该算法用于不同欠费率下的电信客户初始信用评分,找到信用权重的优化解,较好地解决了对高欠费率群体进行信用评分时,信用权重的适应值偏低的问题.实验结果表明所提算法有效可行.与标准遗传算法相比,本文所提算法可以获得更高质量的解.

团购合买资源类别：文库，文档格式：PDF，文档页数：5，文件大小：287.1KB

D0I:10.13374.issn1001-053x.2012.04.016 第34卷第4期北京科技大学学报 Vol.34 No.4 2012年4月 Journal of University of Science and Technology Beijing Apr.2012 遗忘遗传算法及其在信用评分中的应用张玉洁四孟祥武北京邮电大学智能通信软件与多媒体北京市重点实验室，北京100876 ☒通信作者，E-mail:zhangyj(@bupt.cdu.cm 摘要为解决局部最优问题，将遗忘机制引入传统遗传算法中，提出了一种改进的遗忘遗传算法，给出了一种遗忘算子及其遗忘概率，通过在遗传过程中遗忘某些基因，增加了算法的搜索空间，使算法跳出局部最优，从而最大限度地避免早熟收敛.将该算法用于不同欠费率下的电信客户初始信用评分，找到信用权重的优化解，较好地解决了对高欠费率群体进行信用评分时，信用权重的适应值偏低的问题.实验结果表明所提算法有效可行，与标准遗传算法相比，本文所提算法可以获得更高质量的解关键词遗传算法：遗忘因子：客户服务：信用评分分类号TP182 Genetic algorithm with forgetting and its application in initial credit scoring ZHANG Yu-jie☒，MENG Xiang-+u Beijing Key Laboratory of Intelligent Telecommunications Software and Multimedia,Beijing University of Posts and Telecommunications,Beijing 100876, China Corresponding author,E-mail:zhangyj@bupt.edu.cn ABSTRACT Based on the forgetting strategy,an improved genetic algorithm was proposed to solve the problem of local optimization, and a forgetting operator as well as its forgetting probability was given.For the search space was increased by forgetting some genes dur- ing the period of inheritance,the algorithm can break away from local optimization and avoid the premature convergence to the greatest extent.By using the algorithm to deal with the credit scoring of telecom customers for different arrears rates,the optimum solution of credit weights in the case of high rate of arrears was found,so it solves the problem that the fitness of credit weights is low for the credit scoring of telecom customers in high arrears rates.Experimental results demonstrate that the algorithm is effective and feasible.Com- pared with the standard genetic algorithm,the proposed algorithm can obtain better quality results. KEY WORDS genetic algorithms;forgetting factor:customer service:credit scoring 遗传算法是一种基于群体的进化算法，它不依数编码，混沌序列搜索产生初始种群.通过精英个赖于问题的具体领域，本身具有良好兼容性，被广泛体保留、粒子群优化策略和改进遗传算法三种策略应用于组合优化、机器学习、人工生命、自适应控制、共同作用产生种群新个体.文献4]提出二维浮点规划设计和图像处理等领域. 数变长度编码，采用知识启发策略初始化种群，以及但是，遗传算法存在未成熟收敛现象，针对这一自适应交叉和变异算子的改进遗传算法.文献5] 问题，研究者在种群生成、编码和遗传操作等环节中依据自适应交叉和变异概率变化情况划分种群，对探讨了许多解决对策.文献]采用聚类方法形成子种群单独遗传进化，在不同的进化时间间隔，或进多个子种群，并对所有聚类的代表元及未分类个体行个体移植，或进行个体的随机分配.文献[6]采用采用小生境的遗传机制.文献2]通过增加初始种十进制编码，对主种群、协同种群和精英种群三个种群间的海明距离、小生境技术、自适应杂交和变异算群进行免疫疫苗选择和更新操作；对主种群进行克子及种群迁移来维持种群多样性.文献B]采用实隆交叉、克隆环境演化、克隆直接变异和自适应探索收稿日期：201102一15 基金项目：国家自然科学基金资助项目(60872051)：中央高校基本科研业务费专项资金资助项目(2009RC0203);北京市教育委员会共建项目

第 34 卷第 4 期 2012 年 4 月北京科技大学学报 Journal of University of Science and Technology Beijing Vol． 34 No． 4 Apr． 2012 遗忘遗传算法及其在信用评分中的应用张玉洁孟祥武北京邮电大学智能通信软件与多媒体北京市重点实验室，北京 100876 通信作者，E-mail: zhangyj@ bupt． edu． cn 摘要为解决局部最优问题，将遗忘机制引入传统遗传算法中，提出了一种改进的遗忘遗传算法，给出了一种遗忘算子及其遗忘概率，通过在遗传过程中遗忘某些基因，增加了算法的搜索空间，使算法跳出局部最优，从而最大限度地避免早熟收敛．将该算法用于不同欠费率下的电信客户初始信用评分，找到信用权重的优化解，较好地解决了对高欠费率群体进行信用评分时，信用权重的适应值偏低的问题．实验结果表明所提算法有效可行．与标准遗传算法相比，本文所提算法可以获得更高质量的解．关键词遗传算法; 遗忘因子; 客户服务; 信用评分分类号 TP182 Genetic algorithm with forgetting and its application in initial credit scoring ZHANG Yu-jie ，MENG Xiang-wu Beijing Key Laboratory of Intelligent Telecommunications Software and Multimedia，Beijing University of Posts and Telecommunications，Beijing 100876， China Corresponding author，E-mail: zhangyj@ bupt． edu． cn ABSTRACT Based on the forgetting strategy，an improved genetic algorithm was proposed to solve the problem of local optimization， and a forgetting operator as well as its forgetting probability was given． For the search space was increased by forgetting some genes during the period of inheritance，the algorithm can break away from local optimization and avoid the premature convergence to the greatest extent． By using the algorithm to deal with the credit scoring of telecom customers for different arrears rates，the optimum solution of credit weights in the case of high rate of arrears was found，so it solves the problem that the fitness of credit weights is low for the credit scoring of telecom customers in high arrears rates． Experimental results demonstrate that the algorithm is effective and feasible． Compared with the standard genetic algorithm，the proposed algorithm can obtain better quality results． KEY WORDS genetic algorithms; forgetting factor; customer service; credit scoring 收稿日期: 2011--02--15 基金项目: 国家自然科学基金资助项目( 60872051) ; 中央高校基本科研业务费专项资金资助项目( 2009RC0203) ; 北京市教育委员会共建项目遗传算法是一种基于群体的进化算法，它不依赖于问题的具体领域，本身具有良好兼容性，被广泛应用于组合优化、机器学习、人工生命、自适应控制、规划设计和图像处理等领域．但是，遗传算法存在未成熟收敛现象，针对这一问题，研究者在种群生成、编码和遗传操作等环节中探讨了许多解决对策．文献［1］采用聚类方法形成多个子种群，并对所有聚类的代表元及未分类个体采用小生境的遗传机制．文献［2］通过增加初始种群间的海明距离、小生境技术、自适应杂交和变异算子及种群迁移来维持种群多样性．文献［3］采用实数编码，混沌序列搜索产生初始种群．通过精英个体保留、粒子群优化策略和改进遗传算法三种策略共同作用产生种群新个体．文献［4］提出二维浮点数变长度编码，采用知识启发策略初始化种群，以及自适应交叉和变异算子的改进遗传算法．文献［5］依据自适应交叉和变异概率变化情况划分种群，对子种群单独遗传进化，在不同的进化时间间隔，或进行个体移植，或进行个体的随机分配．文献［6］采用十进制编码，对主种群、协同种群和精英种群三个种群进行免疫疫苗选择和更新操作; 对主种群进行克隆交叉、克隆环境演化、克隆直接变异和自适应探索 DOI:10.13374/j.issn1001-053x.2012.04.016

·472 北京科技大学学报第34卷操作：对协同种群进行克隆变异、克隆倒位、遗传交收敛叉和变异操作以及不对称信息的交互操作；从主种遗忘遗传算法采用二进制编码，种群的迭代通群和协同种群中各取前10%的优质个体组成精英过选择、交叉、变异和遗忘操作来实现.其中，选择种群，进行交叉操作. 操作采用轮盘赌方式淘汰适应值低的个体：交叉操上述算法实现复杂，实际操作中会产生大量的作采用顺序配对单点交叉：变异采用的方法是首先计算开支.本文在传统遗传算法的基础上，引入记以变异概率计算基因变异数目，然后对群体中全部忆心理学中有关遗忘的基本原理，提出了一个基于个体顺序组成的一个整串随机挑选基因位，并对基遗忘机制的遗传算法，并用于求解信用评分问题，使因值进行取反操作：遗忘操作同变异操作类似，不同遗传算法的搜索寻优过程从局部最优中跳出来，继的是对基因值进行置零操作，遗忘可以是置0，或者续寻找全局最优解是置1，在本文中，为了方便理解，方便实验，统一为置0. 1遗忘遗传算法输入：客户样本数N:客户属性数M;进化代数； 1.1遗忘染色体个数numOfIndividual;基因数目numOfGene; 自从1885年德国的心理学家艾宾浩斯首次提交叉概率P。、变异概率Pm、遗忘概率P· 出遗忘曲线以来，对遗忘的研究成了心理学中最热输出：适应值最高的个体门的领域之一，其研究成果也被越来越多其他领域 Program GetOptimalWeightsUseFGA 的研究者所应用.1981年，Fortescue等首次提出随机初始化个体：时变遗忘因子辨识算法，并应用于时变系统的辨识计算个体适应值：和自适应控制：1998年，孟祥武等图提出一个基于 WHLE(未达到迭代次数) DO{ 遗忘进化规划的Hopfield网学习算法，克服了进化 Select()I/选择操作 Hopfield网学习的局限性，解决了神经网络进化学 Cross()/交叉操作习过程中的局部最小问题：2001年陈焕文等回将遗 Mutation()/变异操作忘引入值函数的激励学习，特别是SARSA(K)算 Forgetting()I/遗忘操作法，形成了一类适合于值函数激励学习的遗忘算法：张格伟等0将遗忘引入知识管理中，建立了符合遗 NumOf Forgetting numOfGene nu- 忘规律的记忆-遗忘数学模型：过晨雷等而提出一 mOfIndividual*P,;/确定遗忘的基因数量个能够模拟人的注意力转移并带有学习和遗忘的视随机确定遗忘基因位：觉记忆模型. 将对应的基因位置为0：一切信息都在以遗忘的方式同步退化，经过日 } 积月累，被不断重复和强化的重要信息才会被保留计算个体适应值：下来，受其启发，将遗忘引入传统遗传算法中，以提 ShowMaxSolution()://输出本轮适应值最高解的质量.本文的遗忘也是以一定的概率P对染高的个体色体上的基因位进行置零操作. } 1.2遗忘遗传算法描述 BestSolution();/输出适应值最高的个体为了预防早熟收敛，在有效基因未知的情况下，变异算子必须有能力保持同一基因位上等位基因的 2基于遗忘遗传算法的电信客户信用评分多样性.然而，文献2]证明了传统变异算子无法有效保持同一基因位上等位基因的多样性.此外， 2.1信用评分文献3]指出早熟收敛与种群多样性的下降有密信用评分最初作为金融风险管理工具之一，广切关系泛应用于银行信贷以及信贷其他领域，近些年其应本文提出的遗忘遗传算法是在遗传操作中增加用领域开始向电信等领域延伸.目前，研究信用评遗忘操作，作为变异操作的补充.通过在遗传过程分的主要方法有遗传算法、logistic回归、生存分析、中遗忘某些基因，来改变生物原有的遗传特性，获得神经网络、概率分析、判别分析、马尔可夫网络、贝叶新物种，从而调节种群的多样性，增加算法的搜索空斯决策模型、支持向量机和蚁群算法等4- 间，使算法跳出局部最优，从而最大限度地避免早熟文献几5]构建信用评分模型的主要思想是：首

北京科技大学学报第 34 卷操作; 对协同种群进行克隆变异、克隆倒位、遗传交叉和变异操作以及不对称信息的交互操作; 从主种群和协同种群中各取前 10% 的优质个体组成精英种群，进行交叉操作．上述算法实现复杂，实际操作中会产生大量的计算开支．本文在传统遗传算法的基础上，引入记忆心理学中有关遗忘的基本原理，提出了一个基于遗忘机制的遗传算法，并用于求解信用评分问题，使遗传算法的搜索寻优过程从局部最优中跳出来，继续寻找全局最优解． 1 遗忘遗传算法 1. 1 遗忘自从 1885 年德国的心理学家艾宾浩斯首次提出遗忘曲线以来，对遗忘的研究成了心理学中最热门的领域之一，其研究成果也被越来越多其他领域的研究者所应用． 1981 年，Fortescue 等［7］首次提出时变遗忘因子辨识算法，并应用于时变系统的辨识和自适应控制; 1998 年，孟祥武等［8］提出一个基于遗忘进化规划的 Hopfield 网学习算法，克服了进化 Hopfield 网学习的局限性，解决了神经网络进化学习过程中的局部最小问题; 2001 年陈焕文等［9］将遗忘引入值函数的激励学习，特别是 SARSA( K) 算法，形成了一类适合于值函数激励学习的遗忘算法; 张格伟等［10］将遗忘引入知识管理中，建立了符合遗忘规律的记忆--遗忘数学模型; 过晨雷等［11］提出一个能够模拟人的注意力转移并带有学习和遗忘的视觉记忆模型．一切信息都在以遗忘的方式同步退化，经过日积月累，被不断重复和强化的重要信息才会被保留下来，受其启发，将遗忘引入传统遗传算法中，以提高解的质量．本文的遗忘也是以一定的概率 pf对染色体上的基因位进行置零操作． 1. 2 遗忘遗传算法描述为了预防早熟收敛，在有效基因未知的情况下，变异算子必须有能力保持同一基因位上等位基因的多样性．然而，文献［12］证明了传统变异算子无法有效保持同一基因位上等位基因的多样性．此外，文献［13］指出早熟收敛与种群多样性的下降有密切关系．本文提出的遗忘遗传算法是在遗传操作中增加遗忘操作，作为变异操作的补充．通过在遗传过程中遗忘某些基因，来改变生物原有的遗传特性，获得新物种，从而调节种群的多样性，增加算法的搜索空间，使算法跳出局部最优，从而最大限度地避免早熟收敛．遗忘遗传算法采用二进制编码，种群的迭代通过选择、交叉、变异和遗忘操作来实现．其中，选择操作采用轮盘赌方式淘汰适应值低的个体; 交叉操作采用顺序配对单点交叉; 变异采用的方法是首先以变异概率计算基因变异数目，然后对群体中全部个体顺序组成的一个整串随机挑选基因位，并对基因值进行取反操作; 遗忘操作同变异操作类似，不同的是对基因值进行置零操作，遗忘可以是置 0，或者是置 1，在本文中，为了方便理解，方便实验，统一为置 0．输入: 客户样本数 N; 客户属性数 M; 进化代数; 染色体个数 numOfIndividual; 基因数目 numOfGene; 交叉概率 Pc、变异概率 Pm、遗忘概率 Pf ．输出: 适应值最高的个体． Program GetOptimalWeightsUseFGA { 随机初始化个体; 计算个体适应值; WHILE ( 未达到迭代次数) DO { Select( ) / /选择操作 Cross( ) / /交叉操作 Mutation( ) / /变异操作 Forgetting( ) / /遗忘操作 { NumOf Forgetting = numOfGene * numOfIndividual * Pf ; / /确定遗忘的基因数量随机确定遗忘基因位; 将对应的基因位置为 0; } 计算个体适应值; ShowMaxSolution( ) ; / /输出本轮适应值最高的个体 } BestSolution( ) ; / /输出适应值最高的个体 } 2 基于遗忘遗传算法的电信客户信用评分 2. 1 信用评分信用评分最初作为金融风险管理工具之一，广泛应用于银行信贷以及信贷其他领域，近些年其应用领域开始向电信等领域延伸．目前，研究信用评分的主要方法有遗传算法、logistic 回归、生存分析、神经网络、概率分析、判别分析、马尔可夫网络、贝叶斯决策模型、支持向量机和蚁群算法等［14--15］．文献［15］构建信用评分模型的主要思想是: 首 ·472·

第4期张玉洁等：遗忘遗传算法及其在信用评分中的应用 ·473 先抽取己有消费行为的客户数据，并对信用评价指本文将适应值最高的那组属性域信用权重分配标的属性域信用权重按照一定的约束规则进行预处称为最优解，对应的适应值称为最优适应值理：然后由初始信用分配算法得到属性域信用权重， 3实验结果与分析代入信用计算公式，计算客户初始信用度：最后利用评价函数对信用权重分配合理性进行评价，即计算算法采用JAVA语言实现，分别进行30次独立信用权重的适应值，并判断是否符合要求，如果符合运行.选取客户数N=1000,客户属性数L=4.其要求则输出信用权重分配值，程序终止，否则重新分中，样本数据的属性结构设计同文献15]. 配新的信用权重.如此循环，直到符合要求或循环实验1采用传统遗传算法.遗传算法参数设终止置为：染色体个数100，染色体基因数为54，交叉概然而，采用该模型并应用传统遗传算法进行信率0.8，变异概率为0.05.迭代次数为5000次的实用权重分配实验发现，对于欠费率在30%以上的高验结果如表2所示欠费率群体，得到解的适应值并不高.应用遗忘遗表2迭代5000次的遗传算法结果传算法求解高欠费群体的信用评分问题取得了较好 Table 2 Results of the genetic algorithm after 5000 iterations 的效果欠费率/%最优Ft 代数平均最优Ft平均代数 2.2基于遗忘遗传算法的信用评分 10 0.896 17 0.8960 641 将遗忘遗传算法用于文献5]的信用评分模 20 0.794 11 0.7940 % 型中，主要步骤描述如下. 30 0.725 73 0.7136 1762 首先进行群体初始化，包括：(1)系统随机生成 40 0.627 191 0.6243 1266 S个个体，每个个体由随机分配的信用权重构成的 50 0.535 393 0.5274 1897 十进制串组成：(2)将十进制串转换为S个二进制 60 0.472 4754 0.4557 2586 串，二进制串长L由属性域数目和属性域权重取值 70 0.443 3861 0.4054 2422 范围的最大值决定 80 0.534 832 0.4313 2497 然后，使用评价函数对个体进行评价，进行选择、交叉、突变和遗忘操作，得到新的群体，再利用评实验2仍采用传统遗传算法.参数设置同实价函数对个体进行评价，重复该过程，直到满足算法验1，迭代次数为500次的实验结果如表3所示终止条件.评价函数的伪代码如表1所示实验3采用遗忘遗传算法.参数设置同实验最后，将一组适应值最高的信用权重带入下式 1根据经验选择的，遗忘概率分别取0.020、0.025、计算出新客户的初始信用度： 0.030、0.035、0.040、0.050、0.080、0.100、0.150和 0.200.迭代次数为500次，从实验结果中选取部分 Init_Credit(i)= Weight(i,i） (1≤i≤N). 数据如表3所示. (1) 对比表2和表3的实验结果可看出：(1)当欠式中，Weight(i,j)为第i个客户第j个属性对应的属费率为10%、20%和40%时，由遗传算法得到的最性域信用权重，N为客户数，L为客户属性数. 优适应值没有变化，对于其他欠费率，最优适应值 (解的质量)随着迭代次数的增加而提高.(2)对于表1评价函数伪代码 Table 1 Pseudo code of the fitness function 欠费率30%和50%的情形，迭代500次，与遗传算法相比，遗忘遗传算法解的质量小幅提高.(3)当欠输入：属性域的信用权重分配值输出：适应值it 费率大于60%时，同样是500次迭代，遗忘遗传算 {… 法解的质量不仅远远高于遗传算法解的质量，而且将第i个客户的属性域信用权重代入式(1)，计算出该客还高于遗传算法5000次迭代解的质量.可见遗忘户的初始信用度：遗传算法的效果是明显的 if (Init_Credit(i)AVG_Init_Credit)and (Owe]=0) 算子，发生遗忘后，个体的适应值变化较大，与遗传 then Num Num +1: 算法相比较，相当于又部分重新开始进化，所以遗忘遗传算法的平均代数大多高于遗传算法的平均代 Fit(m)=NumN;/本次信用权重分配对应的适应值数.通过引入遗忘算子增强了算法的寻优能力，在

第 4 期张玉洁等: 遗忘遗传算法及其在信用评分中的应用先抽取已有消费行为的客户数据，并对信用评价指标的属性域信用权重按照一定的约束规则进行预处理; 然后由初始信用分配算法得到属性域信用权重，代入信用计算公式，计算客户初始信用度; 最后利用评价函数对信用权重分配合理性进行评价，即计算信用权重的适应值，并判断是否符合要求，如果符合要求则输出信用权重分配值，程序终止，否则重新分配新的信用权重．如此循环，直到符合要求或循环终止．然而，采用该模型并应用传统遗传算法进行信用权重分配实验发现，对于欠费率在 30% 以上的高欠费率群体，得到解的适应值并不高．应用遗忘遗传算法求解高欠费群体的信用评分问题取得了较好的效果． 2. 2 基于遗忘遗传算法的信用评分将遗忘遗传算法用于文献［15］的信用评分模型中，主要步骤描述如下．首先进行群体初始化，包括: ( 1) 系统随机生成 S 个个体，每个个体由随机分配的信用权重构成的十进制串组成; ( 2) 将十进制串转换为 S 个二进制串，二进制串长 L 由属性域数目和属性域权重取值范围的最大值决定．然后，使用评价函数对个体进行评价，进行选择、交叉、突变和遗忘操作，得到新的群体，再利用评价函数对个体进行评价，重复该过程，直到满足算法终止条件．评价函数的伪代码如表 1 所示．最后，将一组适应值最高的信用权重带入下式计算出新客户的初始信用度: Init_Credit( i) = ∑ L j = 1 Weight( i，j) ( 1≤i≤N) ． ( 1) 式中，Weight( i，j) 为第 i 个客户第 j 个属性对应的属性域信用权重，N 为客户数，L 为客户属性数．表 1 评价函数伪代码 Table 1 Pseudo code of the fitness function 输入: 属性域的信用权重分配值输出: 适应值 Fit { … 将第 i 个客户的属性域信用权重代入式( 1) ，计算出该客户的初始信用度; if ( Init_Credit( i) ＜ AVG_Init_Credit) and ( Owe［i］= 1) then Num = Num + 1; if ( Init_Credit( i) ＞ AVG_Init_Credit ) and ( Owe［i］= 0) then Num = Num + 1; } Fit( m) = Num/N; / /本次信用权重分配对应的适应值本文将适应值最高的那组属性域信用权重分配称为最优解，对应的适应值称为最优适应值． 3 实验结果与分析算法采用 JAVA 语言实现，分别进行 30 次独立运行．选取客户数 N = 1 000，客户属性数 L = 4．其中，样本数据的属性结构设计同文献［15］．实验 1 采用传统遗传算法．遗传算法参数设置为: 染色体个数 100，染色体基因数为 54，交叉概率 0. 8，变异概率为 0. 05．迭代次数为 5 000 次的实验结果如表 2 所示．表 2 迭代 5 000 次的遗传算法结果 Table 2 Results of the genetic algorithm after 5 000 iterations 欠费率/% 最优 Fit 代数平均最优 Fit 平均代数 10 0. 896 17 0. 896 0 641 20 0. 794 11 0. 794 0 50 30 0. 725 73 0. 713 6 1 762 40 0. 627 191 0. 624 3 1 266 50 0. 535 393 0. 527 4 1 897 60 0. 472 4 754 0. 455 7 2 586 70 0. 443 3 861 0. 405 4 2 422 80 0. 534 832 0. 431 3 2 497 实验 2 仍采用传统遗传算法．参数设置同实验 1，迭代次数为 500 次的实验结果如表 3 所示．实验 3 采用遗忘遗传算法．参数设置同实验 1 根据经验选择的，遗忘概率分别取 0. 020、0. 025、 0. 030、0. 035、0. 040、0. 050、0. 080、0. 100、0. 150 和 0. 200．迭代次数为 500 次，从实验结果中选取部分数据如表 3 所示．对比表 2 和表 3 的实验结果可看出: ( 1) 当欠费率为 10% 、20% 和 40% 时，由遗传算法得到的最优适应值没有变化，对于其他欠费率，最优适应值 ( 解的质量) 随着迭代次数的增加而提高． ( 2) 对于欠费率 30% 和 50% 的情形，迭代 500 次，与遗传算法相比，遗忘遗传算法解的质量小幅提高． ( 3) 当欠费率大于 60% 时，同样是 500 次迭代，遗忘遗传算法解的质量不仅远远高于遗传算法解的质量，而且还高于遗传算法 5 000 次迭代解的质量．可见遗忘遗传算法的效果是明显的．由上述分析可以得出: 遗忘遗传算法引入遗忘算子，发生遗忘后，个体的适应值变化较大，与遗传算法相比较，相当于又部分重新开始进化，所以遗忘遗传算法的平均代数大多高于遗传算法的平均代数．通过引入遗忘算子增强了算法的寻优能力，在 ·473·

·474 北京科技大学学报第34卷表3迭代500次的遗传算法与遗忘遗传算法结果比较 Table 3 Comparison of results between the genetic algorithm and the genetic algorithm with forgetting after 500 iterations 遗传算法遗忘遗传算法欠费率/% 最优Fit 代数平均最优it平均代数最优Fit 代数平均最优Fit 平均代数遗忘概率 6 0.896 105 0.8925 132 0.896 175 0.8914 234 0.020 市 0.794 5 0.7940 66 0.794 0.7902 187 0.040 30 0.709 16 0.7077 230 0.725 192 0.7028 237 0.035 40 0.627 必 0.6215 173 0.627 104 0.6210 228 0.040 50 0.529 131 0.5185 267 0.535 98 0.5159 223 0.025 0.460 217 0.4434 223 0.526 134 0.4332 266 0.100 0.436 159 0.3865 228 0.577 399 0.4328 256 0.080 80 0.460 49 0.3403 262 0.723 460 0.4399 275 0.050 不同的参数设置下，一般只需要较少的迭代次数就 gence.J Wuhan Univ Nat Sci,2001,47(1):33 可以获得更高质量的解.这说明遗忘遗传算法较好 (许明辉，高成修，于刚.一种克服遗传算法早熟的参数调整地解决了高欠费率下最优适应值偏低的问题，早熟及并行方法.武汉大学学报：理学版，2001,47(1)：33) [6]Xia H,Zhuang J,Wang L Z,et al.Environment-based synergic 情况得到明显改善， immune genetic algorithm.J Xian Jiaotong Univ,2009,43 4结论 (11):80 (夏虎，庄健，王立忠，等。一种考虑环境作用的协同免疫遗传本文引入遗忘机制改进了基于二进制编码的传算法.西安交通大学学报，2009,43(11)：80) 统遗传算法，并将改进的算法用于求解电信客户初 ] Fortescue TR,Kershenbaum LS,Ydstie B E.Implementation of 始信用评分问题.实验表明改进的遗传算法能显著 self-uning regulators with variable forgetting factors.Automatica, 1981,17(6):831 提高解的精度，有效防止算法早熟收敛，并且较好地 8] Meng X W,Cheng H.A learning algorithm of Hopfield neural net- 解决了采用传统遗传算法对高欠费率群体进行初始 work based on evolutionary programming with forgetting.Sof- 信用评分时算法的解不理想问题 wae,1998,9(2):151 (孟样武，程虎.基于遗忘进化规划的Hopfield网学习算法. 软件学报，1998,9(2)：151) 参考文献 [9] Chen H W,Xie LJ,Xie J P.A class of forgetting algorithms for [1]Li J H,Li M,Yuan L H.Clustering based pseudo-parallel genetic the value-based reinforcement leaming.Comput Res Dev,2001, 38(4):487 algorithms.Pattern Recognit Artif Intell,2009,22(2):188 (李军华，黎明，袁丽华.基于聚类的伪并行遗传算法.模式识 (陈焕文，谢丽娟，谢建平.一类值函数激励学习的遗忘算法别与人工智能，2009,22(2)：188) 计算机研究与发展，2001,38(4)：487) Liu XZ,Zhou M.Improved adaptive genetic algorithm and its ap- [10]Zhang G W,Liao W H,Liu C Y,et al.Memorizing-forgetting plication to backward analysis of geotechnical engineering.J featured knowledge management and optimizing model.Nanjing Tongji Univ Nat Sci,2009,37(3):303 Unir Aeronaut Astronaut,008,40(2):265 (刘学增，周敏.改进的自适应遗传算法及其工程应用.同济 (张格伟，廖文和，刘长毅，等.知识的记忆一遗忘模型及其在大学学报：自然科学版，2009,37(3)：303) 知识管理中的应用.南京航空航天大学学报，2008,40(2)： B]Ren Z W,San Y.Improvement of real-valued genetic algorithm 265) and performance study.Acta Electron Sin,2007,35(2):269 [11]Guo C L,Zhang L M.Visual memory with amnesic function and (任子武，伞治.实数遗传算法的改进及性能研究.电子学报， its application in attention selection.Pattern Recognit Artif Intell, 2007,35(2):269) 2008,21(3):381 4]Tan B C,Lian C Y,Xu A,et al.A method of improved genetic (过晨雷，张立明.带有遗忘的视觉记忆模型及其在注意力 algorithm for robotic path planning.Xian Technol Unir,2008, 选择上的应用.模式识别与人工智能，2008,21(3)：381) 28(5):456 02] Yang Q W,Jiang J P,Zhang G H.Improving optimization speed (谭宝成，廉春原，徐艾，等.一种基于改进遗传算法的机器人 for genetic algorithms.J Soficare,2001,12(2)270 路径规划方法.西安工业大学学报，2008,28(5)：456) (杨启文，蒋静坪，张国宏.遗传算法优化速度的改进。软件 [5]Xu M H,Gao C X,Yu G.Adjustment of parameters and parallel 学报，2001,12(2)：270) reality of a genetic algorithm based on avoiding premature conver- [13]He L,Wang K J,Li G B,et al.The analysis and research of ge-

北京科技大学学报第 34 卷表 3 迭代 500 次的遗传算法与遗忘遗传算法结果比较 Table 3 Comparison of results between the genetic algorithm and the genetic algorithm with forgetting after 500 iterations 欠费率/% 遗传算法遗忘遗传算法最优 Fit 代数平均最优 Fit 平均代数最优 Fit 代数平均最优 Fit 平均代数遗忘概率 10 0. 896 105 0. 892 5 132 0. 896 175 0. 891 4 234 0. 020 20 0. 794 5 0. 794 0 66 0. 794 12 0. 790 2 187 0. 040 30 0. 709 16 0. 707 7 230 0. 725 192 0. 702 8 237 0. 035 40 0. 627 54 0. 621 5 173 0. 627 104 0. 621 0 228 0. 040 50 0. 529 131 0. 518 5 267 0. 535 98 0. 515 9 223 0. 025 60 0. 460 217 0. 443 4 223 0. 526 134 0. 433 2 266 0. 100 70 0. 436 159 0. 386 5 228 0. 577 399 0. 432 8 256 0. 080 80 0. 460 49 0. 340 3 262 0. 723 460 0. 439 9 275 0. 050 不同的参数设置下，一般只需要较少的迭代次数就可以获得更高质量的解．这说明遗忘遗传算法较好地解决了高欠费率下最优适应值偏低的问题，早熟情况得到明显改善． 4 结论本文引入遗忘机制改进了基于二进制编码的传统遗传算法，并将改进的算法用于求解电信客户初始信用评分问题．实验表明改进的遗传算法能显著提高解的精度，有效防止算法早熟收敛，并且较好地解决了采用传统遗传算法对高欠费率群体进行初始信用评分时算法的解不理想问题．参考文献［1］ Li J H，Li M，Yuan L H． Clustering based pseudo-parallel genetic algorithms． Pattern Recognit Artif Intell，2009，22( 2) : 188 ( 李军华，黎明，袁丽华．基于聚类的伪并行遗传算法．模式识别与人工智能，2009，22( 2) : 188) ［2］ Liu X Z，Zhou M． Improved adaptive genetic algorithm and its application to backward analysis of geotechnical engineering． J Tongji Univ Nat Sci，2009，37( 3) : 303 ( 刘学增，周敏．改进的自适应遗传算法及其工程应用．同济大学学报: 自然科学版，2009，37( 3) : 303) ［3］ Ren Z W，San Y． Improvement of real-valued genetic algorithm and performance study． Acta Electron Sin，2007，35( 2) : 269 ( 任子武，伞冶．实数遗传算法的改进及性能研究．电子学报， 2007，35( 2) : 269) ［4］ Tan B C，Lian C Y，Xu A，et al． A method of improved genetic algorithm for robotic path planning． J Xi'an Technol Univ，2008， 28( 5) : 456 ( 谭宝成，廉春原，徐艾，等．一种基于改进遗传算法的机器人路径规划方法．西安工业大学学报，2008，28( 5) : 456) ［5］ Xu M H，Gao C X，Yu G． Adjustment of parameters and parallel reality of a genetic algorithm based on avoiding premature convergence． J Wuhan Univ Nat Sci，2001，47( 1) : 33 ( 许明辉，高成修，于刚．一种克服遗传算法早熟的参数调整及并行方法．武汉大学学报: 理学版，2001，47( 1) : 33) ［6］ Xia H，Zhuang J，Wang L Z，et al． Environment-based synergic immune genetic algorithm． J Xi'an Jiaotong Univ，2009，43 ( 11) : 80 ( 夏虎，庄健，王立忠，等．一种考虑环境作用的协同免疫遗传算法．西安交通大学学报，2009，43( 11) : 80) ［7］ Fortescue T R，Kershenbaum L S，Ydstie B E． Implementation of self-tuning regulators with variable forgetting factors． Automatica， 1981，17( 6) : 831 ［8］ Meng X W，Cheng H． A learning algorithm of Hopfield neural network based on evolutionary programming with forgetting． J Software，1998，9( 2) : 151 ( 孟祥武，程虎．基于遗忘进化规划的 Hopfield 网学习算法．软件学报，1998，9( 2) : 151) ［9］ Chen H W，Xie L J，Xie J P． A class of forgetting algorithms for the value-based reinforcement learning． J Comput Res Dev，2001， 38( 4) : 487 ( 陈焕文，谢丽娟，谢建平．一类值函数激励学习的遗忘算法．计算机研究与发展，2001，38( 4) : 487) ［10］ Zhang G W，Liao W H，Liu C Y，et al． Memorizing-forgetting featured knowledge management and optimizing model． J Nanjing Univ Aeronaut Astronaut，2008，40( 2) : 265 ( 张格伟，廖文和，刘长毅，等．知识的记忆--遗忘模型及其在知识管理中的应用．南京航空航天大学学报，2008，40 ( 2) : 265) ［11］ Guo C L，Zhang L M． Visual memory with amnesic function and its application in attention selection． Pattern Recognit Artif Intell， 2008，21( 3) : 381 ( 过晨雷，张立明．带有遗忘的视觉记忆模型及其在注意力选择上的应用．模式识别与人工智能，2008，21( 3) : 381) ［12］ Yang Q W，Jiang J P，Zhang G H． Improving optimization speed for genetic algorithms． J Software，2001，12( 2) : 270 ( 杨启文，蒋静坪，张国宏．遗传算法优化速度的改进．软件学报，2001，12( 2) : 270) ［13］ He L，Wang K J，Li G B，et al． The analysis and research of ge- ·474·

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录

遗忘遗传算法及其在信用评分中的应用