D0I:10.13374.issn1001-053x.2012.04.016 第34卷第4期 北京科技大学学报 Vol.34 No.4 2012年4月 Journal of University of Science and Technology Beijing Apr.2012 遗忘遗传算法及其在信用评分中的应用 张玉洁四孟祥武 北京邮电大学智能通信软件与多媒体北京市重点实验室,北京100876 ☒通信作者,E-mail:zhangyj(@bupt.cdu.cm 摘要为解决局部最优问题,将遗忘机制引入传统遗传算法中,提出了一种改进的遗忘遗传算法,给出了一种遗忘算子及 其遗忘概率,通过在遗传过程中遗忘某些基因,增加了算法的搜索空间,使算法跳出局部最优,从而最大限度地避免早熟收 敛.将该算法用于不同欠费率下的电信客户初始信用评分,找到信用权重的优化解,较好地解决了对高欠费率群体进行信用 评分时,信用权重的适应值偏低的问题.实验结果表明所提算法有效可行,与标准遗传算法相比,本文所提算法可以获得更 高质量的解 关键词遗传算法:遗忘因子:客户服务:信用评分 分类号TP182 Genetic algorithm with forgetting and its application in initial credit scoring ZHANG Yu-jie☒,MENG Xiang-+u Beijing Key Laboratory of Intelligent Telecommunications Software and Multimedia,Beijing University of Posts and Telecommunications,Beijing 100876, China Corresponding author,E-mail:zhangyj@bupt.edu.cn ABSTRACT Based on the forgetting strategy,an improved genetic algorithm was proposed to solve the problem of local optimization, and a forgetting operator as well as its forgetting probability was given.For the search space was increased by forgetting some genes dur- ing the period of inheritance,the algorithm can break away from local optimization and avoid the premature convergence to the greatest extent.By using the algorithm to deal with the credit scoring of telecom customers for different arrears rates,the optimum solution of credit weights in the case of high rate of arrears was found,so it solves the problem that the fitness of credit weights is low for the credit scoring of telecom customers in high arrears rates.Experimental results demonstrate that the algorithm is effective and feasible.Com- pared with the standard genetic algorithm,the proposed algorithm can obtain better quality results. KEY WORDS genetic algorithms;forgetting factor:customer service:credit scoring 遗传算法是一种基于群体的进化算法,它不依 数编码,混沌序列搜索产生初始种群.通过精英个 赖于问题的具体领域,本身具有良好兼容性,被广泛 体保留、粒子群优化策略和改进遗传算法三种策略 应用于组合优化、机器学习、人工生命、自适应控制、 共同作用产生种群新个体.文献4]提出二维浮点 规划设计和图像处理等领域. 数变长度编码,采用知识启发策略初始化种群,以及 但是,遗传算法存在未成熟收敛现象,针对这一 自适应交叉和变异算子的改进遗传算法.文献5] 问题,研究者在种群生成、编码和遗传操作等环节中 依据自适应交叉和变异概率变化情况划分种群,对 探讨了许多解决对策.文献]采用聚类方法形成 子种群单独遗传进化,在不同的进化时间间隔,或进 多个子种群,并对所有聚类的代表元及未分类个体 行个体移植,或进行个体的随机分配.文献[6]采用 采用小生境的遗传机制.文献2]通过增加初始种 十进制编码,对主种群、协同种群和精英种群三个种 群间的海明距离、小生境技术、自适应杂交和变异算 群进行免疫疫苗选择和更新操作;对主种群进行克 子及种群迁移来维持种群多样性.文献B]采用实 隆交叉、克隆环境演化、克隆直接变异和自适应探索 收稿日期:201102一15 基金项目:国家自然科学基金资助项目(60872051):中央高校基本科研业务费专项资金资助项目(2009RC0203);北京市教育委员会共建项目
第 34 卷 第 4 期 2012 年 4 月 北京科技大学学报 Journal of University of Science and Technology Beijing Vol. 34 No. 4 Apr. 2012 遗忘遗传算法及其在信用评分中的应用 张玉洁 孟祥武 北京邮电大学智能通信软件与多媒体北京市重点实验室,北京 100876 通信作者,E-mail: zhangyj@ bupt. edu. cn 摘 要 为解决局部最优问题,将遗忘机制引入传统遗传算法中,提出了一种改进的遗忘遗传算法,给出了一种遗忘算子及 其遗忘概率,通过在遗传过程中遗忘某些基因,增加了算法的搜索空间,使算法跳出局部最优,从而最大限度地避免早熟收 敛. 将该算法用于不同欠费率下的电信客户初始信用评分,找到信用权重的优化解,较好地解决了对高欠费率群体进行信用 评分时,信用权重的适应值偏低的问题. 实验结果表明所提算法有效可行. 与标准遗传算法相比,本文所提算法可以获得更 高质量的解. 关键词 遗传算法; 遗忘因子; 客户服务; 信用评分 分类号 TP182 Genetic algorithm with forgetting and its application in initial credit scoring ZHANG Yu-jie ,MENG Xiang-wu Beijing Key Laboratory of Intelligent Telecommunications Software and Multimedia,Beijing University of Posts and Telecommunications,Beijing 100876, China Corresponding author,E-mail: zhangyj@ bupt. edu. cn ABSTRACT Based on the forgetting strategy,an improved genetic algorithm was proposed to solve the problem of local optimization, and a forgetting operator as well as its forgetting probability was given. For the search space was increased by forgetting some genes during the period of inheritance,the algorithm can break away from local optimization and avoid the premature convergence to the greatest extent. By using the algorithm to deal with the credit scoring of telecom customers for different arrears rates,the optimum solution of credit weights in the case of high rate of arrears was found,so it solves the problem that the fitness of credit weights is low for the credit scoring of telecom customers in high arrears rates. Experimental results demonstrate that the algorithm is effective and feasible. Compared with the standard genetic algorithm,the proposed algorithm can obtain better quality results. KEY WORDS genetic algorithms; forgetting factor; customer service; credit scoring 收稿日期: 2011--02--15 基金项目: 国家自然科学基金资助项目( 60872051) ; 中央高校基本科研业务费专项资金资助项目( 2009RC0203) ; 北京市教育委员会共建项目 遗传算法是一种基于群体的进化算法,它不依 赖于问题的具体领域,本身具有良好兼容性,被广泛 应用于组合优化、机器学习、人工生命、自适应控制、 规划设计和图像处理等领域. 但是,遗传算法存在未成熟收敛现象,针对这一 问题,研究者在种群生成、编码和遗传操作等环节中 探讨了许多解决对策. 文献[1]采用聚类方法形成 多个子种群,并对所有聚类的代表元及未分类个体 采用小生境的遗传机制. 文献[2]通过增加初始种 群间的海明距离、小生境技术、自适应杂交和变异算 子及种群迁移来维持种群多样性. 文献[3]采用实 数编码,混沌序列搜索产生初始种群. 通过精英个 体保留、粒子群优化策略和改进遗传算法三种策略 共同作用产生种群新个体. 文献[4]提出二维浮点 数变长度编码,采用知识启发策略初始化种群,以及 自适应交叉和变异算子的改进遗传算法. 文献[5] 依据自适应交叉和变异概率变化情况划分种群,对 子种群单独遗传进化,在不同的进化时间间隔,或进 行个体移植,或进行个体的随机分配. 文献[6]采用 十进制编码,对主种群、协同种群和精英种群三个种 群进行免疫疫苗选择和更新操作; 对主种群进行克 隆交叉、克隆环境演化、克隆直接变异和自适应探索 DOI:10.13374/j.issn1001-053x.2012.04.016
·472 北京科技大学学报 第34卷 操作:对协同种群进行克隆变异、克隆倒位、遗传交 收敛 叉和变异操作以及不对称信息的交互操作;从主种 遗忘遗传算法采用二进制编码,种群的迭代通 群和协同种群中各取前10%的优质个体组成精英 过选择、交叉、变异和遗忘操作来实现.其中,选择 种群,进行交叉操作. 操作采用轮盘赌方式淘汰适应值低的个体:交叉操 上述算法实现复杂,实际操作中会产生大量的 作采用顺序配对单点交叉:变异采用的方法是首先 计算开支.本文在传统遗传算法的基础上,引入记 以变异概率计算基因变异数目,然后对群体中全部 忆心理学中有关遗忘的基本原理,提出了一个基于 个体顺序组成的一个整串随机挑选基因位,并对基 遗忘机制的遗传算法,并用于求解信用评分问题,使 因值进行取反操作:遗忘操作同变异操作类似,不同 遗传算法的搜索寻优过程从局部最优中跳出来,继 的是对基因值进行置零操作,遗忘可以是置0,或者 续寻找全局最优解 是置1,在本文中,为了方便理解,方便实验,统一为 置0. 1遗忘遗传算法 输入:客户样本数N:客户属性数M;进化代数; 1.1遗忘 染色体个数numOfIndividual;基因数目numOfGene; 自从1885年德国的心理学家艾宾浩斯首次提 交叉概率P。、变异概率Pm、遗忘概率P· 出遗忘曲线以来,对遗忘的研究成了心理学中最热 输出:适应值最高的个体 门的领域之一,其研究成果也被越来越多其他领域 Program GetOptimalWeightsUseFGA 的研究者所应用.1981年,Fortescue等首次提出 随机初始化个体: 时变遗忘因子辨识算法,并应用于时变系统的辨识 计算个体适应值: 和自适应控制:1998年,孟祥武等图提出一个基于 WHLE(未达到迭代次数) DO{ 遗忘进化规划的Hopfield网学习算法,克服了进化 Select()I/选择操作 Hopfield网学习的局限性,解决了神经网络进化学 Cross()/交叉操作 习过程中的局部最小问题:2001年陈焕文等回将遗 Mutation()/变异操作 忘引入值函数的激励学习,特别是SARSA(K)算 Forgetting()I/遗忘操作 法,形成了一类适合于值函数激励学习的遗忘算法: 张格伟等0将遗忘引入知识管理中,建立了符合遗 NumOf Forgetting numOfGene nu- 忘规律的记忆-遗忘数学模型:过晨雷等而提出一 mOfIndividual*P,;/确定遗忘的基因数量 个能够模拟人的注意力转移并带有学习和遗忘的视 随机确定遗忘基因位: 觉记忆模型. 将对应的基因位置为0: 一切信息都在以遗忘的方式同步退化,经过日 } 积月累,被不断重复和强化的重要信息才会被保留 计算个体适应值: 下来,受其启发,将遗忘引入传统遗传算法中,以提 ShowMaxSolution()://输出本轮适应值最 高解的质量.本文的遗忘也是以一定的概率P对染 高的个体 色体上的基因位进行置零操作. } 1.2遗忘遗传算法描述 BestSolution();/输出适应值最高的个体 为了预防早熟收敛,在有效基因未知的情况下, 变异算子必须有能力保持同一基因位上等位基因的 2基于遗忘遗传算法的电信客户信用评分 多样性.然而,文献2]证明了传统变异算子无法 有效保持同一基因位上等位基因的多样性.此外, 2.1信用评分 文献3]指出早熟收敛与种群多样性的下降有密 信用评分最初作为金融风险管理工具之一,广 切关系 泛应用于银行信贷以及信贷其他领域,近些年其应 本文提出的遗忘遗传算法是在遗传操作中增加 用领域开始向电信等领域延伸.目前,研究信用评 遗忘操作,作为变异操作的补充.通过在遗传过程 分的主要方法有遗传算法、logistic回归、生存分析、 中遗忘某些基因,来改变生物原有的遗传特性,获得 神经网络、概率分析、判别分析、马尔可夫网络、贝叶 新物种,从而调节种群的多样性,增加算法的搜索空 斯决策模型、支持向量机和蚁群算法等4- 间,使算法跳出局部最优,从而最大限度地避免早熟 文献几5]构建信用评分模型的主要思想是:首
北 京 科 技 大 学 学 报 第 34 卷 操作; 对协同种群进行克隆变异、克隆倒位、遗传交 叉和变异操作以及不对称信息的交互操作; 从主种 群和协同种群中各取前 10% 的优质个体组成精英 种群,进行交叉操作. 上述算法实现复杂,实际操作中会产生大量的 计算开支. 本文在传统遗传算法的基础上,引入记 忆心理学中有关遗忘的基本原理,提出了一个基于 遗忘机制的遗传算法,并用于求解信用评分问题,使 遗传算法的搜索寻优过程从局部最优中跳出来,继 续寻找全局最优解. 1 遗忘遗传算法 1. 1 遗忘 自从 1885 年德国的心理学家艾宾浩斯首次提 出遗忘曲线以来,对遗忘的研究成了心理学中最热 门的领域之一,其研究成果也被越来越多其他领域 的研究者所应用. 1981 年,Fortescue 等[7]首次提出 时变遗忘因子辨识算法,并应用于时变系统的辨识 和自适应控制; 1998 年,孟祥武等[8]提出一个基于 遗忘进化规划的 Hopfield 网学习算法,克服了进化 Hopfield 网学习的局限性,解决了神经网络进化学 习过程中的局部最小问题; 2001 年陈焕文等[9]将遗 忘引入值函数的激励学习,特别是 SARSA( K) 算 法,形成了一类适合于值函数激励学习的遗忘算法; 张格伟等[10]将遗忘引入知识管理中,建立了符合遗 忘规律的记忆--遗忘数学模型; 过晨雷等[11]提出一 个能够模拟人的注意力转移并带有学习和遗忘的视 觉记忆模型. 一切信息都在以遗忘的方式同步退化,经过日 积月累,被不断重复和强化的重要信息才会被保留 下来,受其启发,将遗忘引入传统遗传算法中,以提 高解的质量. 本文的遗忘也是以一定的概率 pf对染 色体上的基因位进行置零操作. 1. 2 遗忘遗传算法描述 为了预防早熟收敛,在有效基因未知的情况下, 变异算子必须有能力保持同一基因位上等位基因的 多样性. 然而,文献[12]证明了传统变异算子无法 有效保持同一基因位上等位基因的多样性. 此外, 文献[13]指出早熟收敛与种群多样性的下降有密 切关系. 本文提出的遗忘遗传算法是在遗传操作中增加 遗忘操作,作为变异操作的补充. 通过在遗传过程 中遗忘某些基因,来改变生物原有的遗传特性,获得 新物种,从而调节种群的多样性,增加算法的搜索空 间,使算法跳出局部最优,从而最大限度地避免早熟 收敛. 遗忘遗传算法采用二进制编码,种群的迭代通 过选择、交叉、变异和遗忘操作来实现. 其中,选择 操作采用轮盘赌方式淘汰适应值低的个体; 交叉操 作采用顺序配对单点交叉; 变异采用的方法是首先 以变异概率计算基因变异数目,然后对群体中全部 个体顺序组成的一个整串随机挑选基因位,并对基 因值进行取反操作; 遗忘操作同变异操作类似,不同 的是对基因值进行置零操作,遗忘可以是置 0,或者 是置 1,在本文中,为了方便理解,方便实验,统一为 置 0. 输入: 客户样本数 N; 客户属性数 M; 进化代数; 染色体个数 numOfIndividual; 基因数目 numOfGene; 交叉概率 Pc、变异概率 Pm、遗忘概率 Pf . 输出: 适应值最高的个体. Program GetOptimalWeightsUseFGA { 随机初始化个体; 计算个体适应值; WHILE ( 未达到迭代次数) DO { Select( ) / /选择操作 Cross( ) / /交叉操作 Mutation( ) / /变异操作 Forgetting( ) / /遗忘操作 { NumOf Forgetting = numOfGene * numOfIndividual * Pf ; / /确定遗忘的基因数量 随机确定遗忘基因位; 将对应的基因位置为 0; } 计算个体适应值; ShowMaxSolution( ) ; / /输出本轮适应值最 高的个体 } BestSolution( ) ; / /输出适应值最高的个体 } 2 基于遗忘遗传算法的电信客户信用评分 2. 1 信用评分 信用评分最初作为金融风险管理工具之一,广 泛应用于银行信贷以及信贷其他领域,近些年其应 用领域开始向电信等领域延伸. 目前,研究信用评 分的主要方法有遗传算法、logistic 回归、生存分析、 神经网络、概率分析、判别分析、马尔可夫网络、贝叶 斯决策模型、支持向量机和蚁群算法等[14--15]. 文献[15]构建信用评分模型的主要思想是: 首 ·472·
第4期 张玉洁等:遗忘遗传算法及其在信用评分中的应用 ·473 先抽取己有消费行为的客户数据,并对信用评价指 本文将适应值最高的那组属性域信用权重分配 标的属性域信用权重按照一定的约束规则进行预处 称为最优解,对应的适应值称为最优适应值 理:然后由初始信用分配算法得到属性域信用权重, 3实验结果与分析 代入信用计算公式,计算客户初始信用度:最后利用 评价函数对信用权重分配合理性进行评价,即计算 算法采用JAVA语言实现,分别进行30次独立 信用权重的适应值,并判断是否符合要求,如果符合 运行.选取客户数N=1000,客户属性数L=4.其 要求则输出信用权重分配值,程序终止,否则重新分 中,样本数据的属性结构设计同文献15]. 配新的信用权重.如此循环,直到符合要求或循环 实验1采用传统遗传算法.遗传算法参数设 终止 置为:染色体个数100,染色体基因数为54,交叉概 然而,采用该模型并应用传统遗传算法进行信 率0.8,变异概率为0.05.迭代次数为5000次的实 用权重分配实验发现,对于欠费率在30%以上的高 验结果如表2所示 欠费率群体,得到解的适应值并不高.应用遗忘遗 表2迭代5000次的遗传算法结果 传算法求解高欠费群体的信用评分问题取得了较好 Table 2 Results of the genetic algorithm after 5000 iterations 的效果 欠费率/%最优Ft 代数 平均最优Ft平均代数 2.2基于遗忘遗传算法的信用评分 10 0.896 17 0.8960 641 将遗忘遗传算法用于文献5]的信用评分模 20 0.794 11 0.7940 % 型中,主要步骤描述如下. 30 0.725 73 0.7136 1762 首先进行群体初始化,包括:(1)系统随机生成 40 0.627 191 0.6243 1266 S个个体,每个个体由随机分配的信用权重构成的 50 0.535 393 0.5274 1897 十进制串组成:(2)将十进制串转换为S个二进制 60 0.472 4754 0.4557 2586 串,二进制串长L由属性域数目和属性域权重取值 70 0.443 3861 0.4054 2422 范围的最大值决定 80 0.534 832 0.4313 2497 然后,使用评价函数对个体进行评价,进行选 择、交叉、突变和遗忘操作,得到新的群体,再利用评 实验2仍采用传统遗传算法.参数设置同实 价函数对个体进行评价,重复该过程,直到满足算法 验1,迭代次数为500次的实验结果如表3所示 终止条件.评价函数的伪代码如表1所示 实验3采用遗忘遗传算法.参数设置同实验 最后,将一组适应值最高的信用权重带入下式 1根据经验选择的,遗忘概率分别取0.020、0.025、 计算出新客户的初始信用度: 0.030、0.035、0.040、0.050、0.080、0.100、0.150和 0.200.迭代次数为500次,从实验结果中选取部分 Init_Credit(i)= Weight(i,i) (1≤i≤N). 数据如表3所示. (1) 对比表2和表3的实验结果可看出:(1)当欠 式中,Weight(i,j)为第i个客户第j个属性对应的属 费率为10%、20%和40%时,由遗传算法得到的最 性域信用权重,N为客户数,L为客户属性数. 优适应值没有变化,对于其他欠费率,最优适应值 (解的质量)随着迭代次数的增加而提高.(2)对于 表1评价函数伪代码 Table 1 Pseudo code of the fitness function 欠费率30%和50%的情形,迭代500次,与遗传算 法相比,遗忘遗传算法解的质量小幅提高.(3)当欠 输入:属性域的信用权重分配值 输出:适应值it 费率大于60%时,同样是500次迭代,遗忘遗传算 {… 法解的质量不仅远远高于遗传算法解的质量,而且 将第i个客户的属性域信用权重代入式(1),计算出该客 还高于遗传算法5000次迭代解的质量.可见遗忘 户的初始信用度: 遗传算法的效果是明显的 if (Init_Credit(i)AVG_Init_Credit)and (Owe]=0) 算子,发生遗忘后,个体的适应值变化较大,与遗传 then Num Num +1: 算法相比较,相当于又部分重新开始进化,所以遗忘 遗传算法的平均代数大多高于遗传算法的平均代 Fit(m)=NumN;/本次信用权重分配对应的适应值 数.通过引入遗忘算子增强了算法的寻优能力,在
第 4 期 张玉洁等: 遗忘遗传算法及其在信用评分中的应用 先抽取已有消费行为的客户数据,并对信用评价指 标的属性域信用权重按照一定的约束规则进行预处 理; 然后由初始信用分配算法得到属性域信用权重, 代入信用计算公式,计算客户初始信用度; 最后利用 评价函数对信用权重分配合理性进行评价,即计算 信用权重的适应值,并判断是否符合要求,如果符合 要求则输出信用权重分配值,程序终止,否则重新分 配新的信用权重. 如此循环,直到符合要求或循环 终止. 然而,采用该模型并应用传统遗传算法进行信 用权重分配实验发现,对于欠费率在 30% 以上的高 欠费率群体,得到解的适应值并不高. 应用遗忘遗 传算法求解高欠费群体的信用评分问题取得了较好 的效果. 2. 2 基于遗忘遗传算法的信用评分 将遗忘遗传算法用于文献[15]的信用评分模 型中,主要步骤描述如下. 首先进行群体初始化,包括: ( 1) 系统随机生成 S 个个体,每个个体由随机分配的信用权重构成的 十进制串组成; ( 2) 将十进制串转换为 S 个二进制 串,二进制串长 L 由属性域数目和属性域权重取值 范围的最大值决定. 然后,使用评价函数对个体进行评价,进行选 择、交叉、突变和遗忘操作,得到新的群体,再利用评 价函数对个体进行评价,重复该过程,直到满足算法 终止条件. 评价函数的伪代码如表 1 所示. 最后,将一组适应值最高的信用权重带入下式 计算出新客户的初始信用度: Init_Credit( i) = ∑ L j = 1 Weight( i,j) ( 1≤i≤N) . ( 1) 式中,Weight( i,j) 为第 i 个客户第 j 个属性对应的属 性域信用权重,N 为客户数,L 为客户属性数. 表 1 评价函数伪代码 Table 1 Pseudo code of the fitness function 输入: 属性域的信用权重分配值 输出: 适应值 Fit { … 将第 i 个客户的属性域信用权重代入式( 1) ,计算出该客 户的初始信用度; if ( Init_Credit( i) < AVG_Init_Credit) and ( Owe[i]= 1) then Num = Num + 1; if ( Init_Credit( i) > AVG_Init_Credit ) and ( Owe[i]= 0) then Num = Num + 1; } Fit( m) = Num/N; / /本次信用权重分配对应的适应值 本文将适应值最高的那组属性域信用权重分配 称为最优解,对应的适应值称为最优适应值. 3 实验结果与分析 算法采用 JAVA 语言实现,分别进行 30 次独立 运行. 选取客户数 N = 1 000,客户属性数 L = 4. 其 中,样本数据的属性结构设计同文献[15]. 实验 1 采用传统遗传算法. 遗传算法参数设 置为: 染色体个数 100,染色体基因数为 54,交叉概 率 0. 8,变异概率为 0. 05. 迭代次数为 5 000 次的实 验结果如表 2 所示. 表 2 迭代 5 000 次的遗传算法结果 Table 2 Results of the genetic algorithm after 5 000 iterations 欠费率/% 最优 Fit 代数 平均最优 Fit 平均代数 10 0. 896 17 0. 896 0 641 20 0. 794 11 0. 794 0 50 30 0. 725 73 0. 713 6 1 762 40 0. 627 191 0. 624 3 1 266 50 0. 535 393 0. 527 4 1 897 60 0. 472 4 754 0. 455 7 2 586 70 0. 443 3 861 0. 405 4 2 422 80 0. 534 832 0. 431 3 2 497 实验 2 仍采用传统遗传算法. 参数设置同实 验 1,迭代次数为 500 次的实验结果如表 3 所示. 实验 3 采用遗忘遗传算法. 参数设置同实验 1 根据经验选择的,遗忘概率分别取 0. 020、0. 025、 0. 030、0. 035、0. 040、0. 050、0. 080、0. 100、0. 150 和 0. 200. 迭代次数为 500 次,从实验结果中选取部分 数据如表 3 所示. 对比表 2 和表 3 的实验结果可看出: ( 1) 当欠 费率为 10% 、20% 和 40% 时,由遗传算法得到的最 优适应值没有变化,对于其他欠费率,最优适应值 ( 解的质量) 随着迭代次数的增加而提高. ( 2) 对于 欠费率 30% 和 50% 的情形,迭代 500 次,与遗传算 法相比,遗忘遗传算法解的质量小幅提高. ( 3) 当欠 费率大于 60% 时,同样是 500 次迭代,遗忘遗传算 法解的质量不仅远远高于遗传算法解的质量,而且 还高于遗传算法 5 000 次迭代解的质量. 可见遗忘 遗传算法的效果是明显的. 由上述分析可以得出: 遗忘遗传算法引入遗忘 算子,发生遗忘后,个体的适应值变化较大,与遗传 算法相比较,相当于又部分重新开始进化,所以遗忘 遗传算法的平均代数大多高于遗传算法的平均代 数. 通过引入遗忘算子增强了算法的寻优能力,在 ·473·
·474 北京科技大学学报 第34卷 表3迭代500次的遗传算法与遗忘遗传算法结果比较 Table 3 Comparison of results between the genetic algorithm and the genetic algorithm with forgetting after 500 iterations 遗传算法 遗忘遗传算法 欠费率/% 最优Fit 代数 平均最优it平均代数 最优Fit 代数 平均最优Fit 平均代数遗忘概率 6 0.896 105 0.8925 132 0.896 175 0.8914 234 0.020 市 0.794 5 0.7940 66 0.794 0.7902 187 0.040 30 0.709 16 0.7077 230 0.725 192 0.7028 237 0.035 40 0.627 必 0.6215 173 0.627 104 0.6210 228 0.040 50 0.529 131 0.5185 267 0.535 98 0.5159 223 0.025 0.460 217 0.4434 223 0.526 134 0.4332 266 0.100 0.436 159 0.3865 228 0.577 399 0.4328 256 0.080 80 0.460 49 0.3403 262 0.723 460 0.4399 275 0.050 不同的参数设置下,一般只需要较少的迭代次数就 gence.J Wuhan Univ Nat Sci,2001,47(1):33 可以获得更高质量的解.这说明遗忘遗传算法较好 (许明辉,高成修,于刚.一种克服遗传算法早熟的参数调整 地解决了高欠费率下最优适应值偏低的问题,早熟 及并行方法.武汉大学学报:理学版,2001,47(1):33) [6]Xia H,Zhuang J,Wang L Z,et al.Environment-based synergic 情况得到明显改善, immune genetic algorithm.J Xian Jiaotong Univ,2009,43 4结论 (11):80 (夏虎,庄健,王立忠,等。一种考虑环境作用的协同免疫遗传 本文引入遗忘机制改进了基于二进制编码的传 算法.西安交通大学学报,2009,43(11):80) 统遗传算法,并将改进的算法用于求解电信客户初 ] Fortescue TR,Kershenbaum LS,Ydstie B E.Implementation of 始信用评分问题.实验表明改进的遗传算法能显著 self-uning regulators with variable forgetting factors.Automatica, 1981,17(6):831 提高解的精度,有效防止算法早熟收敛,并且较好地 8] Meng X W,Cheng H.A learning algorithm of Hopfield neural net- 解决了采用传统遗传算法对高欠费率群体进行初始 work based on evolutionary programming with forgetting.Sof- 信用评分时算法的解不理想问题 wae,1998,9(2):151 (孟样武,程虎.基于遗忘进化规划的Hopfield网学习算法. 软件学报,1998,9(2):151) 参考文献 [9] Chen H W,Xie LJ,Xie J P.A class of forgetting algorithms for [1]Li J H,Li M,Yuan L H.Clustering based pseudo-parallel genetic the value-based reinforcement leaming.Comput Res Dev,2001, 38(4):487 algorithms.Pattern Recognit Artif Intell,2009,22(2):188 (李军华,黎明,袁丽华.基于聚类的伪并行遗传算法.模式识 (陈焕文,谢丽娟,谢建平.一类值函数激励学习的遗忘算法 别与人工智能,2009,22(2):188) 计算机研究与发展,2001,38(4):487) Liu XZ,Zhou M.Improved adaptive genetic algorithm and its ap- [10]Zhang G W,Liao W H,Liu C Y,et al.Memorizing-forgetting plication to backward analysis of geotechnical engineering.J featured knowledge management and optimizing model.Nanjing Tongji Univ Nat Sci,2009,37(3):303 Unir Aeronaut Astronaut,008,40(2):265 (刘学增,周敏.改进的自适应遗传算法及其工程应用.同济 (张格伟,廖文和,刘长毅,等.知识的记忆一遗忘模型及其在 大学学报:自然科学版,2009,37(3):303) 知识管理中的应用.南京航空航天大学学报,2008,40(2): B]Ren Z W,San Y.Improvement of real-valued genetic algorithm 265) and performance study.Acta Electron Sin,2007,35(2):269 [11]Guo C L,Zhang L M.Visual memory with amnesic function and (任子武,伞治.实数遗传算法的改进及性能研究.电子学报, its application in attention selection.Pattern Recognit Artif Intell, 2007,35(2):269) 2008,21(3):381 4]Tan B C,Lian C Y,Xu A,et al.A method of improved genetic (过晨雷,张立明.带有遗忘的视觉记忆模型及其在注意力 algorithm for robotic path planning.Xian Technol Unir,2008, 选择上的应用.模式识别与人工智能,2008,21(3):381) 28(5):456 02] Yang Q W,Jiang J P,Zhang G H.Improving optimization speed (谭宝成,廉春原,徐艾,等.一种基于改进遗传算法的机器人 for genetic algorithms.J Soficare,2001,12(2)270 路径规划方法.西安工业大学学报,2008,28(5):456) (杨启文,蒋静坪,张国宏.遗传算法优化速度的改进。软件 [5]Xu M H,Gao C X,Yu G.Adjustment of parameters and parallel 学报,2001,12(2):270) reality of a genetic algorithm based on avoiding premature conver- [13]He L,Wang K J,Li G B,et al.The analysis and research of ge-
北 京 科 技 大 学 学 报 第 34 卷 表 3 迭代 500 次的遗传算法与遗忘遗传算法结果比较 Table 3 Comparison of results between the genetic algorithm and the genetic algorithm with forgetting after 500 iterations 欠费率/% 遗传算法 遗忘遗传算法 最优 Fit 代数 平均最优 Fit 平均代数 最优 Fit 代数 平均最优 Fit 平均代数 遗忘概率 10 0. 896 105 0. 892 5 132 0. 896 175 0. 891 4 234 0. 020 20 0. 794 5 0. 794 0 66 0. 794 12 0. 790 2 187 0. 040 30 0. 709 16 0. 707 7 230 0. 725 192 0. 702 8 237 0. 035 40 0. 627 54 0. 621 5 173 0. 627 104 0. 621 0 228 0. 040 50 0. 529 131 0. 518 5 267 0. 535 98 0. 515 9 223 0. 025 60 0. 460 217 0. 443 4 223 0. 526 134 0. 433 2 266 0. 100 70 0. 436 159 0. 386 5 228 0. 577 399 0. 432 8 256 0. 080 80 0. 460 49 0. 340 3 262 0. 723 460 0. 439 9 275 0. 050 不同的参数设置下,一般只需要较少的迭代次数就 可以获得更高质量的解. 这说明遗忘遗传算法较好 地解决了高欠费率下最优适应值偏低的问题,早熟 情况得到明显改善. 4 结论 本文引入遗忘机制改进了基于二进制编码的传 统遗传算法,并将改进的算法用于求解电信客户初 始信用评分问题. 实验表明改进的遗传算法能显著 提高解的精度,有效防止算法早熟收敛,并且较好地 解决了采用传统遗传算法对高欠费率群体进行初始 信用评分时算法的解不理想问题. 参 考 文 献 [1] Li J H,Li M,Yuan L H. Clustering based pseudo-parallel genetic algorithms. Pattern Recognit Artif Intell,2009,22( 2) : 188 ( 李军华,黎明,袁丽华. 基于聚类的伪并行遗传算法. 模式识 别与人工智能,2009,22( 2) : 188) [2] Liu X Z,Zhou M. Improved adaptive genetic algorithm and its application to backward analysis of geotechnical engineering. J Tongji Univ Nat Sci,2009,37( 3) : 303 ( 刘学增,周敏. 改进的自适应遗传算法及其工程应用. 同济 大学学报: 自然科学版,2009,37( 3) : 303) [3] Ren Z W,San Y. Improvement of real-valued genetic algorithm and performance study. Acta Electron Sin,2007,35( 2) : 269 ( 任子武,伞冶. 实数遗传算法的改进及性能研究. 电子学报, 2007,35( 2) : 269) [4] Tan B C,Lian C Y,Xu A,et al. A method of improved genetic algorithm for robotic path planning. J Xi'an Technol Univ,2008, 28( 5) : 456 ( 谭宝成,廉春原,徐艾,等. 一种基于改进遗传算法的机器人 路径规划方法. 西安工业大学学报,2008,28( 5) : 456) [5] Xu M H,Gao C X,Yu G. Adjustment of parameters and parallel reality of a genetic algorithm based on avoiding premature convergence. J Wuhan Univ Nat Sci,2001,47( 1) : 33 ( 许明辉,高成修,于刚. 一种克服遗传算法早熟的参数调整 及并行方法. 武汉大学学报: 理学版,2001,47( 1) : 33) [6] Xia H,Zhuang J,Wang L Z,et al. Environment-based synergic immune genetic algorithm. J Xi'an Jiaotong Univ,2009,43 ( 11) : 80 ( 夏虎,庄健,王立忠,等. 一种考虑环境作用的协同免疫遗传 算法. 西安交通大学学报,2009,43( 11) : 80) [7] Fortescue T R,Kershenbaum L S,Ydstie B E. Implementation of self-tuning regulators with variable forgetting factors. Automatica, 1981,17( 6) : 831 [8] Meng X W,Cheng H. A learning algorithm of Hopfield neural network based on evolutionary programming with forgetting. J Software,1998,9( 2) : 151 ( 孟祥武,程虎. 基于遗忘进化规划的 Hopfield 网学习算法. 软件学报,1998,9( 2) : 151) [9] Chen H W,Xie L J,Xie J P. A class of forgetting algorithms for the value-based reinforcement learning. J Comput Res Dev,2001, 38( 4) : 487 ( 陈焕文,谢丽娟,谢建平. 一类值函数激励学习的遗忘算法. 计算机研究与发展,2001,38( 4) : 487) [10] Zhang G W,Liao W H,Liu C Y,et al. Memorizing-forgetting featured knowledge management and optimizing model. J Nanjing Univ Aeronaut Astronaut,2008,40( 2) : 265 ( 张格伟,廖文和,刘长毅,等. 知识的记忆--遗忘模型及其在 知识管理中的应用. 南京航空航天大学学报,2008,40 ( 2) : 265) [11] Guo C L,Zhang L M. Visual memory with amnesic function and its application in attention selection. Pattern Recognit Artif Intell, 2008,21( 3) : 381 ( 过晨雷,张立明. 带有遗忘的视觉记忆模型及其在注意力 选择上的应用. 模式识别与人工智能,2008,21( 3) : 381) [12] Yang Q W,Jiang J P,Zhang G H. Improving optimization speed for genetic algorithms. J Software,2001,12( 2) : 270 ( 杨启文,蒋静坪,张国宏. 遗传算法优化速度的改进. 软件 学报,2001,12( 2) : 270) [13] He L,Wang K J,Li G B,et al. The analysis and research of ge- ·474·
第4期 张玉洁等:遗忘遗传算法及其在信用评分中的应用 ·475· netic algorithms'population diversity.Harbin Eng Univ,1999, (张玉洁,孟祥武.基于遗传算法的电信客户初始信用度分 20(4):27 配算法.北京邮电大学学报,2002,25(2):74) (何琳,王科俊,李国斌,等.遗传算法种群多样性的分析研 5] Zhang Y J,Meng X W.Initial credit scoring for telecom custom- 究.哈尔滨工程大学学报,1999,20(4):27) ers using ant colony algorithm.J Beijing Univ Posts Telecommun, [14]Zhang Y J,Meng X W.An allocating algorithm of initial user's 2010,33(1):124 credit based on genetic algorithms.I Beijing Unir Posts Telecom- (张玉洁,孟祥武.利用蚁群算法求解电信客户初始信用评 mn,2002,25(2):74 分问题.北京邮电大学学报,2010,33(1):124)
第 4 期 张玉洁等: 遗忘遗传算法及其在信用评分中的应用 netic algorithms' population diversity. J Harbin Eng Univ,1999, 20( 4) : 27 ( 何琳,王科俊,李国斌,等. 遗传算法种群多样性的分析研 究. 哈尔滨工程大学学报,1999,20( 4) : 27) [14] Zhang Y J,Meng X W. An allocating algorithm of initial user's credit based on genetic algorithms. J Beijing Univ Posts Telecommun,2002,25( 2) : 74 ( 张玉洁,孟祥武. 基于遗传算法的电信客户初始信用度分 配算法. 北京邮电大学学报,2002,25( 2) : 74) [15] Zhang Y J,Meng X W. Initial credit scoring for telecom customers using ant colony algorithm. J Beijing Univ Posts Telecommun, 2010,33( 1) : 124 ( 张玉洁,孟祥武. 利用蚁群算法求解电信客户初始信用评 分问题. 北京邮电大学学报,2010,33( 1) : 124) ·475·