第13卷第5期 智能系统学报 Vol.13 No.5 2018年10月 CAAI Transactions on Intelligent Systems Oct.2018 D0:10.11992/tis.201705017 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20170728.1901.006.html 基于混沌搜索和权重学习的教与学优化算法及其应用 柳缔西子',范勤勤2,胡志华 (1.上海海事大学物流研究中心,上海201306,2.华东理工大学化工过程先进控制和优化技术教育部重点实 验室,上海200237) 摘要:针对教与学优化算法容易陷入早熟收敛的问题,本研究提出了一种基于混沌搜索和权重学习的教与学 (teaching-learning-based optimization algorithm based on chaotic search and weighted learning.TLBO-CSWL) 法。在TLBO-CSWL算法的教学阶段,不仅利用权重学习得到的个体来指引种群的进化,而且还使用正态分布 随机数来替代原有的均匀随机数。另外,TLBO-CSWL还使用Logistics混沌搜索策略来提高其全局搜索能力。 仿真结果表明,TLBO-CSWL的整体优化性能要好于其他所比较的算法。最后,将TLBO-CSWL用于求解非合 作博弈纳什均衡问题,获得满意的结果。 关键词:教与学优化;权重学习;启发式算法:混沌搜索;全局优化:进化计算;非合作博弈;纳什均衡 中图分类号:TP301.6文献标志码:A文章编号:1673-4785(2018)05-0818-11 中文引用格式:柳缔西子,范勤勤,胡志华.基于混沌搜索和权重学习的教与学优化算法及其应用引.智能系统学报,2018, 13(5):818-828. 英文引用格式:LIU Dixizi,FAN Qinqin,HU Zhihua..Teaching-learning-based optimization algorithm based on chaotic search and weighted learning and its application CAAI transactions on intelligent systems,2018,13(5):818-828. Teaching-learning-based optimization algorithm based on chaotic search and weighted learning and its application LIU Dixizi',FAN Qinqin,HU Zhihua' (1.Logistics Research Center,Shanghai Maritime University,Shanghai 201306,China;2.MOE Key Laboratory of Advanced Con- trol and Optimization for Chemical Processes,East China University of Science and Technology,Shanghai 200237,China) Abstract:To avoid premature convergence,a teaching-learning-based optimization algorithm based on chaotic search and weighted learning(TLBO-CSWL)is introduced in this study.In the teaching phase,TLBO-CSWL does not only use the individuals obtained by weight learning to guide the population evolution,it also utilizes a normal random num- ber to replace the original uniform random number.In addition,TLBO-CSWL uses a logistics chaotic search strategy to improve its global search ability.Simulation results showed that TLBO-CSWL outperformed other compared al- gorithms in terms of overall performance.Finally,the proposed algorithm was employed to solve two Nash equilibrium problems of non-cooperative game,and satisfactory results were obtained. Keywords:teaching-learning-based optimization;weight learning:heuristic algorithm;chaotic search;global optimiza- tion:evolutionary computation:non-cooperative game:Nash equilibrium 近几十年来,博弈论得到了许多研究人员的 关注,逐渐成为了经济学中的标准分析工具之 一,并且在经济学、军事科学和其他社会科学中 收稿日期:2017-05-15.网络出版日期:2017-07-28. 基金项目:国家自然科学基金项目(611603244):中央高校基本 得到了广泛的应用。在博弈问题中,非合作博弈 科研业务费重点科研基地创新基金项目(222201717006): 上海海事大学研究生创新基金资助项目(2017YCX020) 纳什均衡是其最核心的研究内容。1951年,Nash四 通信作者:范勤勤.E-mail:foreverl23fan@163.com. 在提出的“纳什定理”中揭示并证明了纳什均衡
DOI: 10.11992/tis.201705017 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20170728.1901.006.html 基于混沌搜索和权重学习的教与学优化算法及其应用 柳缔西子1 ,范勤勤1,2,胡志华1 (1. 上海海事大学 物流研究中心,上海 201306; 2. 华东理工大学 化工过程先进控制和优化技术教育部重点实 验室,上海 200237) 摘 要:针对教与学优化算法容易陷入早熟收敛的问题,本研究提出了一种基于混沌搜索和权重学习的教与学 优化 (teaching-learning-based optimization algorithm based on chaotic search and weighted learning,TLBO-CSWL) 算 法。在 TLBO-CSWL 算法的教学阶段,不仅利用权重学习得到的个体来指引种群的进化,而且还使用正态分布 随机数来替代原有的均匀随机数。另外,TLBO-CSWL 还使用 Logistics 混沌搜索策略来提高其全局搜索能力。 仿真结果表明,TLBO-CSWL 的整体优化性能要好于其他所比较的算法。最后,将 TLBO-CSWL 用于求解非合 作博弈纳什均衡问题,获得满意的结果。 关键词:教与学优化;权重学习;启发式算法;混沌搜索;全局优化;进化计算;非合作博弈;纳什均衡 中图分类号:TP301.6 文献标志码:A 文章编号:1673−4785(2018)05−0818−11 中文引用格式:柳缔西子, 范勤勤, 胡志华. 基于混沌搜索和权重学习的教与学优化算法及其应用[J]. 智能系统学报, 2018, 13(5): 818–828. 英文引用格式:LIU Dixizi, FAN Qinqin, HU Zhihua. Teaching-learning-based optimization algorithm based on chaotic search and weighted learning and its application[J]. CAAI transactions on intelligent systems, 2018, 13(5): 818–828. Teaching-learning-based optimization algorithm based on chaotic search and weighted learning and its application LIU Dixizi1 ,FAN Qinqin1,2 ,HU Zhihua1 (1. Logistics Research Center, Shanghai Maritime University, Shanghai 201306, China; 2. MOE Key Laboratory of Advanced Control and Optimization for Chemical Processes, East China University of Science and Technology, Shanghai 200237, China) Abstract: To avoid premature convergence, a teaching-learning-based optimization algorithm based on chaotic search and weighted learning (TLBO-CSWL) is introduced in this study. In the teaching phase, TLBO-CSWL does not only use the individuals obtained by weight learning to guide the population evolution, it also utilizes a normal random number to replace the original uniform random number. In addition, TLBO-CSWL uses a logistics chaotic search strategy to improve its global search ability. Simulation results showed that TLBO-CSWL outperformed other compared algorithms in terms of overall performance. Finally, the proposed algorithm was employed to solve two Nash equilibrium problems of non-cooperative game, and satisfactory results were obtained. Keywords: teaching-learning-based optimization; weight learning; heuristic algorithm; chaotic search; global optimization; evolutionary computation; non-cooperative game; Nash equilibrium 近几十年来,博弈论得到了许多研究人员的 关注,逐渐成为了经济学中的标准分析工具之 一,并且在经济学、军事科学和其他社会科学中 得到了广泛的应用。在博弈问题中,非合作博弈 纳什均衡是其最核心的研究内容。1951 年,Nash[1] 在提出的“纳什定理”中揭示并证明了纳什均衡 收稿日期:2017−05−15. 网络出版日期:2017−07−28. 基金项目:国家自然科学基金项目 (611603244);中央高校基本 科研业务费重点科研基地创新基金项目 (222201717006); 上海海事大学研究生创新基金资助项目 (2017YCX020). 通信作者:范勤勤. E-mail: forever123fan@163.com. 第 13 卷第 5 期 智 能 系 统 学 报 Vol.13 No.5 2018 年 10 月 CAAI Transactions on Intelligent Systems Oct. 2018
第5期 柳缔西子,等:基于混沌搜索和权重学习的教与学优化算法及其应用 ·819· 解的存在,但是Nash并没有给出求解纳什均衡的 算法的寻优性能。 一般性方法。传统的求解方法如Lemke-Howson 为了能更进一步提高TLBO的搜索性能,本 算法)、牛顿算法、同伦算法等均存在一定 文提出一种基于混沌搜索和权重学习的教与学优 的局限性;特别是对于高维的博弈模型(如3维 化(TLBO-CSWL)算法。仿真结果表明,所提算 及以上的矩阵策略),传统算法的计算复杂求解成 法的整体优化性能明显优于其他所比较的算法。 本较高。除了传统的优化方法,许多学者还利用 最后,将改进的算法应用于非合作博弈纳什均衡 遗传算法、免疫算法、粒子群算法、蚁群算法网 问题的求解。 等启发式算法来求解博弈纳什均衡问题,这为 1预备知识 求解非合作博弈问题提供了一种新的有效途径和 方法。 1.1标准的教与学优化算法 教与学优化算法(teaching-learning-based op- 标准TLBO算法10主要包括两个阶段,教学 timization,TLBO)是Rao等.ol于2011年提出,它 阶段与学习阶段。 是一种模拟教师教学与学生学习的群体智能优化 1.1.1教学阶段 算法。由于该算法参数设置少、操作简便、寻优 X=(,2,…,D,i=1,2,…,NP,表示第i个 性能好,引起了国内外学者的重视。目前它已被 个体,其中,D为优化问题的维数,NP表示种群 成功应用于各个领域,如LQ控制器优化设计 NP 规模。种群的平均值表示为Xm=∑X,/NP,其中 热交换器优化设计)、人工神经网络优化11等。 ÷-1 当前适应度值最好的个体被选为教师,即teacher 一般来说,原始的TLBO算法容易出现“早熟 在教学阶段,每个个体基于教师与种群的平均值 收敛”的现象,从而易于陷人局部最优。为了提 之差进行学习。新的个体更新公式为 高TLBO算法的寻优性能,很多学者提出了改进 Xinew =Xiol+r(Kteacher-Tg.Xmean) (1) 算法。比如,Rao等I提出了ETLBO算法,该算 式中:X,oa表示第i个个体学习之前的个体;r 法将精英策略引入TLBO算法中,保留每代中的 为[0,1]之间的均匀随机数,表示学习步长;T 最优解,并随机对精英个体进行变异操作,其主 round[1+rand(0,1),取值1或2,表示教学因子。 要目的是提高算法的收敛速度和寻优精度;Yu 若X,ew的适应度值优于X,la,则更新个体;否则, 等提出了TLBO算法,该算法在TLBO算法中 不更新。 引入教学反馈阶段和差分算法中的交叉变异策 1.1.2学习阶段 略,并在算法后期加入混沌扰动机制;Zou等61 在TLBO算法的学习阶段中,个体的更新公 提出了DGSTLBO算法,该算法在教学阶段引入 式为 动态分组教学策略,在学习阶段加入量子行为策 X2ew=Xpou+r…(X。-X),f(Xp)<f(X) (2) 略,以增加种群的多样性和避免算法早熟收敛; Xp.new =Xpold+r.(X:-Xp),f(Xi)<f(X) Chen等提出了VTTLBO算法,该算法将种群的 式中:pH,p,1∈(1,2,…,NP):f(X)为适应度函数。 数量以先增后减的方式来进行动态调整。在种群 若X,ew的适应度值优于X2,oa,则更新个体;否 数量增加阶段利用高斯分布生成个体,并在减少 则,不更新。 阶段进行相同个体的去重操作,其主要目的是减 1.2混沌映射 少计算成本以及增强算法的收敛精度和速度。 混沌是指确定性动力学系统产生的一种不可 Wu等I提出了NIWTLBO算法,在该算法中,利 预测的、类似随机性的运动,最显著的特点是初 用非线性惯性权重因子来控制个体的学习速率, 值敏感性。混沌模型不仅具有随机性、初值敏感 同时使用动态惯性权重因子代替原有随机数,仿 性,同时还有一个很重要的性质是遍历性。由于 真结果表明此改进策略提高了算法的收敛速率和 混沌序列是遍历的,它已被越来越多地应用到智 寻优性能。Shahbeig等提出了TLBO-PSO算 能优化算法中。其主要被用来初始化种群20,以 法,该算法将改进的变异模糊自适应的P$O算法 及能够对个体进行随机次数的扰动使其跳出局部 与TLBO算法进行结合,目的在于提高算法的寻 最优),从而在个体周围进行遍历搜索。借鉴文 优精度从而解决多目标优化问题。上述研究结果 献[21]中的混沌扰动策略,所提算法利用Logist- 均表明,将改进策略引入TLBO算法中可以提高 ics搜索策略来对个体进行更新,公式为
解的存在,但是 Nash 并没有给出求解纳什均衡的 一般性方法。传统的求解方法如 Lemke-Howson 算法[ 2 ] 、牛顿算法[ 3 ] 、同伦算法[ 4 ]等均存在一定 的局限性;特别是对于高维的博弈模型 (如 3 维 及以上的矩阵策略),传统算法的计算复杂求解成 本较高。除了传统的优化方法,许多学者还利用 遗传算法[5] 、免疫算法[6] 、粒子群算法[7] 、蚁群算法[8] 等启发式算法来求解博弈纳什均衡问题,这为 求解非合作博弈问题提供了一种新的有效途径和 方法。 教与学优化算法 (teaching-learning-based optimization,TLBO) 是 Rao 等 [9-10]于 2011 年提出,它 是一种模拟教师教学与学生学习的群体智能优化 算法。由于该算法参数设置少、操作简便、寻优 性能好,引起了国内外学者的重视。目前它已被 成功应用于各个领域,如 LQR 控制器优化设计[11] 、 热交换器优化设计[12] 、人工神经网络优化[13]等。 一般来说,原始的 TLBO 算法容易出现“早熟 收敛”的现象,从而易于陷入局部最优。为了提 高 TLBO 算法的寻优性能,很多学者提出了改进 算法。比如,Rao 等 [14]提出了 ETLBO 算法,该算 法将精英策略引入 TLBO 算法中,保留每代中的 最优解,并随机对精英个体进行变异操作,其主 要目的是提高算法的收敛速度和寻优精度;Yu 等 [15]提出了 ITLBO 算法,该算法在 TLBO 算法中 引入教学反馈阶段和差分算法中的交叉变异策 略,并在算法后期加入混沌扰动机制;Zou 等 [16] 提出了 DGSTLBO 算法,该算法在教学阶段引入 动态分组教学策略,在学习阶段加入量子行为策 略,以增加种群的多样性和避免算法早熟收敛; Chen 等 [17]提出了 VTTLBO 算法,该算法将种群的 数量以先增后减的方式来进行动态调整。在种群 数量增加阶段利用高斯分布生成个体,并在减少 阶段进行相同个体的去重操作,其主要目的是减 少计算成本以及增强算法的收敛精度和速度。 Wu 等 [18]提出了 NIWTLBO 算法,在该算法中,利 用非线性惯性权重因子来控制个体的学习速率, 同时使用动态惯性权重因子代替原有随机数,仿 真结果表明此改进策略提高了算法的收敛速率和 寻优性能。Shahbeig 等 [19]提出了 TLBO-PSO 算 法,该算法将改进的变异模糊自适应的 PSO 算法 与 TLBO 算法进行结合,目的在于提高算法的寻 优精度从而解决多目标优化问题。上述研究结果 均表明,将改进策略引入 TLBO 算法中可以提高 算法的寻优性能。 为了能更进一步提高 TLBO 的搜索性能,本 文提出一种基于混沌搜索和权重学习的教与学优 化 (TLBO-CSWL) 算法。仿真结果表明,所提算 法的整体优化性能明显优于其他所比较的算法。 最后,将改进的算法应用于非合作博弈纳什均衡 问题的求解。 1 预备知识 1.1 标准的教与学优化算法 标准 TLBO 算法[9-10]主要包括两个阶段,教学 阶段与学习阶段。 1.1.1 教学阶段 Xi = (xi,1, xi,2,··· , xi,D),i = 1,2,··· ,NP Xmean = ∑NP i=1 Xi/NP ,表示第 i 个 个体,其中,D 为优化问题的维数,NP 表示种群 规模。种群的平均值表示为 ,其中 当前适应度值最好的个体被选为教师,即 Xteacher。 在教学阶段,每个个体基于教师与种群的平均值 之差进行学习。新的个体更新公式为 Xi,new = Xi,old +r·(Xteacher −TF · Xmean) (1) 式中:Xi, ol d 表示第 i 个个体学习之前的个体;r 为[0, 1]之间的均匀随机数,表示学习步长;TF= round[1+rand(0, 1)],取值 1 或 2,表示教学因子。 若 Xi, new 的适应度值优于 Xi, old,则更新个体;否则, 不更新。 1.1.2 学习阶段 在 TLBO 算法的学习阶段中,个体的更新公 式为 Xp,new = Xp,old +r· ( Xp − Xl ) , f ( Xp ) < f (Xl) Xp,new = Xp,old +r· ( Xl − Xp ) , f (Xl) < f ( Xp ) (2) 式中:p≠l, p, l ∈ (1,2,··· ,NP) ;f (X) 为适应度函数。 若 Xp, new 的适应度值优于 Xp, old,则更新个体;否 则,不更新。 1.2 混沌映射 混沌是指确定性动力学系统产生的一种不可 预测的、类似随机性的运动,最显著的特点是初 值敏感性。混沌模型不仅具有随机性、初值敏感 性,同时还有一个很重要的性质是遍历性。由于 混沌序列是遍历的,它已被越来越多地应用到智 能优化算法中。其主要被用来初始化种群[20] ,以 及能够对个体进行随机次数的扰动使其跳出局部 最优[21] ,从而在个体周围进行遍历搜索。借鉴文 献[21]中的混沌扰动策略,所提算法利用 Logistics 搜索策略来对个体进行更新,公式为 第 5 期 柳缔西子,等:基于混沌搜索和权重学习的教与学优化算法及其应用 ·819·
·820· 智能系统学报 第13卷 xew=Xld'l-(1-xold) (3) 的均匀随机数,然后根据式(2)对个体进行更新。 式中:xoa和xew分别表示混沌映射之前和混沌映 4)混沌搜索:利用2.2部分随机对个体进行 射之后的变量,x∈[0,1:μ∈[0,4]为控制参数,当 混沌扰动操作,并更新个体。 μ=4时,Logistics映射将处于完全混沌状态。 5)判定程序是否达到最大评价次数,若没有 达到,则转至2);如达到,则执行6)。 2基于混沌搜索和权重学习的教与 6)输出最优解。 学优化算法 3仿真测试 2.1权重学习 在原始的TLBO算法中,教学阶段主要是使 为验证TLBO-CSWL算法的有效性,本文选 用当前最佳个体来指导种群进化,这将会造成算 取了文献[17刀中的18个测试函数,其中f~5为单 法陷入局部最优。因此,本文提出一种权重学习 峰函数,6一io为多峰函数,~g为旋转函数。改 的策略,基于个体适应度值产生一个可以代表种 进算法分别与jDE21、SaDE21、PS0 wFIPS24 群适应度水平的综合个体Xegh,并且引导其他 CLPSO21、TLBO9-,1o、ETLBO4、VTTLBO714等算 个体向其学习。这可以缓解算法“早熟”现象的 法进行对比。根据文献[17]的设定,最大的函数 发生。 评价次数均为50000。对于每个测试函数,所有 1)计算种群的最大适应度值及每个个体的 算法均独立运行30次。为了保证结论的可靠性, 权重 采用Friedman2、Dunn27、Holm和Hochberg2检 fmax =max(f(X;)) (4) 验来对结果进行统计分析,其中,显著水平设定 If (Xi)-fmaxl w:= (5) 为5%。 NP v)-a 3.1TLBO-CSWL算法与其他算法的比较 3.1.1与其他算法在10维测试上的比较 2)计算加权平均个体 在该实验中,所有算法的种群规模设定为 NP j=1,2,…,D 30,仿真结果如表1所示。由表1可知,TLB0- Xweight.j= (6) CSWL在函数f、、6、A、f6、f、f2、fi4、fis、fm上均 3)改进后的教学阶段更新公式为 有很好的寻优效果,性能明显优于其他所比较算 Xinew =Xiold +r(Xeacher -TgXmean)+ (7) 法。但在函数、、f、fs上,所有其他算法的寻 r(Xweight-Xiold) 优性能都略优于TLBO-CSWL算法,其主要原因 式中r=N0.5,0.2)。若Xew的适应度值优于X 有两个方面:1)虽然所提算法使用正态分布和权 则更新个体;否则,不更新。 重学习来提高原始TLBO的搜索效率,但在某种 2.2混沌搜索 为了提高TLBO算法的全局搜索能力,将混 程度上却降低了算法的全局搜索能力;2)每种算 法都有自身的寻优特性,到目前为止,没有一种 沌搜索策略加入到该算法中。混沌搜索的执行步 骤如下: 算法能够在所有的测试函数上都能表现得最好, 1)对种群中的所有个体进行适应度值降序排 因此,所提算法在某些测试函数上表现的差,也 列(最小化问题): 符合没有免费午餐定理2。而对于其余测试函 2)随机取出一个排名前10的个体; 数,TLBO-CSWL所获得的结果与所比较算法中 3)利用式(3)对选择的个体进行混沌扰动,产 获得的最好结果相同。同时,利用非参数的统计 生混沌个体chaos; 方法来对实验结果进行分析,所得结果见表2、3 4)若Xhao的适应度值优于X,则更新个体; 所示。从表2可知,TLBO-CSWL算法的整体性 否则,不更新。 能是最好的。从表3可以看出,所提算法的整体 2.3TLBO-CSWL算法的实现步骤 性能要显著好于PSOwFIPS算法和CLPSO算 1)初始化:设定种群大小NP,维数D,最大评 法。另外,虽然TLBO-CSWL的整体性能在统计 价次数,初始化种群。 意义上没有显著好于SaDE、ETLBO、TLBO、 2)教学阶段:根据式(⑦)对个体进行更新。 jDE、VTTLBO,但是从结果来看,所提算法的整 3)学习阶段:利用正态分布随机数代替式(2) 体性能优于其他算法
xnew = xold · µ ·(1− xold) (3) µ µ 式中:xold 和 xnew 分别表示混沌映射之前和混沌映 射之后的变量,x∈[0, 1]; ∈[0, 4]为控制参数,当 =4 时,Logistics 映射将处于完全混沌状态。 2 基于混沌搜索和权重学习的教与 学优化算法 2.1 权重学习 在原始的 TLBO 算法中,教学阶段主要是使 用当前最佳个体来指导种群进化,这将会造成算 法陷入局部最优。因此,本文提出一种权重学习 的策略,基于个体适应度值产生一个可以代表种 群适应度水平的综合个体 Xweight,并且引导其他 个体向其学习。这可以缓解算法“早熟”现象的 发生。 1) 计算种群的最大适应度值及每个个体的 权重 fmax = max(f (Xi)) (4) wi = | f (Xi)− fmax| ∑NP i=1 | f (Xi)− fmax| (5) 2) 计算加权平均个体 xweight, j = ∑NP i=1 wi×xi, j , j = 1,2,··· ,D (6) 3) 改进后的教学阶段更新公式为 Xi,new =Xi,old +r·(Xteacher −TF · Xmean)+ r· ( Xweight − Xi,old) (7) 式中 r =N(0.5, 0.2)。若 Xi, new 的适应度值优于 Xi, old, 则更新个体;否则,不更新。 2.2 混沌搜索 为了提高 TLBO 算法的全局搜索能力,将混 沌搜索策略加入到该算法中。混沌搜索的执行步 骤如下: 1) 对种群中的所有个体进行适应度值降序排 列 (最小化问题); 2) 随机取出一个排名前 10 的个体; 3) 利用式 (3) 对选择的个体进行混沌扰动,产 生混沌个体 Xchaos; 4) 若 Xchaos 的适应度值优于 Xi,则更新个体; 否则,不更新。 2.3 TLBO-CSWL 算法的实现步骤 1) 初始化:设定种群大小 NP,维数 D,最大评 价次数,初始化种群。 2) 教学阶段:根据式 (7) 对个体进行更新。 3) 学习阶段:利用正态分布随机数代替式 (2) 的均匀随机数,然后根据式 (2) 对个体进行更新。 4) 混沌搜索:利用 2.2 部分随机对个体进行 混沌扰动操作,并更新个体。 5) 判定程序是否达到最大评价次数,若没有 达到,则转至 2);如达到,则执行 6)。 6) 输出最优解。 3 仿真测试 为验证 TLBO-CSWL 算法的有效性,本文选 取了文献[17]中的 18 个测试函数,其中 f1~f5 为单 峰函数,f6~f10 为多峰函数,f11~f18 为旋转函数。改 进算法分别与 jDE[22] 、SaDE[23] 、PSOwFIPS[24] 、 CLPSO[25] 、TLBO[9-10] 、ETLBO[14] 、VTTLBO[17]等算 法进行对比。根据文献[17]的设定, 最大的函数 评价次数均为 50 000。对于每个测试函数,所有 算法均独立运行 30 次。为了保证结论的可靠性, 采用 Friedman[26] 、Dunn[27] 、Holm 和 Hochberg[28]检 验来对结果进行统计分析,其中,显著水平设定 为 5%。 3.1 TLBO-CSWL 算法与其他算法的比较 3.1.1 与其他算法在 10 维测试上的比较 在该实验中,所有算法的种群规模设定为 30,仿真结果如表 1 所示。由表 1 可知,TLBOCSWL 在函数 f1、f2、f3、f4、f6、f11、f12、f14、f15、f17 上均 有很好的寻优效果,性能明显优于其他所比较算 法。但在函数 f5、f10、f13、f18 上,所有其他算法的寻 优性能都略优于 TLBO-CSWL 算法,其主要原因 有两个方面:1) 虽然所提算法使用正态分布和权 重学习来提高原始 TLBO 的搜索效率,但在某种 程度上却降低了算法的全局搜索能力;2) 每种算 法都有自身的寻优特性,到目前为止,没有一种 算法能够在所有的测试函数上都能表现得最好, 因此,所提算法在某些测试函数上表现的差,也 符合没有免费午餐定理[29]。而对于其余测试函 数,TLBO-CSWL 所获得的结果与所比较算法中 获得的最好结果相同。同时,利用非参数的统计 方法来对实验结果进行分析,所得结果见表 2、3 所示。从表 2 可知,TLBO-CSWL 算法的整体性 能是最好的。从表 3 可以看出,所提算法的整体 性能要显著好于 PSOwFIPS 算法和 CLPSO 算 法。另外,虽然 TLBO-CSWL 的整体性能在统计 意义上没有显著好于 SaDE、ETLBO、TLBO、 jDE、VTTLBO,但是从结果来看,所提算法的整 体性能优于其他算法。 ·820· 智 能 系 统 学 报 第 13 卷
第5期 柳缔西子,等:基于混沌搜索和权重学习的教与学优化算法及其应用 ·821· 表110维仿真测试结果 Table 1 Experimental results on 10D 函数结果 jDE SaDE PSOwFIPS CLPSO TLBO ETLBO VTTLBO TLBO-CSWL 平均值 1.31x106 1.35x1071 3.98×1016 1.09x1018 3.29×10184 2.84x101661 3.56x10269 0.00 标准差 1.58×106 2.02×1071 6.09x106 1.50x1018 3.08×1018s 4.27x10167 0.00 0.00 平均值1.14×1021 1.89x1019 6.19x10 5.37×10 2.56x102 3.22x1079 3.50×10130 0.00 标准差 1.52×10213.54×10192.15x106 1.38×10 5.58x1082 5.07x109 5.05×10130 0.00 平均值697x108128×1072.18×107 2.59×1020 9.94x10187 6.50x10169 4.63×10 0.00 标准差1.39×1031 2.52×1074 1.39x1017 1.76×1020 1x10187 5.49x10170 0.00 0.00 平均值1.31×1016.65×10313.23×109 2.66×103 1.51×1089 2.94×1087 1.02×10139 0.00 fA 标准差1.30×1011,48×103 2.23x109 2.37×103 1.62x1089 3.10x1087 321x10139 0.00 平均值 5.14×107 2.62 4.51 2.45 4.96x10 1.46×10 1.13 8.06 5 标准差 9.47×107 1.50 7.17×102 1.00 4.21×10 1.38×10 5.06×10 0.24 平均值 3.36×105 3.28×1015 8.04×109 4.28×1010 3.43×10s 3.37x105 1.78×105 0.00 标准差 4.27x106 2.51×1016 4.33×109 2.89x1010 318×1015 1.05x1015 1.87x1015 0.00 平均值 0.00 0.00 1.89 2.76×109 3.06 3.02 1.09 0.00 标准差 0.00 0.00 1.03 3.94×109 1.52 1.86 1.52 0.00 平均值 0.00 0.00 4.24×104 6.33x102 0.00 0.00 0.00 0.00 标准差 0.00 0.00 6.60x10 6.08×102 0.00 0.00 0.00 0.00 平均值 0.00 1.48×103 7.59x102 4.15×103 6.48×103 2.42×102 3.82×108 0.00 标准差 0.00 3.31×103 5.19x102 5.68×103 9.71x103 3.69x102 1.21×10 0.00 平均值 1.27x1041.27x10 3.69x102 1.27×10 6.68×103 7.03x102 7.92×102 9.79x10 标准差 0.00 0.00 3.41×102 1.22x109 1.51×102 1.81x102 1.90x10 3.82×102 平均值5.63×1083.32×1046 8.42×1015 7.05x101 1.23×10173 2.21x10161 3.09×10279 0.00 标准差1.26×1077.42x1046 8.03x105 1.55x100 2.37x10174 3.04x10161 0.00 0.00 平均值 7.13x1031 6.80x106 2.88×109 1.78×103 4.18×1089 2.18×108% 1.50x10-138 0.00 2 标准差1.31×1005.81x106 9.64×1010 1.31×103 6.95x1089 4.82×1086 4.75×10138 0.00 平均值3.61×102 2.08 4.55 7 2.50 2.63 5.02 8.71 标准差 7.94×102 1.82 5.29×10 6.39 2.33 2.87 2.53 0.16 平均值 2.84×10l5 3.21x105 9.98×109 1.68×10 3.52x1015 3.49x105 2.13×105 0.00 fa 标准差1.59×105 2.38×1016 2.82×109 2.04×107 96.05×1016 327×1016 1.83x1015 0.00 平均值 3.59 5.78 9.31 6.11 4.38 3.00 2.55 0.00 fis 标准差 1.84 1.85 1.96 3.00 8.91×10 1.22 2.14 0.00 平均值 9.27x102 0.00 2.55×102 1.44×101 0.00 0.00 0.00 0.00 标准差 2.07×10 0.00 2.95×102 1.21x10 0.00 0.00 0.00 0.00 平均值 1.40x102 6.90×103 1.02x10 2.73×102 2.81x103 6.77×103 5.40x100 0.00 标准差9.09×103 6.83×103 3.85×102 2.35×102 6.29x103 5.15x103 1.70x109 0.00 平均值 1.27×104 3.59×102 2.81×102 2.32×102 5.58×10 5.69×10 7.77×102 1.37x103 标准差 0.00 3.54×102 1.91×102 1.04×102 2.76×102 2.63×10 3.05x102 2.26×103
表 1 10 维仿真测试结果 Table 1 Experimental results on 10D 函数 结果 jDE SaDE PSOwFIPS CLPSO TLBO ETLBO VTTLBO TLBO-CSWL f1 平均值 1.31×10-76 1.35×10-71 3.98×10-16 1.09×10-18 3.29×10-184 2.84×10-1661 3.56×10-269 0.00 标准差 1.58×10-76 2.02×10-71 6.09×10-16 1.50×10-18 3.08×10-185 4.27×10-167 0.00 0.00 f2 平均值 1.14×10-21 1.89×10-19 6.19×10-6 5.37×10-1 2.56×10-82 3.22×10-79 3.50×10-130 0.00 标准差 1.52×10-21 3.54×10-19 2.15×10-6 1.38×10-1 5.58×10-82 5.07×10-79 5.05×10-130 0.00 f3 平均值 6.97×10-78 1.28×10-74 2.18×10-17 2.59×10-20 9.94×10-187 6.50×10-169 4.63×10-1 0.00 标准差 1.39×10-31 2.52×10-74 1.39×10-17 1.76×10-20 1×10-187 5.49×10-170 0.00 0.00 f4 平均值 1.31×10-31 6.65×10-31 3.23×10-9 2.66×10-3 1.51×10-89 2.94×10-87 1.02×10-139 0.00 标准差 1.30×10-31 1.48×10-31 2.23×10-9 2.37×10-3 1.62×10-89 3.10×10-87 3.21×10-139 0.00 f5 平均值 5.14×10-7 2.62 4.51 2.45 4.96×10-1 1.46×10-1 1.13 8.06 标准差 9.47×10-7 1.50 7.17×10-2 1.00 4.21×10-1 1.38×10-1 5.06×10-1 0.24 f6 平均值 3.36×10-15 3.28×10-15 8.04×10-9 4.28×10-10 3.43×10-15 3.37×10-15 1.78×10-15 0.00 标准差 4.27×10-16 2.51×10-16 4.33×10-9 2.89×10-10 3.18×10-15 1.05×10-15 1.87×10-15 0.00 f7 平均值 0.00 0.00 1.89 2.76×10-9 3.06 3.02 1.09 0.00 标准差 0.00 0.00 1.03 3.94×10-9 1.52 1.86 1.52 0.00 f8 平均值 0.00 0.00 4.24×10-4 6.33×10-12 0.00 0.00 0.00 0.00 标准差 0.00 0.00 6.60×10-4 6.08×10-12 0.00 0.00 0.00 0.00 f9 平均值 0.00 1.48×10-3 7.59×10-2 4.15×10-3 6.48×10-3 2.42×10-2 3.82×10-8 0.00 标准差 0.00 3.31×10-3 5.19×10-2 5.68×10-3 9.71×10-3 3.69×10-2 1.21×10-7 0.00 f10 平均值 1.27×10-4 1.27×10-4 3.69×10-2 1.27×10-4 6.68×10-3 7.03×102 7.92×102 9.79×102 标准差 0.00 0.00 3.41×10-2 1.22×10-9 1.51×102 1.81×102 1.90×102 3.82×102 f11 平均值 5.63×10-58 3.32×10-46 8.42×10-15 7.05×10-11 1.23×10-173 2.21×10-161 3.09×10-279 0.00 标准差 1.26×10-57 7.42×10-46 8.03×10-15 1.55×10-10 2.37×10-174 3.04×10-161 0.00 0.00 f12 平均值 7.13×10-31 6.80×10-46 2.88×10-9 1.78×10-3 4.18×10-89 2.18×10-86 1.50×10-138 0.00 标准差 1.31×10-30 5.81×10-36 9.64×10-10 1.31×10-3 6.95×10-89 4.82×10-86 4.75×10-138 0.00 f13 平均值 3.61×10-2 2.08 4.55 7 2.50 2.63 5.02 8.71 标准差 7.94×10-2 1.82 5.29×10-1 6.39 2.33 2.87 2.53 0.16 f14 平均值 2.84×10-15 3.21×10-15 9.98×10-9 1.68×10-7 3.52×10-15 3.49×10-15 2.13×10-15 0.00 标准差 1.59×10-15 2.38×10-16 2.82×10-9 2.04×10-7 96.05×10-16 3.27×10-16 1.83×10-15 0.00 f15 平均值 3.59 5.78 9.31 6.11 4.38 3.00 2.55 0.00 标准差 1.84 1.85 1.96 3.00 8.91×10-1 1.22 2.14 0.00 f16 平均值 9.27×10-2 0.00 2.55×10-2 1.44×10-1 0.00 0.00 0.00 0.00 标准差 2.07×10-1 0.00 2.95×10-2 1.21×10-1 0.00 0.00 0.00 0.00 f17 平均值 1.40×10-2 6.90×10-3 1.02×10-1 2.73×10-2 2.81×10-3 6.77×10-3 5.40×10-10 0.00 标准差 9.09×10-3 6.83×10-3 3.85×10-2 2.35×10-2 6.29×10-3 5.15×10-3 1.70×10-9 0.00 f18 平均值 1.27×10-4 3.59×102 2.81×102 2.32×102 5.58×102 5.69×102 7.77×102 1.37×103 标准差 0.00 3.54×102 1.91×102 1.04×102 2.76×102 2.63×102 3.05×102 2.26×103 第 5 期 柳缔西子,等:基于混沌搜索和权重学习的教与学优化算法及其应用 ·821·
·822· 智能系统学报 第13卷 表2 Friedman测试在10维函数上得到的排序 于TLBO-CSWL。对于函数fio,从结果来看, Table 2 Ranking obtained by Friedman's test on 10D TLBO及其改进算法的性能比改进的差分进化算 算法 排序 法差,这主要是由算法的本身搜索特性所决定 TLBO-CSWL 2.8889 的。对于函数fi,虽然TLBO-CSWL的性能比 jDE、SaDE和PSOwFIPS差,但比CLPSO和 VTTLBO 3.2500 TLBO及其改进算法要好。对于函数g,TLBO- iDE 3.7222 CSWL的性能表现要比其他所比较算法差,其主 TLBO 4.0833 要原因可能是所提方法虽然可以加快TLBO的收 ETLBO 4.4167 敛速度,但也损失了算法一部分全局搜索的能 SaDE 4.4167 力。在其余测试函数中,TLBO-CSWL的寻优结 CLPSO 6.3333 果与所比较算法中获得的最好的结果相同。统计 PSOwFIPS 6.8889 分析结果见表5和表6。由表5可知,本文所提出 的TLBO-CSWL算法与其他算法相比具有优越的 3.1.2与其他算法在30维测试上的比较 整体性能。由表6可知,TLBO-CSWL算法的性 在该实验中,所有算法的种群规模设定为 能要显著性优于PSOwFIPS算法和CLPSO算 40。仿真结果见表4,从表4可以看出本文算法 法。此外,虽然TLBO-CSWL的寻优性能在统计 获得的平均结果在f、、万、f4、6、f方、fi、2、i4、 学意义上没有显著性地优于其他比较算法,但是 f5上均明显优于其他所比较算法。对于函数, 结合以上分析可知,TLBO-CSWL算法在解决 除了CLPSO外,其他比较算法的整体性能都要好 18个测试函数问题上整体表现得最好。 表3I0维测试结果Bonferroni-.Dunn、Holm以及Hochberg检验的p-Values Table 3 p-Values obtained by Bonferroni-Dunn's,Holm's,and Hochberg's procedures on experimental results with 10D 算法 未调整p Bonferroni-Dunn p Holm p Hochberg p PSOwFIPS 4.8990 9.63×106 6.73×106 6.74×106 6.74×106 CLPSO 4.2186 2.46×105 1.72×104 1.48×10 1.48×10 SaDE 1.8711 6.13x102 0.4293 0.3066 0.2453 ETLBO 1.8711 6.13×102 0.4293 0.3066 0.2453 TLBO 1.4629 0.1435 1.0000 0.4305 0.4305 jDE 1.0206 0.3074 1.0000 0.6149 0.6149 VTTLBO 0.4423 0.6583 1.0000 0.6583 0.6583 表430维仿真测试结果 Table 4 Experimental results on 30D 函数 结果 iDE SaDE PSOwFIPS CLPSO TLBO ETLBO VTTLBO TLBO-CSWL 平均值 1.95x1022 3.84×1023 1.43 1.94×10 4.04×1011 2.66×105 4.85×1018 0.00 标准差 2.76×102 2.15x1023 2.78×10 7.79×102 3.20x1011 1.84x105 1.06x10157 0.00 平均值 2.06×10 1.06×10 3.82×103 1.16×10 1.08×102 3.42×1022 124×102 1.27x10251 标准差 6.71 6.53 1.01×103 2.72×103 1.43x102 4.72×102 1.79×1032 0.00 平均值 3.92×1023 3.00x1024 2.17x10 2.25×102 5.38×1011 8.21×10% 2.50x101s8 0.00 5 标准差 3.86×1023 2.47×1024 7.69×10 6.43×103 3.43x1011 1.11×105 2.48×10158 0.00 平均值 1.35 1.50×101 1.11×102 2.30x102 5.11x10 1.92x101 8.06x1018 0.00 标准差 1.68 1.31×10 1.89×10 5.45×10 8.59x101 1.93×101 L.11x107 0.00 平均值 2.18×10 2.52×10 2.73×10 6.84×10 2.38×10 2.38×10 2.28×10 2.83×10 标准差2.59×10 1.36 2.99×10 2.84×10 7.01×10 8.57x10 4.23×10 0.44
3.1.2 与其他算法在 30 维测试上的比较 在该实验中,所有算法的种群规模设定为 40。仿真结果见表 4,从表 4 可以看出本文算法 获得的平均结果在 f1、f2、f3、f4、f6、f7、f11、f12、f14、 f15 上均明显优于其他所比较算法。对于函数 f5, 除了 CLPSO 外,其他比较算法的整体性能都要好 于 TLBO-CSWL。对于函数 f 1 0,从结果来看, TLBO 及其改进算法的性能比改进的差分进化算 法差,这主要是由算法的本身搜索特性所决定 的。对于函数 f13,虽然 TLBO-CSWL 的性能比 jDE、SaDE 和 PSOwFIPS 差,但比 CLPSO 和 TLBO 及其改进算法要好。对于函数 f18,TLBOCSWL 的性能表现要比其他所比较算法差,其主 要原因可能是所提方法虽然可以加快 TLBO 的收 敛速度,但也损失了算法一部分全局搜索的能 力。在其余测试函数中,TLBO-CSWL 的寻优结 果与所比较算法中获得的最好的结果相同。统计 分析结果见表 5 和表 6。由表 5 可知,本文所提出 的 TLBO-CSWL 算法与其他算法相比具有优越的 整体性能。由表 6 可知,TLBO-CSWL 算法的性 能要显著性优于 PSOwFIPS 算法和 CLPSO 算 法。此外,虽然 TLBO-CSWL 的寻优性能在统计 学意义上没有显著性地优于其他比较算法,但是 结合以上分析可知,TLBO-CSWL 算法在解决 18 个测试函数问题上整体表现得最好。 表 2 Friedman 测试在 10 维函数上得到的排序 Table 2 Ranking obtained by Friedman’s test on 10D 算法 排序 TLBO-CSWL 2.888 9 VTTLBO 3.250 0 jDE 3.722 2 TLBO 4.083 3 ETLBO 4.416 7 SaDE 4.416 7 CLPSO 6.333 3 PSOwFIPS 6.888 9 表 3 10 维测试结果 Bonferroni-Dunn、Holm 以及 Hochberg 检验的 p-Values Table 3 p-Values obtained by Bonferroni-Dunn’s, Holm’s, and Hochberg’s procedures on experimental results with 10D 算法 z 未调整 p Bonferroni-Dunn p Holm p Hochberg p PSOwFIPS 4.899 0 9.63×10-6 6.73×10-6 6.74×10-6 6.74×10-6 CLPSO 4.218 6 2.46×10-5 1.72×10-4 1.48×10-4 1.48×10-4 SaDE 1.871 1 6.13×10-2 0.429 3 0.306 6 0.245 3 ETLBO 1.871 1 6.13×10-2 0.429 3 0.306 6 0.245 3 TLBO 1.462 9 0.143 5 1.000 0 0.430 5 0.430 5 jDE 1.020 6 0.307 4 1.000 0 0.614 9 0.614 9 VTTLBO 0.442 3 0.658 3 1.000 0 0.658 3 0.658 3 表 4 30 维仿真测试结果 Table 4 Experimental results on 30D 函数 结果 jDE SaDE PSOwFIPS CLPSO TLBO ETLBO VTTLBO TLBO-CSWL f1 平均值 1.95×10-22 3.84×10-23 1.43 1.94×10-1 4.04×10-111 2.66×10-95 4.85×10-158 0.00 标准差 2.76×10-22 2.15×10-23 2.78×10-1 7.79×10-2 3.20×10-111 1.84×10-95 1.06×10-157 0.00 f2 平均值 2.06×10 1.06×10 3.82×103 1.16×104 1.08×10-22 3.42×10-22 1.24×10-32 1.27×10-251 标准差 6.71 6.53 1.01×103 2.72×103 1.43×10-22 4.72×10-22 1.79×10-32 0.00 f3 平均值 3.92×10-23 3.00×10-24 2.17×10-1 2.25×10-2 5.38×10-111 8.21×10-96 2.50×10-158 0.00 标准差 3.86×10-23 2.47×10-24 7.69×10-2 6.43×10-3 3.43×10-111 1.11×10-95 2.48×10-158 0.00 f4 平均值 1.35 1.50×10-1 1.11×102 2.30×102 5.11×10-11 1.92×10-11 8.06×10-18 0.00 标准差 1.68 1.31×10-1 1.89×10 5.45×10 8.59×10-11 1.93×10-11 1.11×10-17 0.00 f5 平均值 2.18×10 2.52×10 2.73×10 6.84×10 2.38×10 2.38×10 2.28×10 2.83×10 标准差 2.59×10-1 1.36 2.99×10-1 2.84×10 7.01×10-1 8.57×10-1 4.23×10-1 0.44 ·822· 智 能 系 统 学 报 第 13 卷
第5期 柳缔西子,等:基于混沌搜索和权重学习的教与学优化算法及其应用 ·823· 续表4 函数结果 iDE SaDE PSOwFIPS CLPSO TLBO ETLBO VTTLBO TLBO-CSWL 平均值 2.82×10l2 1.30x102 5.21×10 7.13×10 3.55x1015 3.55×1015 3.55x105 9.47x1016 标准差1.77×102 8.26×1015 1.78×10 5.74×10 0.00 0.00 0.00 1.60x1015 平均值 2.24×10-9 5.53x101 1.23×102 2.91×10 1.17×10 1.22×10 1.25×10 0.00 标准差 4.15×109 7.55x101 1.57×10 4.77 3.71 9.07 7.27 0.00 平均值 3.16×10 6.56x10" 2.46 5.18×10 0.00 0.00 0.00 0.00 标准差5.07×10 8.87x10 7.11×10 6.83×102 0.00 0.00 0.00 0.00 平均值 0.00 0.00 8.92×10 2.68×10 0.00 0.00 0.00 0.00 标准差 0.00 0.00 5.53×102 4.38×102 0.00 0.00 0.00 0.00 平均值 2.37×10 3.82×10 4.99x103 1.72x103 4.29×10 4.55×103 4.70×10 4.56×10 标准差 5.30×10 1.99x100 5.50x102 3.21×102 9.40×10 7.81×102 4.22×102 1.03x103 平均值 2.57×106 1.21x10 7.91×10 1.37 1.56x10106 1.25×102 2.58x10158 0.00 标准差 5.75×106 2.54×10 6.74×10 5.16×10 3.33×1016 1.37×102 5.31x10153 0.00 平均值6.79x10 1.51x101 1.13×102 2.27x102 3.24×102 6.28×101 1.99x1017 0.00 标准差6.36×10 6.29×102 1.65×10 1.60×10 3.24×102 6.35×101 429x107 0.00 平均值2.42×10 2.74×10 2.83×10 5.61×10 5.10×10 5.50×10 7.05×10 2.88×10 标准差 1.03 2.04 5.57×10 1.63×10 2.82×10 2.95×10 2.56×10 0.11 平均值 7.24×102 1.36x102 5.96×10 2.68 3.55x10l5 3.55×10s 3.55x105 8.29x1016 4 标准差 3.21x102 9.25x103 1.55×10 1.40×10 0.00 0.00 0.00 1.53x105 平均值 6.18×10 9.63×10 1.52x102 1.10x102 2.17×10 1.36×10 1.41×10 0.00 标准差 1.29×10 1.50×10 1.53×10 1.14×10 1.64×10 7.85 5.55 0.00 平均值 2.20 9.96×103 5.03 1.38×10 0.00 0.00 0.00 0.00 h6 标准差 4.19 2.18×102 6.56×10 1.21 0.00 0.00 0.00 0.00 平均值 2.46x103 7.98x1013 9.34×10 3.64×10 1.15x10 0.00 0.00 0.00 7 标准差 5.51x103 1.26x102 6.89×102 1.05x10 2.57x103 0.00 0.00 0.00 平均值 3.49x103 4.66×103 5.86×103 4.34×103 4.53×10 4.78×10 4.70x103 7.59x10 ∫8 标准差2.98×102 6.74×102 4.95×102 2.33×102 6.01×101 1.09x10 1.04×10 4.68×102 3.2TLBO-CSWL算法分析 表5 Friedman测试在30维函数上得到的排序 为了验证所提算法的有效性,利用18个30 Table 5 Ranking obtained by Friedman's test on 30D 维测试函数来对TLBO-CSWL和它的变种算法 算法 排序 TLBO-CSWL-1(使用均匀随机数)、TLBO-CSWL TLBO-CSWL 2.5278 2(没有混沌搜索)进行测试。其中,种群规模设定 为40,最大评价次数50000。针对每个测试函 VTTLBO 3.3056 数,每个算法均独立运行30次。同时,利用Fried- TLBO 3.4444 man、Bonfeeroni-Dunn、Holm以及Hochberg检验 ETLBO 3.7222 等非参数的统计方法对结果进行统计分析,其中 SaDE 4.4167 显著性水平设定为5%。 jDE 4.4722 3.2.1与变种算法TLB0-CSWL-1的比较 CLPSO 6.9444 为了验证策略正态随机数的有效性,将对 TLBO-CSWL-1与TLBO-CSWL进行仿真测试。 PSOwFIPS 7.1667 结果见表7。由表7可知,TLBO-CSWL算法所得
3.2 TLBO-CSWL 算法分析 为了验证所提算法的有效性,利用 18 个 30 维测试函数来对 TLBO-CSWL 和它的变种算法 TLBO-CSWL-1(使用均匀随机数)、TLBO-CSWL- 2(没有混沌搜索) 进行测试。其中,种群规模设定 为 40,最大评价次数 50 000。针对每个测试函 数,每个算法均独立运行 30 次。同时,利用 Friedman、Bonfeeroni-Dunn、Holm 以及 Hochberg 检验 等非参数的统计方法对结果进行统计分析,其中 显著性水平设定为 5%。 3.2.1 与变种算法 TLBO-CSWL-1 的比较 为了验证策略正态随机数的有效性,将对 TLBO-CSWL-1 与 TLBO-CSWL 进行仿真测试。 结果见表 7。由表 7 可知,TLBO-CSWL 算法所得 续表 4 函数 结果 jDE SaDE PSOwFIPS CLPSO TLBO ETLBO VTTLBO TLBO-CSWL f6 平均值 2.82×10-12 1.30×10-12 5.21×10-1 7.13×10-1 3.55×10-15 3.55×10-15 3.55×10-15 9.47×10-16 标准差 1.77×10-12 8.26×10-13 1.78×10-1 5.74×10-1 0.00 0.00 0.00 1.60×10-15 f7 平均值 2.24×10-9 5.53×10-1 1.23×102 2.91×10 1.17×10 1.22×10 1.25×10 0.00 标准差 4.15×10-9 7.55×10-1 1.57×10 4.77 3.71 9.07 7.27 0.00 f8 平均值 3.16×10-1 6.56×10-11 2.46 5.18×10-1 0.00 0.00 0.00 0.00 标准差 5.07×10-1 8.87×10-11 7.11×10-1 6.83×10-2 0.00 0.00 0.00 0.00 f9 平均值 0.00 0.00 8.92×10-1 2.68×10-1 0.00 0.00 0.00 0.00 标准差 0.00 0.00 5.53×10-2 4.38×10-2 0.00 0.00 0.00 0.00 f10 平均值 2.37×10 3.82×10-4 4.99×103 1.72×103 4.29×103 4.55×103 4.70×103 4.56×103 标准差 5.30×10 1.99×10-10 5.50×102 3.21×102 9.40×102 7.81×102 4.22×102 1.03×103 f11 平均值 2.57×10-6 1.21×10-4 7.91×10-1 1.37 1.56×10-106 1.25×10-92 2.58×10-153 0.00 标准差 5.75×10-6 2.54×10-4 6.74×10-1 5.16×10-1 3.33×10-106 1.37×10-92 5.31×10-153 0.00 f12 平均值 6.79×10-1 1.51×10-1 1.13×102 2.27×102 3.24×10-12 6.28×10-11 1.99×10-17 0.00 标准差 6.36×10-1 6.29×10-2 1.65×10 1.60×10 3.24×10-12 6.35×10-11 4.29×10-17 0.00 f13 平均值 2.42×10 2.74×10 2.83×10 5.61×10 5.10×10 5.50×10 7.05×10 2.88×10 标准差 1.03 2.04 5.57×10-1 1.63×10 2.82×10 2.95×10 2.56×10 0.11 f14 平均值 7.24×10-12 1.36×10-12 5.96×10-1 2.68 3.55×10-15 3.55×10-15 3.55×10-15 8.29×10-16 标准差 3.21×10-12 9.25×10-13 1.55×10-1 1.40×10-1 0.00 0.00 0.00 1.53×10-15 f15 平均值 6.18×10 9.63×10 1.52×102 1.10×102 2.17×10 1.36×10 1.41×10 0.00 标准差 1.29×10 1.50×10 1.53×10 1.14×10 1.64×10 7.85 5.55 0.00 f16 平均值 2.20 9.96×10-3 5.03 1.38×10 0.00 0.00 0.00 0.00 标准差 4.19 2.18×10-2 6.56×10-1 1.21 0.00 0.00 0.00 0.00 f17 平均值 2.46×10-3 7.98×10-13 9.34×10-1 3.64×10-1 1.15×10-3 0.00 0.00 0.00 标准差 5.51×10-3 1.26×10-12 6.89×10-2 1.05×10-1 2.57×10-3 0.00 0.00 0.00 f18 平均值 3.49×103 4.66×103 5.86×103 4.34×103 4.53×103 4.78×103 4.70×103 7.59×103 标准差 2.98×102 6.74×102 4.95×102 2.33×102 6.01×102 1.09×103 1.04×103 4.68×102 表 5 Friedman 测试在 30 维函数上得到的排序 Table 5 Ranking obtained by Friedman’s test on 30D 算法 排序 TLBO-CSWL 2.527 8 VTTLBO 3.305 6 TLBO 3.444 4 ETLBO 3.722 2 SaDE 4.416 7 jDE 4.472 2 CLPSO 6.944 4 PSOwFIPS 7.166 7 第 5 期 柳缔西子,等:基于混沌搜索和权重学习的教与学优化算法及其应用 ·823·
·824· 智能系统学报 第13卷 到的平均结果在五、6、fo、fi4和fs上要比TLBO- 存在显著性差异,但是从Friedman测试所得到的 CSWL-1好,而对于其余的测试函数,两者结果相 排序结果来看(见图1),TLBO-CSWL的整体性能 同;这说明TLBO-CSWL算法具有更好的寻优性 要好于TLBO-CSWL-1。以上统计分析结果表明, 能。统计分析结果见表8,由表8可知TLBO- 利用正态分布产生随机数替代原有均匀随机数的 CSWL和TLBO-CSWL-1在统计学意义上虽然不 策略对于提升TLBO算法的性能是有效的。 表630维测试结果Bonferroni-.Dunn、Holm以及Hochberg检验的p-Values Table 6 p-Values obtained by Bonferroni-Dunn's,Holm's,and Hochberg's procedures on experimental results with 30D 算法 未调整p Bonferroni-Dunn p Holm p Hochberg p PSOwFIPS 5.6815 1.34×108 9.35×108 9.35×10 9.35×108 CLPSO 5.4093 6.33×108 4.43x107 3.80x107 3.79x107 iDE 2.3814 1.72×102 0.1207 8.62×102 8.28×102 SaDE 2.3134 2.07x102 0.1449 8.62×102 8.28×10 ETLBO 1.4629 0.1435 1.0000 0.4305 0.3408 TLBO 1.1227 0.2616 1.0000 0.5231 0.3408 VTTLBO 0.9526 0.3408 1.0000 0.5231 0.3408 表7TLBO-CSWL-1、TLBO-CSWL-2与TLBO-CSWL算法的30维仿真测试结果 Table 7 Comparison of TLBO-CSWL-1,TLBO-CSWL-2,and TLBO-CSWL with experimental results on 30D 函数结果 TLBO-CSWL-1 TLBO-CSWL-2 TLBO-CSWL 函数结果 TLBO-CSWL-1 TLBO-CSWL-2 TLBO-CSWL 平均值 0.00 0.00 0.00 平均值 4.77×10 8.60x10 4.56×10 io 标准差 0.00 0.00 0.00 标准差 7.01×102 8.35×10 1.03×103 平均值 1.93×10157 4.52x1020 1.27x10251 平均值 0.00 0.00 0.00 标准差 1.06×10156 0.00 0.00 标准差 0.00 0.00 0.00 平均值 0.00 0.00 0.00 平均值 0.00 0.00 0.00 i2 标准差 0.00 0.00 0.00 标准差 0.00 0.00 0.00 平均值 0.00 0.00 0.00 平均值 2.88×10 2.89×10 2.88×10 标准差 0.00 0.00 0.00 标准差 0.18 0.03 0.11 平均值 2.73×10 2.88×10 2.83×10 平均值 1.53x105 1.78×101s 8.29x1016 标准差 0.69 0.09 0.44 标准差 1.79x1015 1.81x1015 1.53x10-5 平均值 1.07x105 9.47×10-16 9.47x10-6 平均值 0.00 0.00 0.00 标准差 1.66×1015 1.60x105 1.60x105 s 标准差 0.00 0.00 0.00 平均值 0.00 4.64 0.00 平均值 0.00 0.00 0.00 S 116 标准差 0.00 1.15×10 0.00 标准差 0.00 0.00 0.00 平均值 0.00 0.00 0.00 平均值 0.00 0.00 0.00 f 标准差 0.00 0.00 0.00 标准差 0.00 0.00 0.00 平均值 0.00 0.00 0.00 平均值 7.78×10 9.02×10 7.59x10 hs 标准差 0.00 0.00 0.00 标准差 5.49×102 5.53×102 4.68×102
到的平均结果在 f2、f6、f10、f14 和 f18 上要比 TLBOCSWL-1 好,而对于其余的测试函数,两者结果相 同;这说明 TLBO-CSWL 算法具有更好的寻优性 能。统计分析结果见表 8,由表 8 可知 TLBOCSWL 和 TLBO-CSWL-1 在统计学意义上虽然不 存在显著性差异,但是从 Friedman 测试所得到的 排序结果来看 (见图 1),TLBO-CSWL 的整体性能 要好于 TLBO-CSWL-1。以上统计分析结果表明, 利用正态分布产生随机数替代原有均匀随机数的 策略对于提升 TLBO 算法的性能是有效的。 表 6 30 维测试结果 Bonferroni-Dunn、Holm 以及 Hochberg 检验的 p-Values Table 6 p-Values obtained by Bonferroni-Dunn’s, Holm’s, and Hochberg’s procedures on experimental results with 30D 算法 z 未调整 p Bonferroni-Dunn p Holm p Hochberg p PSOwFIPS 5.681 5 1.34×10-8 9.35×10-8 9.35×10-8 9.35×10-8 CLPSO 5.409 3 6.33×10-8 4.43×10-7 3.80×10-7 3.79×10-7 jDE 2.381 4 1.72×10-2 0.120 7 8.62×10-2 8.28×10-2 SaDE 2.313 4 2.07×10-2 0.144 9 8.62×10-2 8.28×10-2 ETLBO 1.462 9 0.143 5 1.000 0 0.430 5 0.340 8 TLBO 1.122 7 0.261 6 1.000 0 0.523 1 0.340 8 VTTLBO 0.952 6 0.340 8 1.000 0 0.523 1 0.340 8 表 7 TLBO-CSWL-1、TLBO-CSWL-2 与 TLBO-CSWL 算法的 30 维仿真测试结果 Table 7 Comparison of TLBO-CSWL-1, TLBO-CSWL-2, and TLBO-CSWL with experimental results on 30D 函数 结果 TLBO-CSWL-1 TLBO-CSWL-2 TLBO-CSWL 函数 结果 TLBO-CSWL-1 TLBO-CSWL-2 TLBO-CSWL f1 平均值 0.00 0.00 0.00 f10 平均值 4.77×103 8.60×103 4.56×103 标准差 0.00 0.00 0.00 标准差 7.01×102 8.35×102 1.03×103 f2 平均值 1.93×10-157 4.52×10-220 1.27×10-251 f11 平均值 0.00 0.00 0.00 标准差 1.06×10-156 0.00 0.00 标准差 0.00 0.00 0.00 f3 平均值 0.00 0.00 0.00 f12 平均值 0.00 0.00 0.00 标准差 0.00 0.00 0.00 标准差 0.00 0.00 0.00 f4 平均值 0.00 0.00 0.00 f13 平均值 2.88×10 2.89×10 2.88×10 标准差 0.00 0.00 0.00 标准差 0.18 0.03 0.11 f5 平均值 2.73×10 2.88×10 2.83×10 f14 平均值 1.53×10-15 1.78×10-15 8.29×10-16 标准差 0.69 0.09 0.44 标准差 1.79×10-15 1.81×10-15 1.53×10-15 f6 平均值 1.07×10-15 9.47×10-16 9.47×10-16 f15 平均值 0.00 0.00 0.00 标准差 1.66×10-15 1.60×10-15 1.60×10-15 标准差 0.00 0.00 0.00 f7 平均值 0.00 4.64 0.00 f16 平均值 0.00 0.00 0.00 标准差 0.00 1.15×10 0.00 标准差 0.00 0.00 0.00 f8 平均值 0.00 0.00 0.00 f17 平均值 0.00 0.00 0.00 标准差 0.00 0.00 0.00 标准差 0.00 0.00 0.00 f9 平均值 0.00 0.00 0.00 f18 平均值 7.78×103 9.02×103 7.59×103 标准差 0.00 0.00 0.00 标准差 5.49×102 5.53×102 4.68×102 ·824· 智 能 系 统 学 报 第 13 卷
第5期 柳缔西子,等:基于混沌搜索和权重学习的教与学优化算法及其应用 ·825· 表8 Bonferroni-Dunn、Holm以及Hochberg检验的p-Values(TLBO-CSWL-l) Table 8 p-Values obtained by Bonferroni-Dunn's,Holm's,and Hochberg's procedures(TLBO-CSWL-1) 算法 2 未调整p Bonferroni-Dunn p Holm p Hochberg p TLBO-CSWL-1 0.9428 0.3458 0.3458 0.3458 0.3458 2.0 1.6111 真测试。结果如表7所示。从表7可以看出所提 g1.5 1.3889 1.0 出的TLBO-CSWL算法在左、5、6、、fio、f、4和 带0.5 g上的寻优结果要比TLBO-CSWL-2好,而在其 0 TLBO-CSWL TLBO-CSWL-1 余测试函数上,两者的寻优结果相同;以上表明 算法 TLBO-CSWL算法的性能要好于TLBO-CSWL 图1 Friedman测试排序结果(TLBO-CSWL-1) 2算法。统计分析结果见表9,由表9可知TLBO- Fig.1 Ranking obtained by Friedman's test(TLBO- CSWL和TLBO-CSWL-2在统计学意义上不存在 CSWL-1) 显著性差异。但是,从图2的Friedman测试所得 到的排序结果来看,与TLBO-CSWL-2相比, 3.2.2与变种算法TLBO-CSWL-2的比较 TLBO-CSWL具有更好的整体性能。以上统计分 本文对不加混沌搜索的TLBO-CSWL-2和 析表明,混沌搜索策略对于提升TLBO算法的性 TLBO-CSWL在同样的18个测试函数上进行仿 能是有效的。 表9 Bonferroni-Dunn、Holm以及Hochberg检验的p-Values(TLBO-CSWL-2) Table 9 p-Values obtained by Bonferroni-Dunn's,Holm's,and Hochberg's procedures(TLBO-CSWL-2) 算法 未调整p Bonferroni-Dunn p Holm p Hochberg p TLBO-CSWL-2 1.8856 0.0593 0.0593 0.0593 0.0593 2.0 解的充分必要条件,即 1.7222 15 1.2778 xAyT≥xAyT,Vx 1.0 xByT≥xByT,y (8) 0.5 算法中的每一个个体的取值表示所有局中人 0 TLBO-CSWL TLBO-CSWL-2 的混合策略,则双矩阵博弈问题=(化,y)的适应度 算法 函数可以表示为 图2 Friedman测试排序结果(TLBO-CsWL-2) Fig.2 Ranking obtained by Friedman's test(TLBO- f()=max(AyT-xAy).0+ CSWL-2) (9) 4在非合作博弈问题中的应用 maxmax(xB,-xByT).0 0或m 式(9)中,A,表示Amxm的第i行,B,表示 在本实验中,将所提算法应用于非合作博弈 Bnxn的第j列。 纳什均衡问题的求解。 根据纳什均衡的定义和性质可知,混合局 4.1博弈问题的描述 势x=(x,y)为双矩阵博弈问题的一个纳什均衡 N人有限非合作博弈纳什均衡问题,主要是 解的充分必要条件为:存在x=(x,y),使得 求解一种混合策略使得博弈双方均基于一定的概 z))=0;且对于任意的z女,都有f(z>0。 率来选择自己的每一个纯策略,使得博弈双方的 4.2案例研究 利益均最大化,此时博弈模型处于稳定的状态。 本文选取2个双矩阵博弈问题0训。 参考文献[7)中的问题描述,对于2人有限非合作 例1博弈模型1,了=(x,yA1,B1),支付矩 博弈问题:设局中人1的混合策略为x=(x,2,…,xmb 阵为 局中人2的混合策略为y=yy2,…y)。Am×m 2 Bmxm分别为局中人1和局中人2的支付矩阵,则 B (10) 局中人1和局中人2的期望支付分别为xAy和 201 02 1 xBy。(x,y)为双矩阵博弈问题的一个纳什均衡 例2博弈模型2,T2≡(2,2;A2,B2),支付矩
3.2.2 与变种算法 TLBO-CSWL-2 的比较 本文对不加混沌搜索的 TLBO-CSWL-2 和 TLBO-CSWL 在同样的 18 个测试函数上进行仿 真测试。结果如表 7 所示。从表 7 可以看出所提 出的 TLBO-CSWL 算法在 f2、f5、f6、f7、f10、f13、f14 和 f18 上的寻优结果要比 TLBO-CSWL-2 好,而在其 余测试函数上,两者的寻优结果相同;以上表明 TLBO-CSWL 算法的性能要好于 TLBO-CSWL- 2 算法。统计分析结果见表 9,由表 9 可知 TLBOCSWL 和 TLBO-CSWL-2 在统计学意义上不存在 显著性差异。但是,从图 2 的 Friedman 测试所得 到的排序结果来看,与 TLBO-CSWL-2 相比, TLBO-CSWL 具有更好的整体性能。以上统计分 析表明,混沌搜索策略对于提升 TLBO 算法的性 能是有效的。 4 在非合作博弈问题中的应用 在本实验中,将所提算法应用于非合作博弈 纳什均衡问题的求解。 4.1 博弈问题的描述 x = (x1, x2,··· , xm) y = (y1, y2,··· , yn) xAyT xByT x ∗ y ∗ N 人有限非合作博弈纳什均衡问题,主要是 求解一种混合策略使得博弈双方均基于一定的概 率来选择自己的每一个纯策略,使得博弈双方的 利益均最大化,此时博弈模型处于稳定的状态。 参考文献[7]中的问题描述,对于 2 人有限非合作 博弈问题:设局中人 1 的混合策略为 , 局 中 人 2 的混合策略为 。 A m × n , Bm×n 分别为局中人 1 和局中人 2 的支付矩阵,则 局中人 1 和局中人 2 的期望支付分别为 和 。( , ) 为双矩阵博弈问题的一个纳什均衡 解的充分必要条件,即 { x ∗Ay ∗T ⩾ xAy∗T , ∀x x ∗By∗T ⩾ xBy∗T , ∀y (8) 算法中的每一个个体的取值表示所有局中人 的混合策略,则双矩阵博弈问题 z=(x, y) 的适应度 函数可以表示为 f (z) =max{ max 0⩽i⩽n ( Aiy T − xAyT ) ,0 } + max{ max 0⩽j⩽m ( xBj − xByT ) ,0 } (9) 式 (9) 中 , Ai 表 示 A m × n 的 第 i 行 , Bj 表 示 Bm×n 的第 j 列。 z ∗ x ∗ y ∗ z ∗ x ∗ y ∗ z ∗ z z ∗ z 根据纳什均衡的定义和性质[1]可知,混合局 势 =( , ) 为双矩阵博弈问题的一个纳什均衡 解的充分必要条件为:存在 = ( , ) , 使 得 f( )=0;且对于任意的 ≠ ,都有 f ( )>0。 4.2 案例研究 本文选取 2 个双矩阵博弈问题[30-31]。 例 1 博弈模型 1, Γ1 ≡ (x1, y1; A1,B1) ,支付矩 阵为 A1 = 1 2 0 0 1 2 2 0 1 , B1 = 1 0 2 2 1 0 0 2 1 (10) 例 2 博弈模型 2, Γ2 ≡ (x2, y2; A2,B2) ,支付矩 表 8 Bonferroni-Dunn、Holm 以及 Hochberg 检验的 p-Values (TLBO-CSWL-1) Table 8 p-Values obtained by Bonferroni-Dunn’s, Holm’s, and Hochberg’s procedures (TLBO-CSWL-1) 算法 z 未调整 p Bonferroni-Dunn p Holm p Hochberg p TLBO-CSWL-1 0.942 8 0.345 8 0.345 8 0.345 8 0.345 8 表 9 Bonferroni-Dunn、Holm 以及 Hochberg 检验的 p-Values (TLBO-CSWL-2) Table 9 p-Values obtained by Bonferroni-Dunn’s, Holm’s, and Hochberg’s procedures (TLBO-CSWL-2) 算法 z 未调整 p Bonferroni-Dunn p Holm p Hochberg p TLBO-CSWL-2 1.885 6 0.059 3 0.059 3 0.059 3 0.059 3 1.388 9 1.611 1 0 0.5 1.0 1.5 2.0 TLBO-CSWL TLBO-CSWL-1 排序数值 算法 图 1 Friedman 测试排序结果 (TLBO-CSWL-1) Fig. 1 Ranking obtained by Friedman’s test(TLBOCSWL-1) 1.277 8 1.722 2 0 0.5 1.0 1.5 2.0 TLBO-CSWL TLBO-CSWL-2 排序数值 算法 图 2 Friedman 测试排序结果 (TLBO-CSWL-2) Fig. 2 Ranking obtained by Friedman’s test(TLBOCSWL-2) 第 5 期 柳缔西子,等:基于混沌搜索和权重学习的教与学优化算法及其应用 ·825·
·826· 智能系统学报 第13卷 阵为 TLBO-CSWL算法在2个博弈问题上的求解结果 045] 403 均优于jDE、SaDE、CLPSO、TLBO算法,说明 A2= 405, B2=043 (11) TLBO-CSWL算法在解决非合作博弈问题上表现 336 556 得最好。另外,对于博弈问题1和2,所有算法的 为了求解以上两个问题,选取jDE、SaDE、 最好结果见表11和表12。从表11可以看出,相 CLPSO、TLBO、TLBO-CSWL来对其进行求解。 对于其他算法,TLBO-CSWL算法能够得到更好的 对于所有的算法,种群大小均设定为40,最大的 纳什均衡解。同时对于博弈模型1,本文算法求 评价次数为2000,每个问题均独立运行30次。 解的适应度函数精度明显优于其他算法。另外, 并使用Wilcoxon秩和检验方法B2来对实验结果 从表12可以看出,TLBO-CSWL比其他算法能找 进行统计分析。 到更好的纳什均衡解,适应度函数的精度显著好 实验结果和统计分析结果见表10,其中,“+” 于其他所有算法,这说明TLBO-CSWL算法在计 表示所提算法优于其比较算法;“_”表示所提算法 算结果的精度比其他算法有了较大的改进。 差于其比较算法;“≈”表示TLBO-CSWL算法与 上述分析表明,将本文提出的TLBO-CSWL算 其他算法性能相似。从表10的统计结果可知, 法应用到非合作博弈问题,取得了较满意的结果。 表10所有算法在博弈问题上得到的结果 Table 10 Experimental results of all algorithms on game problems 函数 结果 iDE SaDE CLPSO TLBO TLBO-CSWL 平均值 3.47×10+ 4.31×103+ 5.93×102+ 1.69×103+ 1.56×103 标准差 1.81×103 1.52×103 2.96×102 1.59x103 3.70x103 平均值 6.65×10+ 1.00×103+ 1.24×102+ 3.24×106+ 3.86×1010 标准差 4.11×10- 4.31×10 6.72×102 2.9x106 3.28×1010 2 2 2 0 0 0 0 0 0 0 0 表11所有算法在博弈模型1上得到的最好结果 Table 11 The best experimental results of all algorithms on game problem 1 算法 局中人1混合策略 局中人2混合策略 适应度函数 jDE (0.3328.0.3338.0.3334) (0.3334,0.3332,0.3334) 8.52×10 SaDE (0.3327,0.3337,0.3336) (0.3334,0.3326,0.3340) 1.81x103 CLPSO (0.3270,0.3374,0.3356) (0.3350,0.3200,0.3451) 2.36x102 TLBO (0.3334.0.3333.0.3333) (0.3333,0.3333,0.3334) 2.64×10 TLBO-CSWL 0.3333,0.3333,0.3333) (0.3333,0.3333,0.3333) 1.90×106 表12所有算法在博弈模型2上得到的最好结果 Table 12 The best experimental results of all algorithms on game problem 2 算法 局中人1混合策略 局中人2混合策略 适应度函数 jDE (0.0000,0.0001,0.9999) (0.0000,0.0000,1.0000) 1.02×106 SaDE (0.0000,0.0001,0.9999) (0.0000,0.0001,0.9999) 3.48×10 CLPSO (0.0129,0.0001.0.9870) (0.0039,0.0134,0.9827) 3.03×102 TLBO (0.0000,0.0000,1.0000) (0.0000,0.0000,1.0000) 9.01x107 TLBO-CSWL (0.0000.0.0000.1.0000) (0.0000.0.0000.1.0000) 3.53×101
阵为 A2 = 0 4 5 4 0 5 3 3 6 , B2 = 4 0 3 0 4 3 5 5 6 (11) 为了求解以上两个问题,选取 jDE、SaDE、 CLPSO、TLBO、TLBO-CSWL 来对其进行求解。 对于所有的算法,种群大小均设定为 40,最大的 评价次数为 2 000,每个问题均独立运行 30 次。 并使用 Wilcoxon 秩和检验方法[32]来对实验结果 进行统计分析。 实验结果和统计分析结果见表 10,其中,“+” 表示所提算法优于其比较算法;“–”表示所提算法 差于其比较算法 ;“≈”表示 TLBO-CSWL 算法与 其他算法性能相似。从表 10的统计结果可知, TLBO-CSWL 算法在 2 个博弈问题上的求解结果 均优于 jDE、SaDE、CLPSO、TLBO 算法,说明 TLBO-CSWL 算法在解决非合作博弈问题上表现 得最好。另外,对于博弈问题 1 和 2,所有算法的 最好结果见表 11 和表 12。从表 11 可以看出,相 对于其他算法,TLBO-CSWL算法能够得到更好的 纳什均衡解。同时对于博弈模型 1,本文算法求 解的适应度函数精度明显优于其他算法。另外, 从表 12 可以看出,TLBO-CSWL比其他算法能找 到更好的纳什均衡解,适应度函数的精度显著好 于其他所有算法,这说明 TLBO-CSWL 算法在计 算结果的精度比其他算法有了较大的改进。 上述分析表明,将本文提出的 TLBO-CSWL 算 法应用到非合作博弈问题,取得了较满意的结果。 表 10 所有算法在博弈问题上得到的结果 Table 10 Experimental results of all algorithms on game problems 函数 结果 jDE SaDE CLPSO TLBO TLBO-CSWL 1 平均值 3.47×10–4 + 4.31×10–3 + 5.93×10–2 + 1.69×10–3 + 1.56×10–3 标准差 1.81×10–3 1.52×10–3 2.96×10–2 1.59×10–3 3.70×10–3 2 平均值 6.65×10–4 + 1.00×10–3 + 1.24×10–2 + 3.24×10–6 + 3.86×10–10 标准差 4.11×10–4 4.31×10–4 6.72×10–2 2.9×10–6 3.28×10–10 + 2 2 2 2 – 0 0 0 0 ≈ 0 0 0 0 表 11 所有算法在博弈模型 1 上得到的最好结果 Table 11 The best experimental results of all algorithms on game problem 1 算法 局中人 1 混合策略 局中人 2 混合策略 适应度函数 jDE (0.332 8, 0.333 8, 0.333 4) (0.333 4, 0.333 2, 0.333 4) 8.52×10–4 SaDE (0.332 7, 0.333 7, 0.333 6) (0.333 4, 0.332 6, 0.334 0) 1.81×10–3 CLPSO (0.327 0, 0.337 4, 0.335 6) (0.335 0, 0.320 0, 0.345 1) 2.36×10–2 TLBO (0.333 4, 0.333 3, 0.333 3) (0.333 3, 0.333 3, 0.333 4) 2.64×10–4 TLBO-CSWL (0.333 3, 0.333 3, 0.333 3) (0.333 3, 0.333 3, 0.333 3) 1.90×10–6 表 12 所有算法在博弈模型 2 上得到的最好结果 Table 12 The best experimental results of all algorithms on game problem 2 算法 局中人 1 混合策略 局中人 2 混合策略 适应度函数 jDE (0.000 0, 0.000 1, 0.999 9) (0.000 0, 0.000 0, 1.000 0) 1.02×10–6 SaDE (0.000 0, 0.000 1, 0.999 9) (0.000 0, 0.000 1, 0.999 9) 3.48×10–4 CLPSO (0.012 9, 0.000 1, 0.987 0) (0.003 9, 0.013 4, 0.982 7) 3.03×10–2 TLBO (0.000 0, 0.000 0, 1.000 0) (0.000 0, 0.000 0, 1.000 0) 9.01×10–7 TLBO-CSWL (0.000 0, 0.000 0, 1.000 0) (0.000 0, 0.000 0, 1.000 0) 3.53×10–11 ·826· 智 能 系 统 学 报 第 13 卷
第5期 柳缔西子,等:基于混沌搜索和权重学习的教与学优化算法及其应用 ·827· 5结束语 衡求解.计算机工程,2010,36(14):166-168,171 WANG Zhiyong,HAN Xu,XU Weisheng,et al.Nash 本文针对教与学优化算法容易早熟收敛的问 equilibrium solution based on improved ant colony al- 题,提出了一种基于混沌搜索和权重学习的教与 gorithm[J].Computer engineering,2010,36(14):166-168, 学优化(TLBO-CSWL)算法。在该算法中,利用 171. 当前种群的加权平均值来指导种群的进化,并且 [9]RAO R V,SAVSANI V J,VAKHARIA D P.Teaching- 使用正态分布随机数替代均匀随机数来提高原 learning-based optimization:an optimization method for 始TLBO算法的寻优性能:另外,将混沌搜索策略 continuous non-linear large scale problems[J].Information 加到所提算法中,以此来提高算法的全局搜索能 sciences.,2012,1831):1-15. 力。实验仿真结果表明,所提算法的整体性能在 [10]RAO R V,SAVSANI V J,VAKHARIA D P.Teaching- 所有比较算法中是最好的。同时,采用TLBO- learning-based optimization:a novel method for con- strained mechanical design optimization problems[J]. CSWL算法与其变种算法TLBO-CSWL-1、TLBO- Computer-aided design,2011,43(3):303-315. CSWL-2进行比较分析,仿真结果显示本文所提 [11]拓守恒,邓方安,雍龙泉.改进教与学优化算法的 出的改进策略对于提升TLBO算法的性能是有效 LQR控制器优化设计[J】.智能系统学报,2014,9(5): 的。最后,将TLBO-CSWL算法应用于求解非合 602-607 作博弈纳什均衡问题,其结果表明所提算法得到 TUO Shouheng,DENG Fang'an,YONG Longquan.Op- 的结果要好于其他算法。 timal design of a linear quadratic regulator(LQR)control- 参考文献: ler based on the modified teaching-learning-based optim- ization algorithm[J].CAAl transactions on intelligent sys- [1]NASH J.Non-cooperative games[J].Annals of mathemat- tems,2014,9(5):602-607 ics,1951,54(2):286-295. [12]RAO R V,PATEL V.Multi-objective optimization of [2]LEMKE C E.HOWSON J T JR.Equilibrium points of heat exchangers using a modified teaching-learning-based bimatrix games[J].Journal of the society for industrial and optimization algorithm[Jl.Applied mathematical model- applied mathematics,1964,12(2):413-423. ling,2013,37(3):1147-1162. [3]GOVINDAN S,WILSON R.A global Newton method to [13]WANG Lei,ZOU Feng,HEI Xinhong,et al.An im- compute Nash equilibria[J].Journal of economic theory, proved teaching-learning-based optimization with neigh- 2003,110(1)65-86 borhood search for applications of ANN[J].Neurocom- [4]HERINGS P JJ,PEETERS R.Homotopy methods to com- puting,2014,143:231-247. pute equilibria in game theory[J].Economic theory,2010, [14]RAO R V.PATEL V.An elitist teaching-learning-based 42(1):119-156. optimization algorithm for solving complex constrained [5]陈土俊,孙永广,吴宗鑫.一种求解NASH均衡解的遗传 optimization problems[J].International journal of indus- 算法[J.系统工程,2001,19(5):67-70. trial engineering computations,2012,3(4):535-560. CHEN Sijun,SUN Yongguang,WU Zongxin.A genetic [15]YU Kunjie,WANG Xin,WANG Zhenlei.An improved algorithm to acquire the nash equilibrium[J].Systems en- teaching-learning-based optimization algorithm for nu- gineering.2001,19(5:67-70 merical and engineering optimization problems[J].Journ- [6]邱中华,高洁,朱跃星.应用免疫算法求解博弈问题) al of intelligent manufacturing,2016,27(4):831-843. 系统工程学报,2006,21(4):398-404 [16]ZOU Feng,WANG Lei,HEI Xinhong,et al.Teaching- QIU Zhonghua,GAO Jie,ZHU Yuexing.Applying im- learning-based optimization with dynamic group strategy mune algorithm to solving game problem[J].Journal of for global optimization[J].Information sciences,2014. systems engineering,2006,21(4):398-404. 273:112-131 [7]贾文生,向淑文,杨剑锋,等.基于免疫粒子群算法的非 [17]CHEN Debao,LU Renquan,ZOU Feng,et al.Teaching- 合作博弈Nash均衡问题求解[J].计算机应用研究, learning-based optimization with variable-population 2012,291):28-31. scheme and its application for ANN and global optimiza- JIA Wensheng,YUAN Shuwen,YANG Jianfeng,et al. tion[J].Neurocomputing,2016,173:1096-1111. Solving nash equilibrium for N-persons'non-cooperative [18]WU Zongsheng,FU Weiping,XUE Ru.Nonlinear inertia game based on immune particle swarm algorithm[J].Ap- weighted teaching-learning-based optimization for solv- plication research of computers,2012,29(1):28-31. ing global optimization problem[J].Computational Intelli- [8]王志勇,韩旭,许维胜,等.基于改进蚁群算法的纳什均 gence and Neuroscience,2015,2015:1-15
5 结束语 本文针对教与学优化算法容易早熟收敛的问 题,提出了一种基于混沌搜索和权重学习的教与 学优化 (TLBO-CSWL) 算法。在该算法中,利用 当前种群的加权平均值来指导种群的进化,并且 使用正态分布随机数替代均匀随机数来提高原 始 TLBO 算法的寻优性能;另外,将混沌搜索策略 加到所提算法中,以此来提高算法的全局搜索能 力。实验仿真结果表明,所提算法的整体性能在 所有比较算法中是最好的。同时,采用 TLBOCSWL 算法与其变种算法 TLBO-CSWL-1、TLBOCSWL-2 进行比较分析,仿真结果显示本文所提 出的改进策略对于提升 TLBO 算法的性能是有效 的。最后,将 TLBO-CSWL 算法应用于求解非合 作博弈纳什均衡问题,其结果表明所提算法得到 的结果要好于其他算法。 参考文献: NASH J. Non-cooperative games[J]. Annals of mathematics, 1951, 54(2): 286–295. [1] LEMKE C E, HOWSON J T JR. Equilibrium points of bimatrix games[J]. Journal of the society for industrial and applied mathematics, 1964, 12(2): 413–423. [2] GOVINDAN S, WILSON R. A global Newton method to compute Nash equilibria[J]. Journal of economic theory, 2003, 110(1): 65–86. [3] HERINGS P J J, PEETERS R. Homotopy methods to compute equilibria in game theory[J]. Economic theory, 2010, 42(1): 119–156. [4] 陈士俊, 孙永广, 吴宗鑫. 一种求解 NASH 均衡解的遗传 算法[J]. 系统工程, 2001, 19(5): 67–70. CHEN Sijun, SUN Yongguang, WU Zongxin. A genetic algorithm to acquire the nash equilibrium[J]. Systems engineering, 2001, 19(5): 67–70. [5] 邱中华, 高洁, 朱跃星. 应用免疫算法求解博弈问题[J]. 系统工程学报, 2006, 21(4): 398–404. QIU Zhonghua, GAO Jie, ZHU Yuexing. Applying immune algorithm to solving game problem[J]. Journal of systems engineering, 2006, 21(4): 398–404. [6] 贾文生, 向淑文, 杨剑锋, 等. 基于免疫粒子群算法的非 合作博弈 Nash 均衡问题求解[J]. 计算机应用研究, 2012, 29(1): 28–31. JIA Wensheng, YUAN Shuwen, YANG Jianfeng, et al. Solving nash equilibrium for N-persons’ non-cooperative game based on immune particle swarm algorithm[J]. Application research of computers, 2012, 29(1): 28–31. [7] [8] 王志勇, 韩旭, 许维胜, 等. 基于改进蚁群算法的纳什均 衡求解[J]. 计算机工程, 2010, 36(14): 166–168, 171. WANG Zhiyong, HAN Xu, XU Weisheng, et al. Nash equilibrium solution based on improved ant colony algorithm[J]. Computer engineering, 2010, 36(14): 166–168, 171. RAO R V, SAVSANI V J, VAKHARIA D P. Teaching– learning-based optimization: an optimization method for continuous non-linear large scale problems[J]. Information sciences, 2012, 183(1): 1–15. [9] RAO R V, SAVSANI V J, VAKHARIA D P. Teaching– learning-based optimization: a novel method for constrained mechanical design optimization problems[J]. Computer-aided design, 2011, 43(3): 303–315. [10] 拓守恒, 邓方安, 雍龙泉. 改进教与学优化算法的 LQR 控制器优化设计[J]. 智能系统学报, 2014, 9(5): 602–607. TUO Shouheng, DENG Fang’an, YONG Longquan. Optimal design of a linear quadratic regulator (LQR) controller based on the modified teaching-learning-based optimization algorithm[J]. CAAI transactions on intelligent systems, 2014, 9(5): 602–607. [11] RAO R V, PATEL V. Multi-objective optimization of heat exchangers using a modified teaching-learning-based optimization algorithm[J]. Applied mathematical modelling, 2013, 37(3): 1147–1162. [12] WANG Lei, ZOU Feng, HEI Xinhong, et al. An improved teaching–learning-based optimization with neighborhood search for applications of ANN[J]. Neurocomputing, 2014, 143: 231–247. [13] RAO R V, PATEL V. An elitist teaching-learning-based optimization algorithm for solving complex constrained optimization problems[J]. International journal of industrial engineering computations, 2012, 3(4): 535–560. [14] YU Kunjie, WANG Xin, WANG Zhenlei. An improved teaching-learning-based optimization algorithm for numerical and engineering optimization problems[J]. Journal of intelligent manufacturing, 2016, 27(4): 831–843. [15] ZOU Feng, WANG Lei, HEI Xinhong, et al. Teaching– learning-based optimization with dynamic group strategy for global optimization[J]. Information sciences, 2014, 273: 112–131. [16] CHEN Debao, LU Renquan, ZOU Feng, et al. Teachinglearning-based optimization with variable-population scheme and its application for ANN and global optimization[J]. Neurocomputing, 2016, 173: 1096–1111. [17] WU Zongsheng, FU Weiping, XUE Ru. Nonlinear inertia weighted teaching-learning-based optimization for solving global optimization problem[J]. Computational Intelligence and Neuroscience, 2015, 2015: 1–15. [18] 第 5 期 柳缔西子,等:基于混沌搜索和权重学习的教与学优化算法及其应用 ·827·