750 工程科学学报,第43卷.第6期 群最优粒子的信息,同时还融入了相邻粒子信息 广,由于相关数学理论不够完备,与算法相关的收 Pan等提出了将认知学习部分删除,能够保证 敛性、稳定性、参数鲁棒性以及计算复杂度等研 算法的收敛以及有效学习. 究有待深入开展: 进化算法进行优化时,通常需要针对问题选 (2)动态环境评估机制的完善.更新过程中, 择和调整算法s]参数校正方面,Han等提出了 个体当前状态的反馈信息都将作为下次迭代如何 一种自适应飞行参数调节机制,利用多样性信息 实施的重要因素,这就要求能够客观、准确地对环 和种群速度信息,对全局探索和局部开发之间的 境状态进行估计,而单一的评价指标难以全面衡 关系进行平衡.该算法的新颖之处就在于能够结 量环境情况.因此,多指标融合的动态环境评价策 合解分布嫡同步完成飞行参数的调节以及全局最 略尚需进一步改进; 优粒子的选择.夏立荣等⑧引基于层次分析方法,设 (3)种群个体自学习、自组织能力的提高.作 计出一种进化因子,通过度量进化状态自适应调节 为一类元启发式算法,随机性有利于多样性却不 参数.Liu等s应用强化学习理论中的Q-Learning 利于收敛,而高速的收敛又容易导致早熟,难以保 方法,以目标空间中Pareto前沿的粒子数量、决策 证稳定的优化结果.为了削弱算法中不确定因素 空间中粒子间距为状态,以粒子群算法中3个主 的影响,获得高效、准确的优化效果,往往会对种 要参数一惯性权重系数和两个认知加速度系数 群中个体加以引导,而引导策略大多是人为规定 为动作,建立三维Q表,自适应调整算法参数 且基于主观偏好,缺乏客观性和有效性,因此,基 Hu等⑧通过改变参数来提高算法的鲁棒性,虽然 于机器学习、深度学习、强化学习等先进理论的 可以防止算法陷入局部最优,收敛精度也有所提 种群个体自学习、自组织能力的算法亟需进一步 高,但大量“新”变量的引入有可能会增加计算复 探究; 杂度86Dig等s7应用田口方法作为响应值来调 (4)自适应方法的拓展.优化过程中不同阶段 整参数.Tang等以保证收敛性能为参数选择原 对探索能力和挖掘能力的需求有所不同,不同多 则,以开发和挖掘的不同偏好为目标设计了自适 目标优化算法在收敛速度和多样性能方面的表现 应参数调节机制,并且讨论了参数对收敛性能的 也各有利弊.单一策略或固定模式的算法融合很 影响 难适用于所有优化问题.因此,为了促进算法对优 拓扑结构方面,Yue等提出的基于环形拓 化问题的适应性,基于进程估计和策略选择的自 扑和特殊拥挤距离的多目标粒子群优化算法,在 适应调整机制仍需不断优化 决策空间中,引入无需参数的环形拓扑结构帮助 形成稳定的小生境,有利于减少多样性损失.高海 参考文献 军与潘大志网采用星型拓扑结构,在收敛速度方 [1]He X M,Dong S H.Research on rush order insertion rescheduling 面表现出一定的优势.Zhang等对划分的子种 problem under hybrid flow shop with multi-objective and multi 群采用环形拓扑结构,有利于信息交互和保持多 constraint.ChinJEng,2019,41(11):1450 样性 (何小妹,董绍华.多目标多约束混合流水车间插单重调度问题 研究.工程科学学报,2019,41(11):1450) 4总结与展望 [2] Zadeh LA.Optimality and non-scalar-valued performance criteria. IEEE Trans Autom Control,1963,8(1):59 本文主要就多目标粒子群算法中最优粒子选 [3] Haimes YY,Lasdon L S,Wismer D A.On a bicriterion 择,多样性保持,收敛性提高,多样性与收敛性之 formulation of the problems of integrated system identification and 间的平衡,以及迭代公式、参数、拓扑结构等改进 system optimization.IEEE Trans Syst Man Cybern,1971,SMC. 措施进行了系统分析.近几年来,算法自身性能得 1(3):296 以提升,应用领域不断拓展,涌现出大量行之有 [4]Charnes A,Cooper WW,Ferguson R O.Optimal estimation of 效、独特新颖的先进成果.然而,随着信息科学和 executive compensation by linear programming.Manage Sci, 1955,1(2):138 计算技术的高速发展,多目标粒子群算法在优化 [5]Xuan G N,Cheng R W.Genetic Algorithm and Engineering 效果上仍具有一定的提升空间.今后的研究工作, Optimization.Beijing:Tsinghua University Press,2004 可以从以下几个方面开展: (玄光南,程润伟.遗传算法与工程优化.北京:清华大学出版 (1)多目标粒子群算法基础理论的研究.目前 社,2004) 的研究大多集中于算法性能改善以及应用范围推 [6]Tseng C H,Lu T W.Minimax multiobjective optimization in群最优粒子的信息,同时还融入了相邻粒子信息. Pan 等[51] 提出了将认知学习部分删除,能够保证 算法的收敛以及有效学习. 进化算法进行优化时,通常需要针对问题选 择和调整算法[81] . 参数校正方面,Han 等[82] 提出了 一种自适应飞行参数调节机制,利用多样性信息 和种群速度信息,对全局探索和局部开发之间的 关系进行平衡. 该算法的新颖之处就在于能够结 合解分布熵同步完成飞行参数的调节以及全局最 优粒子的选择. 夏立荣等[83] 基于层次分析方法,设 计出一种进化因子,通过度量进化状态自适应调节 参数. Liu 等[84] 应用强化学习理论中的 Q-Learning 方法,以目标空间中 Pareto 前沿的粒子数量、决策 空间中粒子间距为状态,以粒子群算法中 3 个主 要参数——惯性权重系数和两个认知加速度系数 为动作 ,建立三维 Q 表 ,自适应调整算法参数. Hu 等[85] 通过改变参数来提高算法的鲁棒性,虽然 可以防止算法陷入局部最优,收敛精度也有所提 高,但大量“新”变量的引入有可能会增加计算复 杂度[86] . Ding 等[87] 应用田口方法作为响应值来调 整参数. Tang 等[36] 以保证收敛性能为参数选择原 则,以开发和挖掘的不同偏好为目标设计了自适 应参数调节机制,并且讨论了参数对收敛性能的 影响. 拓扑结构方面,Yue 等[88] 提出的基于环形拓 扑和特殊拥挤距离的多目标粒子群优化算法,在 决策空间中,引入无需参数的环形拓扑结构帮助 形成稳定的小生境,有利于减少多样性损失. 高海 军与潘大志[89] 采用星型拓扑结构,在收敛速度方 面表现出一定的优势. Zhang 等[44] 对划分的子种 群采用环形拓扑结构,有利于信息交互和保持多 样性. 4 总结与展望 本文主要就多目标粒子群算法中最优粒子选 择,多样性保持,收敛性提高,多样性与收敛性之 间的平衡,以及迭代公式、参数、拓扑结构等改进 措施进行了系统分析. 近几年来,算法自身性能得 以提升,应用领域不断拓展,涌现出大量行之有 效、独特新颖的先进成果. 然而,随着信息科学和 计算技术的高速发展,多目标粒子群算法在优化 效果上仍具有一定的提升空间. 今后的研究工作, 可以从以下几个方面开展: (1)多目标粒子群算法基础理论的研究. 目前 的研究大多集中于算法性能改善以及应用范围推 广,由于相关数学理论不够完备,与算法相关的收 敛性、稳定性、参数鲁棒性以及计算复杂度等研 究有待深入开展; (2)动态环境评估机制的完善. 更新过程中, 个体当前状态的反馈信息都将作为下次迭代如何 实施的重要因素,这就要求能够客观、准确地对环 境状态进行估计,而单一的评价指标难以全面衡 量环境情况. 因此,多指标融合的动态环境评价策 略尚需进一步改进; (3)种群个体自学习、自组织能力的提高. 作 为一类元启发式算法,随机性有利于多样性却不 利于收敛,而高速的收敛又容易导致早熟,难以保 证稳定的优化结果. 为了削弱算法中不确定因素 的影响,获得高效、准确的优化效果,往往会对种 群中个体加以引导,而引导策略大多是人为规定 且基于主观偏好,缺乏客观性和有效性,因此,基 于机器学习、深度学习、强化学习等先进理论的 种群个体自学习、自组织能力的算法亟需进一步 探究; (4)自适应方法的拓展. 优化过程中不同阶段 对探索能力和挖掘能力的需求有所不同,不同多 目标优化算法在收敛速度和多样性能方面的表现 也各有利弊. 单一策略或固定模式的算法融合很 难适用于所有优化问题. 因此,为了促进算法对优 化问题的适应性,基于进程估计和策略选择的自 适应调整机制仍需不断优化. 参 考 文 献 He X M, Dong S H. Research on rush order insertion rescheduling problem under hybrid flow shop with multi-objective and multiconstraint. Chin J Eng, 2019, 41(11): 1450 (何小妹, 董绍华. 多目标多约束混合流水车间插单重调度问题 研究. 工程科学学报, 2019, 41(11):1450) [1] Zadeh L A. Optimality and non-scalar-valued performance criteria. IEEE Trans Autom Control, 1963, 8(1): 59 [2] Haimes Y Y, Lasdon L S, Wismer D A. On a bicriterion formulation of the problems of integrated system identification and system optimization. IEEE Trans Syst Man Cybern, 1971, SMC- 1(3): 296 [3] Charnes A, Cooper W W, Ferguson R O. Optimal estimation of executive compensation by linear programming. Manage Sci, 1955, 1(2): 138 [4] Xuan G N, Cheng R W. Genetic Algorithm and Engineering Optimization. Beijing: Tsinghua University Press, 2004 ( 玄光南, 程润伟. 遗传算法与工程优化. 北京: 清华大学出版 社, 2004) [5] [6] Tseng C H, Lu T W. Minimax multiobjective optimization in · 750 · 工程科学学报,第 43 卷,第 6 期