《工程科学学报》：演化博弈与资源配置综述

团购合买资源类别：文库，文档格式：PDF，文档页数：10，文件大小：795.68KB

工程科学学报 Chinese Journal of Engineering 演化博奔与资源配置综述张艳玲莫廷钰李松涛张妍李擎 A survey of evolutionary game and resource allocation ZHANG Yan-ling.MO Ting-yu,LI Song-tao,ZHANG Yan,LI Qing 引用本文：张艳玲，莫廷钰，李松涛，张妍，李擎.演化博弈与资源配置综述[J.工程科学学报，2022,44(3)：402-410.doi: 10.13374j.issn2095-9389.2020.10.26.002 ZHANG Yan-ling.MO Ting-yu,LI Song-tao,ZHANG Yan,LI Qing.A survey of evolutionary game and resource allocation[J]. Chinese Journal of Engineering,.2022,443:402-410.doi:10.13374j.issn2095-9389.2020.10.26.002 在线阅读View online::https://doi..org/10.13374.issn2095-9389.2020.10.26.002 您可能感兴趣的其他文章 Articles you may be interested in 5G超密集网络的能量效率研究综述 Survey of energy efficiency for 5G ultra-dense networks 工程科学学报.2019,41(8：968 https:doi.org10.13374.issn2095-9389.2019.08.002 C-RAN回传网络中下行资源调度策略 A downlink resource scheduling strategy for C-RAN backhaul network 工程科学学报.2018.40(5：629htps:/doi.org10.13374.issn2095-9389.2018.05.014 领域Q$与资源感知的物流服务动态优化组合方法 Domain QoS and resource-aware logistics web service dynamic optimal composition 工程科学学报.2018,40(7)：882 https::/1doi.org/10.13374.issn2095-9389.2018.07.015 复杂应力路径下裂隙泥岩渗透演化规律试验研究 Experimental study of the permeability evolution of fractured mudstone under complex stress paths 工程科学学报.2021,43(7)：903 https:ldoi.org10.13374j.issn2095-9389.2020.05.27.005 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报.2019.41(10：1229 https:oi.org10.13374j.issn2095-9389.2019.03.27.002 微生物技术在稀土资源利用中的研究进展 Overview of microbial technology in the utilization of rare earth resources 工程科学学报.2020,42(1：60 https:/1doi.org10.13374j.issn2095-9389.2019.09.12.003

演化博弈与资源配置综述张艳玲莫廷钰李松涛张妍李擎 A survey of evolutionary game and resource allocation ZHANG Yan-ling, MO Ting-yu, LI Song-tao, ZHANG Yan, LI Qing 引用本文: 张艳玲, 莫廷钰, 李松涛, 张妍, 李擎. 演化博弈与资源配置综述[J]. 工程科学学报, 2022, 44(3): 402-410. doi: 10.13374/j.issn2095-9389.2020.10.26.002 ZHANG Yan-ling, MO Ting-yu, LI Song-tao, ZHANG Yan, LI Qing. A survey of evolutionary game and resource allocation[J]. Chinese Journal of Engineering, 2022, 44(3): 402-410. doi: 10.13374/j.issn2095-9389.2020.10.26.002 在线阅读 View online: https://doi.org/10.13374/j.issn2095-9389.2020.10.26.002 您可能感兴趣的其他文章 Articles you may be interested in 5G超密集网络的能量效率研究综述 Survey of energy efficiency for 5G ultra-dense networks 工程科学学报. 2019, 41(8): 968 https://doi.org/10.13374/j.issn2095-9389.2019.08.002 C-RAN回传网络中下行资源调度策略 A downlink resource scheduling strategy for C-RAN backhaul network 工程科学学报. 2018, 40(5): 629 https://doi.org/10.13374/j.issn2095-9389.2018.05.014 领域QoS与资源感知的物流服务动态优化组合方法 Domain QoS and resource-aware logistics web service dynamic optimal composition 工程科学学报. 2018, 40(7): 882 https://doi.org/10.13374/j.issn2095-9389.2018.07.015 复杂应力路径下裂隙泥岩渗透演化规律试验研究 Experimental study of the permeability evolution of fractured mudstone under complex stress paths 工程科学学报. 2021, 43(7): 903 https://doi.org/10.13374/j.issn2095-9389.2020.05.27.005 深度神经网络模型压缩综述 A survey of model compression for deep neural networks 工程科学学报. 2019, 41(10): 1229 https://doi.org/10.13374/j.issn2095-9389.2019.03.27.002 微生物技术在稀土资源利用中的研究进展 Overview of microbial technology in the utilization of rare earth resources 工程科学学报. 2020, 42(1): 60 https://doi.org/10.13374/j.issn2095-9389.2019.09.12.003

工程科学学报.第44卷.第3期：402-410.2022年3月 Chinese Journal of Engineering,Vol.44,No.3:402-410,March 2022 https://doi.org/10.13374/j.issn2095-9389.2020.10.26.002;http://cje.ustb.edu.cn 演化博弈与资源配置综述张艳玲2)，莫廷钰，李松涛)，张妍，李擎，2四 1)北京科技大学自动化学院.北京1000832)工业过程知识自动化教育部重点实验室，北京100083 ☒通信作者，E-mail:liqing@ies.ustb.edu.cn 摘要复杂网络上集群行为的研究是多学科交叉的热点，行为学实验不仅证实了集群行为的普遍存在性，而且证实了利用演化论解释集群行为涌现的合理性.复杂网络上演化博弈理论已取得长足发展，特别是在两策略竞争理论分析方法上取得突破性进展.首先介绍了演化博弈框架下合作演化机制的相关研究，详细总结了近年来被广泛关注的个体异质性和环境反馈对于合作演化的影响研究：其次阐述了五种复杂网络上演化博弈的理论分析方法，包括最近提出的适用于任意网络结构和更新规则的溯祖随机游走理论：再次给出了基于最后通牒博弈模型的资源配置问题研究：最后总结了复杂网络最后通牒博弈所面临的挑战及未来发展趋势关键词复杂网络；演化；合作；最后通牒博弈；资源配置分类号TG142.71 A survey of evolutionary game and resource allocation ZHANG Yan-ling2,MO Ting-yu,LI Song-tao,ZHANG Yan,LI Qing 1)School of Automation and Electrical Engineering,University of Science and Technology Beijing,Beijing 100083,China 2)Key Laboratory of Knowledge Automation for Industrial Processes,Ministry of Education,Beijing 100083,China Corresponding author,E-mail:liging@ies.ustb.edu.cn ABSTRACT Evolutionary game theory involves multiple disciplinary sciences and has enormous scientific value and promising applicability.Collective behavior is an important topic of interdisciplinary study.Ethology has shown the ubiquity of collective behavior and has proven the rationality of evolutionary theory in explaining the emergence of collective behavior.The recent development of complex network theory offers a convenient framework for describing game interactions and competition relationships among individuals.The combination of evolutionary games and complex networks,particularly,evolutionary game theory in a complex network,has been attracting growing interest from different fields.It has undergone substantial development,especially in quantitative analysis of two-strategy competition.Under this framework,the complex network represents the population structure,and the game describes interactions between individuals.On the basis of the methodology from network science,stochastic process,and statistical physics,the framework mainly focuses on how population structures,individual behavior patterns,and interacting environments influence the emergence of collective behavior.In this paper,the mechanisms for the evolution of cooperation were given under the framework of evolutionary game,including kin selection,direct reciprocity,indirect reciprocity,network reciprocity,and group selection.Recently,the effects of individual heterogeneity and environmental feedback on cooperation had attracted growing interest. Next,five main theoretical methods were addressed for analyzing the evolutionary game in complex networks,including the- dominance rule,the coalescing theory,the pairwise approximation,the coalescing random walk theory,and the adaptive dynamics. Particularly,the recently proposed coalescing random walk theory is suitable for analyzing the dynamics of any network structure and any update rule.Then,the studies on the evolution of fairness in ultimatum games were presented,and reasonable resource allocation is 收稿日期：2020-10-26 基金项目：国家自然科学基金青年基金资助项目(61603036)

演化博弈与资源配置综述张艳玲1,2)，莫廷钰1)，李松涛1)，张妍1)，李擎1,2) 苣 1) 北京科技大学自动化学院，北京 100083 2) 工业过程知识自动化教育部重点实验室，北京 100083 苣通信作者， E-mail: liqing@ies.ustb.edu.cn 摘要复杂网络上集群行为的研究是多学科交叉的热点，行为学实验不仅证实了集群行为的普遍存在性，而且证实了利用演化论解释集群行为涌现的合理性. 复杂网络上演化博弈理论已取得长足发展，特别是在两策略竞争理论分析方法上取得突破性进展. 首先介绍了演化博弈框架下合作演化机制的相关研究，详细总结了近年来被广泛关注的个体异质性和环境反馈对于合作演化的影响研究；其次阐述了五种复杂网络上演化博弈的理论分析方法，包括最近提出的适用于任意网络结构和更新规则的溯祖随机游走理论；再次给出了基于最后通牒博弈模型的资源配置问题研究；最后总结了复杂网络最后通牒博弈所面临的挑战及未来发展趋势. 关键词复杂网络；演化；合作；最后通牒博弈；资源配置分类号 TG142.71 A survey of evolutionary game and resource allocation ZHANG Yan-ling1,2) ，MO Ting-yu1) ，LI Song-tao1) ，ZHANG Yan1) ，LI Qing1,2) 苣 1) School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing 100083, China 2) Key Laboratory of Knowledge Automation for Industrial Processes, Ministry of Education, Beijing 100083, China 苣 Corresponding author, E-mail: liqing@ies.ustb.edu.cn σ ABSTRACT Evolutionary game theory involves multiple disciplinary sciences and has enormous scientific value and promising applicability. Collective behavior is an important topic of interdisciplinary study. Ethology has shown the ubiquity of collective behavior and has proven the rationality of evolutionary theory in explaining the emergence of collective behavior. The recent development of complex network theory offers a convenient framework for describing game interactions and competition relationships among individuals. The combination of evolutionary games and complex networks, particularly, evolutionary game theory in a complex network, has been attracting growing interest from different fields. It has undergone substantial development, especially in quantitative analysis of two-strategy competition. Under this framework, the complex network represents the population structure, and the game describes interactions between individuals. On the basis of the methodology from network science, stochastic process, and statistical physics, the framework mainly focuses on how population structures, individual behavior patterns, and interacting environments influence the emergence of collective behavior. In this paper, the mechanisms for the evolution of cooperation were given under the framework of evolutionary game, including kin selection, direct reciprocity, indirect reciprocity, network reciprocity, and group selection. Recently, the effects of individual heterogeneity and environmental feedback on cooperation had attracted growing interest. Next, five main theoretical methods were addressed for analyzing the evolutionary game in complex networks, including the - dominance rule, the coalescing theory, the pairwise approximation, the coalescing random walk theory, and the adaptive dynamics. Particularly, the recently proposed coalescing random walk theory is suitable for analyzing the dynamics of any network structure and any update rule. Then, the studies on the evolution of fairness in ultimatum games were presented, and reasonable resource allocation is 收稿日期: 2020−10−26 基金项目: 国家自然科学基金青年基金资助项目（61603036）工程科学学报，第 44 卷，第 3 期：402−410，2022 年 3 月 Chinese Journal of Engineering, Vol. 44, No. 3: 402−410, March 2022 https://doi.org/10.13374/j.issn2095-9389.2020.10.26.002; http://cje.ustb.edu.cn

张艳玲等：演化博弈与资源配置综述 403· the key factor for social stability,economic development,and individual health.Finally,the challenges and further directions of studying ultimatum games in a complex network were summarized. KEY WORDS complex networks;evolution;cooperation;ultimatum game;resources allocation 20世纪末，复杂网络研究的兴起在国内外掀群体行为的统计学规律.最常采用的研究方式是起一股新的研究复杂性科学的热潮凹，而复杂网络计算机仿真，即利于计算机程序对动力学进行模本身也形成了一门新学科一一网络科学.复杂网拟.另一种重要但十分具有挑战性的研究方式络能够很好地刻画实际生物、社会和工业系统中是理论分析，即利用数学工具量化动力学6 所表现的社团结构、小世界特性、无标度特性等本文组织结构如下：第1部分简要介绍基于演网络拓扑.集群行为普遍存在于各类真实系统中，化博弈的合作演化机制研究现状：第2部分阐述如蚁群互助觅食、蜂群协同建巢、鸽群编队飞行、复杂网络上演化博弈的理论分析方法；第3部分鱼群涡旋游动和人类选举投票等.相应地，复杂网给出基于最后通牒博弈的公平偏好涌现机制的相络上集群行为的相关研究成为多学科交叉的热点关研究：第4部分总结本文的主要内容，并归纳了问题-列，主要聚焦以下三方面：(1)通过对动物和复杂网络上最后通牒博弈研究现阶段的不足和未人类进行大量行为学实验，证实集群行为的存在来的发展方问性；(2)以集群行为的存在作为前提假设，研究据 1 基于演化博弈的合作演化机制此所诱导的社会、经济和工程影响，或仿照集群行为设计控制律和智能算法；(3)将集群行为的存在演化博弈理论曾相当成功地解释了生物进化看作是需要证明的结论，即对集群行为如何从个过程中的某些现象，最为经典的早期工作是体的简单交互中涌现提供完整解释 1973年Smith和Price将其用来解释物的斗争行行为学证实了集群行为的普遍存在性，而经为，同时提出了演化稳定策略20之后，经济学、济学、社会学和统计物理学发现了集群行为存在社会学和统计物理学运用演化博弈论分析影响集的重要性.不仅要“知其然”，也要“知其所以然” 群行为形成的各类因素，获取了丰富且具有启发一个自然的问题是，集群行为从何而来，为什么能意义的研究成果1-2.近期，众多学者试图将控制够长期稳定存在？行为学实验有效支持了利用演论和演化博弈理论结合，希望借助一定的控制手化论解释集群行为涌现的合理性.以公平行为为段令群体行为演化到期望状态，从而实现更加有例加以阐述四：聚焦公平偏好神经学解释的实效的工程应用2s-0 验证明，人类的公平偏好具有生理基础：针对儿童被演化博弈论最为频繁研究的集群行为是合进行公平行为测试的研究表明，未成年儿童的公作行为IB1-)2006年，Nowak总结性地提出了五种平偏好会随着年龄的增长而上升，暗示人类的公有利于合作演化的机制B(图1)：(1)亲缘选择B5-询，平偏好在社会学习中不断演化进步：随着社会的通过具有亲缘和遗传关系的个体之间的关系来促不断进化，人类不断提升自身的公平偏好进合作，即个体更愿意与亲缘关系较近的对手合由行为学可见，复杂网络上演化博弈可被用作.(2)直接互惠7-3，在重复博弈中，个体当前阶来研究集群行为的涌现.此类研究往往利用复杂段的合作诱发对手在后续阶段的合作行为.(3)间网络对个体间交互方式进行数学建模3：边连接互惠B90,此时声望起关键作用，合作的个体具接博弈对象和模仿对象：而边的权重描述个体间备较高的声望，从而在接下来的博弈阶段更容易交互强度，量化个体被选为博弈对象或模仿对象获得他人的帮助.(4)网络互惠1-，复杂网络的的概率.同时利用经典博弈（例如最后通牒博连接关系令合作者“抱团取暖”而存活，背叛者无弈)的演化动力学对个体间决策范式进行数学建法再利用合作者而消亡.（⑤）群组选择)，自然选模：策略更新过程刻画自然选择，即个体在与博弈择作用于群组而非个体，通过群组选择来决定个对象进行交互后获取收益，收益越高的个体，它的体策略演化策略越容易被模仿对象所采用；而在突变的作用除了上面介绍的演化合作机制外，还有一些下，个体探索地采取全新策略.最后以整个系统为机制也能够促进合作，例如个体异质性和环境反研究对象，分析群体策略的动态演化过程，并获取馈.个体异质性本质上描述了不同主体间相互比

the key factor for social stability, economic development, and individual health. Finally, the challenges and further directions of studying ultimatum games in a complex network were summarized. KEY WORDS complex networks；evolution；cooperation；ultimatum game；resources allocation 20 世纪末，复杂网络研究的兴起在国内外掀起一股新的研究复杂性科学的热潮[1] ，而复杂网络本身也形成了一门新学科——网络科学. 复杂网络能够很好地刻画实际生物、社会和工业系统中所表现的社团结构、小世界特性、无标度特性等网络拓扑. 集群行为普遍存在于各类真实系统中，如蚁群互助觅食、蜂群协同建巢、鸽群编队飞行、鱼群涡旋游动和人类选举投票等. 相应地，复杂网络上集群行为的相关研究成为多学科交叉的热点问题[2−9] ，主要聚焦以下三方面：(1) 通过对动物和人类进行大量行为学实验，证实集群行为的存在性；(2) 以集群行为的存在作为前提假设，研究据此所诱导的社会、经济和工程影响，或仿照集群行为设计控制律和智能算法；(3) 将集群行为的存在看作是需要证明的结论，即对集群行为如何从个体的简单交互中涌现提供完整解释. 行为学证实了集群行为的普遍存在性，而经济学、社会学和统计物理学发现了集群行为存在的重要性. 不仅要“知其然”，也要“知其所以然”. 一个自然的问题是，集群行为从何而来，为什么能够长期稳定存在？行为学实验有效支持了利用演化论解释集群行为涌现的合理性. 以公平行为为例加以阐述[10−12] ：聚焦公平偏好神经学解释的实验证明，人类的公平偏好具有生理基础；针对儿童进行公平行为测试的研究表明，未成年儿童的公平偏好会随着年龄的增长而上升，暗示人类的公平偏好在社会学习中不断演化进步；随着社会的不断进化，人类不断提升自身的公平偏好. 由行为学可见，复杂网络上演化博弈可被用来研究集群行为的涌现. 此类研究往往利用复杂网络对个体间交互方式进行数学建模[13−14] ：边连接博弈对象和模仿对象；而边的权重描述个体间交互强度，量化个体被选为博弈对象或模仿对象的概率. 同时利用经典博弈 (例如最后通牒博弈) 的演化动力学对个体间决策范式进行数学建模：策略更新过程刻画自然选择，即个体在与博弈对象进行交互后获取收益，收益越高的个体，它的策略越容易被模仿对象所采用；而在突变的作用下，个体探索地采取全新策略. 最后以整个系统为研究对象，分析群体策略的动态演化过程，并获取群体行为的统计学规律. 最常采用的研究方式是计算机仿真，即利于计算机程序对动力学进行模拟[15] . 另一种重要但十分具有挑战性的研究方式是理论分析，即利用数学工具量化动力学[16−19] . 本文组织结构如下：第 1 部分简要介绍基于演化博弈的合作演化机制研究现状；第 2 部分阐述复杂网络上演化博弈的理论分析方法；第 3 部分给出基于最后通牒博弈的公平偏好涌现机制的相关研究；第 4 部分总结本文的主要内容，并归纳了复杂网络上最后通牒博弈研究现阶段的不足和未来的发展方向. 1 基于演化博弈的合作演化机制 1973 演化博弈理论曾相当成功地解释了生物进化过程中的某些现象，最为经典的早期工作是年 Smith 和 Price 将其用来解释动物的斗争行为，同时提出了演化稳定策略[20] . 之后，经济学、社会学和统计物理学运用演化博弈论分析影响集群行为形成的各类因素，获取了丰富且具有启发意义的研究成果[21−24] . 近期，众多学者试图将控制论和演化博弈理论结合，希望借助一定的控制手段令群体行为演化到期望状态，从而实现更加有效的工程应用[25−30] . 被演化博弈论最为频繁研究的集群行为是合作行为[31−33] . 2006 年，Nowak 总结性地提出了五种有利于合作演化的机制[34] （图 1）：(1) 亲缘选择[35−36] ，通过具有亲缘和遗传关系的个体之间的关系来促进合作，即个体更愿意与亲缘关系较近的对手合作. (2) 直接互惠[37−38] ，在重复博弈中，个体当前阶段的合作诱发对手在后续阶段的合作行为. (3) 间接互惠[39−40] ，此时声望起关键作用，合作的个体具备较高的声望，从而在接下来的博弈阶段更容易获得他人的帮助. (4) 网络互惠[41−42] ，复杂网络的连接关系令合作者“抱团取暖”而存活，背叛者无法再利用合作者而消亡. (5) 群组选择[43] ，自然选择作用于群组而非个体，通过群组选择来决定个体策略演化. 除了上面介绍的演化合作机制外，还有一些机制也能够促进合作，例如个体异质性和环境反馈. 个体异质性本质上描述了不同主体间相互比张艳玲等：演化博弈与资源配置综述 · 403 ·

404 工程科学学报，第44卷.第3期 (a 致不同的收益矩阵，环境通过收益矩阵的变化直接反过来影响策略演化动力学.Hilbe等将随机博弈思想融入重复博弈，具体而言，每一轮的个体行为及博弈共同决定下一轮的博弈5]此时，环境反馈和直接互惠可以极大促进合作的演化，远高于只有环境反馈或直接互惠所诱导的合作水平.类似地，Su等将随机博弈思想融入规则网络群体54， d 其中博弈转移大大放松合作演化的条件，特别地，即使在每个备选博弈中合作无法演化，而在备选博弈间转移却能够促进合作的演化.Weitz等将群体中博弈的变化由一个类似的复制动力学刻画，图1五大促进合作涌现的机制(a)亲缘选择：(b)直接互惠：(c)间发现群体在好环境、坏环境、合作、背叛间不断往接互惠；(d)群组选择：(e)网络互惠复震荡啊稍后的研究表明类似的震荡环也出现 Fig.I Five mechanisms for the emergence of cooperation(a)kin 在环境反馈下的非对称两人博弈和网络群体65刃 selection;(b)direct reciprocity;(c)indirect reciprocity;(d)group 同时研究框架被推广到公共品博弈58]，发现资源反 selection;(e)network reciprocity 馈可以有效促进合作的演化较过程中，展现出来的身心特征上的彼此各不相 2复杂网络上演化博弈的理论分析方法同的现象，这主要是由于个体的成长过程受遗传和环境的交互影响.例如，主体间的能力有高低之自从Nowak和May开创性地研究了方格网络分，不同主体才能的形成有早有晚，且各有所长群体中的囚徒困境5网，复杂网络上的演化博弈成个体异质性在群体竞争中普遍存在，演化博弈研为研究网络群体中策略竞争的有效工具.常见的网究的异质个体可归为三类：其一是异质网络中，每络包括规则网络、小世界网络、无标度网络和社个主体参与博弈总次数呈现天然异质性，而这种团结构网络，如图2所示5960.目前，国内外学者异质性从整体上利于合作的演化.其二是个体对复杂网络上的两策略竞争进行了系统的研究61-6烈，间行为模式存在异质性，即个体与不同对手采取相关研究大多利用计算机仿真进行63-8】而理论不同策略、不同交互概率和模仿概率，这种差异性分析是深刻理解网络群体中策略竞争的必要条可以在一定条件下促进两人博弈啊或多人博弈中件.在中性选择这种适应度与收益无关的特殊情合作的演化6其三是公共品博弈的投资、产出和形下，策略在网络的扩散过程仅仅依赖随机漂移分配额因人而异.当产出的协同效应和折扣效应 (由状态更新过程本身的随机性所决定).相应固以概率共存时，高概率的协同效应能够促进合作叨：定概率具有封闭形式计算公式，这里的固定概率在分配额越大的博弈中投资越多，越有利于合作指的是单个变异体传播到整个群体的概率，具体的演化，在重复博弈中，投资的极端异质性抑制数值往往与变异体出现的位置相关.然而，复杂网合作，而当个体间分配额存在差异时，适当的投资络上一般演化博弈的理论研究较为稀少，且在弱异质性反而是促进合作的必要条件例选择情形下进行.弱选择意味适应度对收益依赖策略演化动力学与环境相互影响而形成的反程度较小，允许扰动理论的使用，从而获得解析成馈在生物和社会系统中普遍存在.例如，接种疫苗果.同时探索弱选择情形的演化博弈具有现实意的不充分往往导致本可以预防的传染病大规模爆义，因为每个主体在生活中参与大量博弈，而单一发；之后，政府通过宣传疫苗接种必要性等反馈措博弈对适应度的影响往往很小.况且在强选择情施改善疫苗的接种环境和群体的决策行为.最近，形下，即适应度依赖收益的程度较大，相应固定概环境反馈对于合作演化的影响激发了研究人员的率已被证明没有封闭形式计算公式，也不能被一浓厚兴趣0-，这里探讨的环境反馈是在随机博个多项式时间算法所求解69下面，将分别阐述两弈的研究框架下的定义的，随机博弈通常包括若类主流的复杂网络上演化博弈理论分析方法：针干个博弈主体、各主体的策略集合、收益矩阵及对离散策略，计算σ-占优条件；针对连续策略，分更新过程.收益矩阵和更新过程令部分主体改变析适应动力学自身策略，从而影响环境状态；环境状态的变化导针对离散策略，弱选择情形下最一般理论结

较过程中，展现出来的身心特征上的彼此各不相同的现象，这主要是由于个体的成长过程受遗传和环境的交互影响. 例如，主体间的能力有高低之分，不同主体才能的形成有早有晚，且各有所长. 个体异质性在群体竞争中普遍存在，演化博弈研究的异质个体可归为三类：其一是异质网络中，每个主体参与博弈总次数呈现天然异质性，而这种异质性从整体上利于合作的演化[44] . 其二是个体间行为模式存在异质性，即个体与不同对手采取不同策略、不同交互概率和模仿概率，这种差异性可以在一定条件下促进两人博弈[45] 或多人博弈中合作的演化[46] . 其三是公共品博弈的投资、产出和分配额因人而异. 当产出的协同效应和折扣效应以概率共存时，高概率的协同效应能够促进合作[47] ；在分配额越大的博弈中投资越多，越有利于合作的演化[48] ；在重复博弈中，投资的极端异质性抑制合作，而当个体间分配额存在差异时，适当的投资异质性反而是促进合作的必要条件[49] . 策略演化动力学与环境相互影响而形成的反馈在生物和社会系统中普遍存在. 例如，接种疫苗的不充分往往导致本可以预防的传染病大规模爆发；之后，政府通过宣传疫苗接种必要性等反馈措施改善疫苗的接种环境和群体的决策行为. 最近，环境反馈对于合作演化的影响激发了研究人员的浓厚兴趣[50−52] ，这里探讨的环境反馈是在随机博弈的研究框架下的定义的，随机博弈通常包括若干个博弈主体、各主体的策略集合、收益矩阵及更新过程. 收益矩阵和更新过程令部分主体改变自身策略，从而影响环境状态；环境状态的变化导致不同的收益矩阵，环境通过收益矩阵的变化直接反过来影响策略演化动力学. Hilbe 等将随机博弈思想融入重复博弈，具体而言，每一轮的个体行为及博弈共同决定下一轮的博弈[53] . 此时，环境反馈和直接互惠可以极大促进合作的演化，远高于只有环境反馈或直接互惠所诱导的合作水平. 类似地，Su 等将随机博弈思想融入规则网络群体[54] ，其中博弈转移大大放松合作演化的条件，特别地，即使在每个备选博弈中合作无法演化，而在备选博弈间转移却能够促进合作的演化. Weitz 等将群体中博弈的变化由一个类似的复制动力学刻画，发现群体在好环境、坏环境、合作、背叛间不断往复震荡[55] . 稍后的研究表明类似的震荡环也出现在环境反馈下的非对称两人博弈和网络群体[56−57] . 同时研究框架被推广到公共品博弈[58] ,发现资源反馈可以有效促进合作的演化. 2 复杂网络上演化博弈的理论分析方法 σ− 自从 Nowak 和 May 开创性地研究了方格网络群体中的囚徒困境[59] ，复杂网络上的演化博弈成为研究网络群体中策略竞争的有效工具. 常见的网络包括规则网络、小世界网络、无标度网络和社团结构网络，如图 2 所示[59−60] . 目前，国内外学者对复杂网络上的两策略竞争进行了系统的研究[61−62] ，相关研究大多利用计算机仿真进行[63−68] . 而理论分析是深刻理解网络群体中策略竞争的必要条件. 在中性选择这种适应度与收益无关的特殊情形下，策略在网络的扩散过程仅仅依赖随机漂移（由状态更新过程本身的随机性所决定）. 相应固定概率具有封闭形式计算公式，这里的固定概率指的是单个变异体传播到整个群体的概率，具体数值往往与变异体出现的位置相关. 然而，复杂网络上一般演化博弈的理论研究较为稀少，且在弱选择情形下进行. 弱选择意味适应度对收益依赖程度较小，允许扰动理论的使用，从而获得解析成果. 同时探索弱选择情形的演化博弈具有现实意义，因为每个主体在生活中参与大量博弈，而单一博弈对适应度的影响往往很小. 况且在强选择情形下，即适应度依赖收益的程度较大，相应固定概率已被证明没有封闭形式计算公式，也不能被一个多项式时间算法所求解[69] . 下面，将分别阐述两类主流的复杂网络上演化博弈理论分析方法：针对离散策略，计算占优条件；针对连续策略，分析适应动力学. 针对离散策略，弱选择情形下最一般理论结 (a) (b) (c) (e) (d) 图 1 五大促进合作涌现的机制[34] . （a）亲缘选择；（b）直接互惠；（c）间接互惠；（d）群组选择；（e）网络互惠 Fig.1 Five mechanisms for the emergence of cooperation[34] : (a) kin selection; (b) direct reciprocity; (c) indirect reciprocity; (d) group selection; (e) network reciprocity · 404 · 工程科学学报，第 44 卷，第 3 期

张艳玲等：演化博弈与资源配置综述 405. b 而潮祖理论是适用中性选择的经典方法，核心思想是，在回顾多主体祖先的过程中，只要回顾时间足够长，总会找到他们最近的共同祖先.计算合作占优条件的关键思路是，从当前的多主体回顾到他们最近共同祖先的过程中，确定每个主体是否发生变异或更改位置 Antal等推导了全局迁移下c的近似解析表达式四，Zhang等将溯祖理论和随机游走结合起来计算任意迁移模式下结构系数σ四此时，从当前的多主体回潮到他们最近共同祖先的过程中，溯祖理论不再只是确定其是否变异或迁移，而是更准确地捕捉到每个主体发生变异或迁移的祖先数图2常见的网络结构59(a)规则网络：(b)小世界网络：(c)无标度网路：(d)社团结构网络目.之后利用多个随机游走追踪从最近共同祖先 Fig.2 Common network structures (a)regular network;(b)small- 到当前期间每个主体祖先的策略变化轨迹和位置 world network;(c)scale-free network;(d)group-structed network 变化轨迹果莫过于σ-占优条件的推导0具体而言，两策略上述工作均是在假设1下进行的.为了放松假设L,即演化过程服从局部更新，不再要求全局更竞争中策略占优条件线性依赖收益矩阵和结构系数(Structure coefficient,c),其中参数c与收益矩阵新，Ohtsuki等针对随机规则网络，利用对估计方法获得两人博弈中合作占优的条件)相应结果可无关，它可以量化交互网络和更新过程对于策略在大群体的前提下给出σ的近似解析表达式.对估选择影响的大小，这里的策略占优指的是一种策略的稳态频率高于另一种策略，在小变异情形下，计方法是一种平均场估计方法，利用六个变量刻等价于一种策略的固定概率高于另一种策略.相画群体状态.假设两种策略A和B共存于群体，相应地，网络群体中两策略竞争的理论研究转化为应的六个变量为：随机选择的个体采取策略 A(B)的概率为xA(xB);在选中一个A个体后，任意选结构系数σ的计算.群体的策略演化可由一个马尔科夫决策过程刻画，然而在一般复杂网络群体中，择他的一个邻居采取A(B)的条件概率为xAA(xAB片在选中一个B个体后，任意选择他的一个邻居采取群体状态应该包含所有主体的策略和位置，无法 A(B)的条件概率为xBA(BB).以上六个变量中的一一列举出来，相应的状态转移矩阵无法刻画，群 xA和xAA是自由变量，对估计方法的核心是根据策体的稳态频率无法由直接方法计算出来，因此计略更新过程对这两个自由变量建立演化方程.该算σ往往极具挑战性方法和混合均匀群体的复制动力学相比，多了一当群体演化过程满足假设1：全局更新（即所个刻画自由变量xAA的动力学方程，此动力学方程有主体共同竞争产生后代)，学者推导出σ的形式可以理解为对个体局部交互信息的量化. 表达式m,即。=≤0，其中代表策略2主 0 同样为了放松假设L,Allen等针对特定规则网体在群体中的比例，l代表策略主体和策略主体络，利用血缘一致性方法推导合作占优条件相交互数目，<>0代表中性选择（所有主体具有相同应结果可在大群体的前提下给出σ近似解析表达收益)下的期望.这个形式表达式给出了σ的简单式.血缘一致性在生物学上描述两个主体继承共算法：在所有主体具有相同适应度的结构群体演同祖先的基因，如果两个主体自从共同祖先的那化过程中，记录群体在每一时刻的x2山1和212，将一代到当前，在整个演化过程中都没有发生变异，称所有时刻的这两个值进行平均，再取比值即可获这两个主体具有血缘一致性关系.而获得合作占得σ，该算法可由大数定律保障收敛性优条件的核心在于，推导中性选择时，位于n步溯针对满足假设1的具体模型一基于表现型祖随机游走两端的个体拥有血缘一致性的概率. 和基于集合的结构群体，Antal等在大群体的前提最近，Allen等利用图上的溯祖随机游走理论，下给出了σ近似解析表达式，其具体思路是，将上述结果拓展到任意网络群体阿和任意更新过 o和转化为中性选择时，计算随机程阿此时，获取合作占优条件的关键在于，推导选择的多主体具有相同策略或相同位置的概率. 中性选择下从任意两个位置开始的溯祖随机游走

σ− σ σ σ σ 果莫过于占优条件的推导[70] . 具体而言，两策略竞争中策略占优条件线性依赖收益矩阵和结构系数 (Structure coefficient， )，其中参数与收益矩阵无关，它可以量化交互网络和更新过程对于策略选择影响的大小. 这里的策略占优指的是一种策略的稳态频率高于另一种策略，在小变异情形下，等价于一种策略的固定概率高于另一种策略. 相应地，网络群体中两策略竞争的理论研究转化为结构系数的计算. 群体的策略演化可由一个马尔科夫决策过程刻画，然而在一般复杂网络群体中，群体状态应该包含所有主体的策略和位置，无法一一列举出来，相应的状态转移矩阵无法刻画，群体的稳态频率无法由直接方法计算出来，因此计算往往极具挑战性. σ σ = 0 0 x2 Ii j i j <>0 σ x2I11 x2I12 σ 当群体演化过程满足假设 I：全局更新（即所有主体共同竞争产生后代），学者推导出的形式表达式[70] ，即，其中代表策略 2 主体在群体中的比例，代表策略主体和策略主体交互数目，代表中性选择（所有主体具有相同收益）下的期望. 这个形式表达式给出了的简单算法：在所有主体具有相同适应度的结构群体演化过程中，记录群体在每一时刻的和，将所有时刻的这两个值进行平均，再取比值即可获得，该算法可由大数定律保障收敛性. σ 0 0 针对满足假设 I 的具体模型——基于表现型和基于集合的结构群体，Antal 等在大群体的前提下给出了近似解析表达式[71] ，其具体思路是，和转化为中性选择时，计算随机选择的多主体具有相同策略或相同位置的概率. 而溯祖理论是适用中性选择的经典方法，核心思想是，在回顾多主体祖先的过程中，只要回顾时间足够长，总会找到他们最近的共同祖先. 计算合作占优条件的关键思路是，从当前的多主体回顾到他们最近共同祖先的过程中，确定每个主体是否发生变异或更改位置. σ σ Antal 等推导了全局迁移下的近似解析表达式[71] ，Zhang 等将溯祖理论和随机游走结合起来计算任意迁移模式下结构系数 [72] . 此时，从当前的多主体回溯到他们最近共同祖先的过程中，溯祖理论不再只是确定其是否变异或迁移，而是更准确地捕捉到每个主体发生变异或迁移的祖先数目. 之后利用多个随机游走追踪从最近共同祖先到当前期间每个主体祖先的策略变化轨迹和位置变化轨迹. σ A B A(B) xA (xB) A A(B) xAA (xAB) B A(B) xBA (xBB) xA xAA xAA 上述工作均是在假设 I 下进行的. 为了放松假设 I，即演化过程服从局部更新，不再要求全局更新，Ohtsuki 等针对随机规则网络，利用对估计方法获得两人博弈中合作占优的条件[73] . 相应结果可在大群体的前提下给出的近似解析表达式. 对估计方法是一种平均场估计方法，利用六个变量刻画群体状态. 假设两种策略和共存于群体，相应的六个变量为：随机选择的个体采取策略的概率为；在选中一个个体后，任意选择他的一个邻居采取的条件概率为；在选中一个个体后，任意选择他的一个邻居采取的条件概率为 . 以上六个变量中的和是自由变量，对估计方法的核心是根据策略更新过程对这两个自由变量建立演化方程. 该方法和混合均匀群体的复制动力学相比，多了一个刻画自由变量的动力学方程，此动力学方程可以理解为对个体局部交互信息的量化. σ 同样为了放松假设 I，Allen 等针对特定规则网络，利用血缘一致性方法推导合作占优条件[74] . 相应结果可在大群体的前提下给出近似解析表达式. 血缘一致性在生物学上描述两个主体继承共同祖先的基因. 如果两个主体自从共同祖先的那一代到当前，在整个演化过程中都没有发生变异，称这两个主体具有血缘一致性关系. 而获得合作占优条件的核心在于，推导中性选择时，位于 n 步溯祖随机游走两端的个体拥有血缘一致性的概率. 最近，Allen 等利用图上的溯祖随机游走理论，将上述结果拓展到任意网络群体[75] 和任意更新过程[76] . 此时，获取合作占优条件的关键在于，推导中性选择下从任意两个位置开始的溯祖随机游走 (a) (c) (b) (d) 1 m 图 2 常见的网络结构[59-60] . （a）规则网络；（b）小世界网络；（c）无标度网络；（d）社团结构网络 Fig.2 Common network structures[59-60] : (a) regular network; (b) smallworld network; (c) scale-free network; (d) group-structed network 张艳玲等：演化博弈与资源配置综述 · 405 ·

406 工程科学学报，第44卷.第3期首次相遇的时间.同时由于σ不依赖收益矩阵，可提议量；个体作为响应者可接受的最低提议量，即将上述合作占优条件与σ-占优条件对比，从而获响应量.同时，它也是最受欢迎的实验研究对象之取任意网络群体中σ的计算方法.这是复杂网络上一. 自从复杂网络上演化博弈受到广泛关注，网络演化博弈理论分析方法的突破性进展，为网络群结构就成为促进合作演化的最重要机制.一个自体中两策略竞争提供一个完整的理论分析框架然问题是，网络结构如何影响最后通牒博弈中公上述理论方法适用研究离散策略的演化动力平的演化？早在2000年，Page等就发现环和方格学，同时Allen等的最新工作在弱选择下可获得一网络本身并不能促进公平的演化：当模仿过程的般复杂网络群体中σ的解析表达式-阿但在强选噪声较高，即模仿的准确率较低时，群体的平均提择条件下，至今仍然缺少分析一般复杂网络群体议量和响应量最终稳定在相对公平的范围叫类演化动力学的理论分析方法似的结论也在小世界及随机网络中发现2-8到，且适应动力学是研究连续策略的经典方法，从对各种初始条件和更新过程鲁棒7事实上，噪两个时间尺度，描述小变异情形下连续策略的演声是促进公平涌现的机制之一.即使在混合均匀化过程.从长期演化角度看，群体近似视为时时刻群体中，一定程度的噪声也会促进公平的演化，所刻采用一种策略，群体策略的演化转化为一系列诱导的群体资源配置行为与实验所发现的分配行策略迭代事件的发生.从短期时间尺度看，两种策为相符合⑧这主要是由于噪声引入一些并不适略共存于群体，且其中之一迅速占据群体或在群应环境的策略，特别是当高需求的响应者进人群体中消亡.Zhang等从微观更新过程出发，推导有体后，提议者相应地提高自身的提议量.除了噪限群体演化博弈的适应动力学m.具体思路是，利声，众多学者还提出很多能够促进网络群体中公用主方程描述群体采用某种策略的概率随时间变平偏好涌现的机制. 化的动力学.据此发现，群体所采用策略的平均演目前，最后通牒博弈的行为学实验关注了博化方向可由变异策略的固定概率所预测.同时利弈双方的关系因素、博弈决策的情境因素、分配用固定概率关于变异策略的一阶泰勒展开近似群物的数量因素等对于决策结果的影响.下面将要体策略的平均演化路径.该方法的局限是一般网介绍的五类因素不仅在行为学实验而且在演化博络群体的固定概率难以获得具体表达式弈框架下均被广泛关注 3基于演化博弈的资源配置其一是角色分配.Killingback和Studer在方格网络中研究角色分配由博弈双方固有等级的相对公平偏好是在资源配置过程中自发涌现出来高低来决定的模型.当适应度线性依赖收益时，的集群行为.为了刻画资源配置行为，博弈论构建群体平均提议量和响应量稳定在相对公平的范了简单易行、操作性强的最后通牒博弈：两个参与围；而在适应度与收益的依赖关系中融入递减回者配置一笔资源，提议者向响应者提出分配方案，报效应时，二者明显降低.Wu等的研究在无标度如果响应者接受该方案，二者按照该方案获得相网络中对比了基于度的角色分配方式和自适应角应资源，否则，二者分文未得.在忽略个体为资源色更替方式，其中自适应角色更替方式更能促产生所付出的成本及个体间需求的差异性前提进公平偏好的涌现，此时一旦提议者的分配方案下，以均等原则度量公平偏好：绝对公平指的是提被接受，博弈双方在下一轮博弈中以较大概率担议者均等分配资源且响应者只接受均等分配方当相同角色：否则二者以较大概率改变角色进行案，与绝对公平较为接近的行为展现较高的公平博弈偏好.该博弈的行为学实验证实了公平偏好的存其二是声望.Yang等在方格和随机网络中研在性：提议者通常提供给对方30%~50%的份额，究由声望确定博弈对象和角色分配的模型则.具而响应者往往接受20%~35%的份额.公平是各体而言，个体收益作为声望信息，邻居以此选择是种系统稳定运行的关键.对财富不公平的分配往否与其博弈，提议者成功分配资源的次数作为声往住会造成社会不平等.而社会不平等在皮尤研究望信息，博弈对象据此确定其再次成为提议者的中心的报告中被认为是世界上最大的挑战，击败概率.当个体更愿意与高收益个体进行博弈，且声宗教仇恨、污染和核武器等望较好的个体往往担当提议者时，公平偏好被显最后通牒博弈允许关注资源配置的两个重要著提高.此时，个体为了获取更多博弈机会和提议方面-聊：个体作为提议者给予对方的资源量，即者的角色分配，不得不提高自身提议量，与此同时

σ σ− σ 首次相遇的时间. 同时由于不依赖收益矩阵，可将上述合作占优条件与占优条件对比，从而获取任意网络群体中的计算方法. 这是复杂网络上演化博弈理论分析方法的突破性进展，为网络群体中两策略竞争提供一个完整的理论分析框架. σ 上述理论方法适用研究离散策略的演化动力学，同时 Allen 等的最新工作在弱选择下可获得一般复杂网络群体中的解析表达式[75−76] . 但在强选择条件下，至今仍然缺少分析一般复杂网络群体演化动力学的理论分析方法. 适应动力学是研究连续策略的经典方法，从两个时间尺度，描述小变异情形下连续策略的演化过程. 从长期演化角度看，群体近似视为时时刻刻采用一种策略，群体策略的演化转化为一系列策略迭代事件的发生. 从短期时间尺度看，两种策略共存于群体，且其中之一迅速占据群体或在群体中消亡. Zhang 等从微观更新过程出发，推导有限群体演化博弈的适应动力学[77] . 具体思路是，利用主方程描述群体采用某种策略的概率随时间变化的动力学. 据此发现，群体所采用策略的平均演化方向可由变异策略的固定概率所预测. 同时利用固定概率关于变异策略的一阶泰勒展开近似群体策略的平均演化路径. 该方法的局限是一般网络群体的固定概率难以获得具体表达式. 3 基于演化博弈的资源配置公平偏好是在资源配置过程中自发涌现出来的集群行为. 为了刻画资源配置行为，博弈论构建了简单易行、操作性强的最后通牒博弈：两个参与者配置一笔资源，提议者向响应者提出分配方案，如果响应者接受该方案，二者按照该方案获得相应资源，否则，二者分文未得. 在忽略个体为资源产生所付出的成本及个体间需求的差异性前提下，以均等原则度量公平偏好：绝对公平指的是提议者均等分配资源且响应者只接受均等分配方案，与绝对公平较为接近的行为展现较高的公平偏好. 该博弈的行为学实验证实了公平偏好的存在性：提议者通常提供给对方 30%～50% 的份额，而响应者往往接受 20%～35% 的份额. 公平是各种系统稳定运行的关键. 对财富不公平的分配往往会造成社会不平等. 而社会不平等在皮尤研究中心的报告中被认为是世界上最大的挑战，击败宗教仇恨、污染和核武器等. 最后通牒博弈允许关注资源配置的两个重要方面[78−80] ：个体作为提议者给予对方的资源量，即 2000 提议量；个体作为响应者可接受的最低提议量，即响应量. 同时，它也是最受欢迎的实验研究对象之一. 自从复杂网络上演化博弈受到广泛关注，网络结构就成为促进合作演化的最重要机制. 一个自然问题是，网络结构如何影响最后通牒博弈中公平的演化？早在年，Page 等就发现环和方格网络本身并不能促进公平的演化：当模仿过程的噪声较高，即模仿的准确率较低时，群体的平均提议量和响应量最终稳定在相对公平的范围[81] . 类似的结论也在小世界及随机网络中发现[82−83] ，且对各种初始条件和更新过程鲁棒[84−87] . 事实上，噪声是促进公平涌现的机制之一. 即使在混合均匀群体中，一定程度的噪声也会促进公平的演化，所诱导的群体资源配置行为与实验所发现的分配行为相符合[88] . 这主要是由于噪声引入一些并不适应环境的策略，特别是当高需求的响应者进入群体后，提议者相应地提高自身的提议量. 除了噪声，众多学者还提出很多能够促进网络群体中公平偏好涌现的机制. 目前，最后通牒博弈的行为学实验关注了博弈双方的关系因素、博弈决策的情境因素、分配物的数量因素等对于决策结果的影响. 下面将要介绍的五类因素不仅在行为学实验而且在演化博弈框架下均被广泛关注. 其一是角色分配. Killingback 和 Studer 在方格网络中研究角色分配由博弈双方固有等级的相对高低来决定的模型[89] . 当适应度线性依赖收益时，群体平均提议量和响应量稳定在相对公平的范围；而在适应度与收益的依赖关系中融入递减回报效应时，二者明显降低. Wu 等的研究在无标度网络中对比了基于度的角色分配方式和自适应角色更替方式[90] . 其中自适应角色更替方式更能促进公平偏好的涌现，此时一旦提议者的分配方案被接受，博弈双方在下一轮博弈中以较大概率担当相同角色；否则二者以较大概率改变角色进行博弈. 其二是声望. Yang 等在方格和随机网络中研究由声望确定博弈对象和角色分配的模型[91] . 具体而言，个体收益作为声望信息，邻居以此选择是否与其博弈，提议者成功分配资源的次数作为声望信息，博弈对象据此确定其再次成为提议者的概率. 当个体更愿意与高收益个体进行博弈，且声望较好的个体往往担当提议者时，公平偏好被显著提高. 此时，个体为了获取更多博弈机会和提议者的角色分配，不得不提高自身提议量，与此同时 · 406 · 工程科学学报，第 44 卷，第 3 期

张艳玲等：演化博弈与资源配置综述 407 响应者为了获得较高收益而提高自身响应量.但的声望；“恶意”和“同理心”属于分配意图方面的提议量也没有必要高于50%，一旦超过50%，个体博弈决策情境因素，“恶意”指的是厌恶对方的情更愿意担当响应者绪，“同理心“指的是以自己的标准要求别人；“配其三是恶意四和非单调拒绝.恶意指的是所置资源总量”属于分配物的数量因素.除了上述因采取的行为令对手获得较少收益或遭受更多损素外，Deng等提出每个主体同时位于两个物理网失，具体表现为个体作为提议者提供给对方较低络的模型0，发现耦合的两个网络相比于单个网分配额，而作为响应者拒绝较低提议量.非单调拒络更加促进公平偏好的演化稳定，双向通信要比绝指的是个体不仅拒绝较低的还拒绝较高的提议单向通信更加高效，Zhao等发现内群偏私能有效量.这两种行为的存在性已被行为学实验所证实，提升群体平均提议量和响应量)，内群偏私意味同时也激发了大量行为学实验调查它们对于公平给予相似个体更多分配额，同时接受对方较低提演化的影响.鉴于此，Zhang与Fu在任意网络群体议量中，从理论上对融入这两种行为的离散策略最后 4总结及未来发展趋势通牒博弈模型进行了分析9)以策略干预的研究思路，即在原本旗鼓相当的公平和自私的竞争中，复杂网络上演化博弈理论不断发展和完善，通过依次加入利他策略、恶意策略、非单调拒绝尤其在两策略竞争理论分析方法上获得了里程碑行为，发现利他抑制公平的演化，恶意和非单调拒式进步.本文首先介绍了在演化博弈框架下合作绝促进公平的演化演化机制的相关研究，详细给出了近年来被广泛其四是同理心侧-同理心指的是个体提议关注的个体异质性和环境反馈对于合作演化的影量等于其响应量，意味个体期待对方给予自身的响：其次阐述了五种复杂网络上演化博弈的理论份额不低于自身给予他人的份额.大量研究通常分析方法，包括适用于任意网络结构和更新规则将同理心的存在作为前提假设，发现其在众多网的潮祖随机游走理论：再次总结了在演化博弈框络群体中能够促进公平的涌现.Zhang等在社团结架下的资源配置问题，所采用的博弈模型是最后构群体中假设同理心可随时间演化，研究同理心通牒博弈.然而最后通牒博弈是典型的连续策略与噪声如何共同影响公平的演化适量的初始博弈，连续策略在复杂网络中传播所诱导的群体同理心和噪声所诱导的群体资源配置行为与行为状态维度比两策略庞大很多，因此相应理论分析学实验所展现的分配行为相符合.当噪声较低时，更具挑战性，相关研究还未形成较为成熟的理论初始同理心越强，越有利于群体决策行为接近绝分析框架.结合目前研究现状，我们发现：对公平；而当噪声较高时，初始同理心越强反而不利用最后通牒博弈研究公平偏好涌现问题大利于公平的涌现多采用计算机仿真，而理论分析是深刻理解网络其五是配置资源总量7]你可以轻易地拒群体中策略竞争的必要条件.目前关于最后通牒绝100元的1%，但你会拒绝100亿元的1%吗？博弈的理论分析往往只是针对特定网络群体，故实验者为证实配置资源对于公平的影响进行了大亟待寻找新工具、新方法来处理一般网络群体的量实验，但仍缺乏一致性结论.Zhang等理论分析最后通牒博弈了最后通牒博弈中配置资源如何影响资源配置行对于个体交互网络，大多数文献只是关注给为四.推导了社团结构群体中平均提议量和响应定交互异质性的网络群体如何影响公平偏好的涌量，发现二者所占比例反比于配置资源，即随着配现.而不同社会网络所对应的交互异质性往往不置资源量的增加，群体所展现的决策行为越来越同，目前还没有相应成果系统对比异质性不同所接近于子博弈完美纳什均衡.而群体平均提议量诱导的公平行为的差异性和响应量本身的大小二次依赖于配置资源，其中对于个体资源，往往假定所有个体都是相同配置资源越大，提议量越大，而适中的配置资源诱的.鉴于普遍存在的贫富分化现象和收入不均现导最大的响应量象，个体资源通常因人而异，所有个体具有相同资 “角色分配”和“声望”属于博弈双方的关系因源是一种理想化的假设，无法描述个体的差异性素，“角色分配”指的是博弈中的身份，并非随机指属性，由此限制相应理论结果的应用范围，例如无定，而是通过一定手段获得提议者的身份，“声望” 法展现穷人和富人在资源配置过程中决策行为的指的是提议者做决策时会考虑提议方案影响自身差异性

50% 50% 响应者为了获得较高收益而提高自身响应量. 但提议量也没有必要高于，一旦超过，个体更愿意担当响应者. 其三是恶意[92] 和非单调拒绝. 恶意指的是所采取的行为令对手获得较少收益或遭受更多损失，具体表现为个体作为提议者提供给对方较低分配额，而作为响应者拒绝较低提议量. 非单调拒绝指的是个体不仅拒绝较低的还拒绝较高的提议量. 这两种行为的存在性已被行为学实验所证实，同时也激发了大量行为学实验调查它们对于公平演化的影响. 鉴于此，Zhang 与 Fu 在任意网络群体中，从理论上对融入这两种行为的离散策略最后通牒博弈模型进行了分析[93] . 以策略干预的研究思路，即在原本旗鼓相当的公平和自私的竞争中，通过依次加入利他策略、恶意策略、非单调拒绝行为，发现利他抑制公平的演化，恶意和非单调拒绝促进公平的演化. 其四是同理心[94−95] . 同理心指的是个体提议量等于其响应量，意味个体期待对方给予自身的份额不低于自身给予他人的份额. 大量研究通常将同理心的存在作为前提假设，发现其在众多网络群体中能够促进公平的涌现. Zhang 等在社团结构群体中假设同理心可随时间演化，研究同理心与噪声如何共同影响公平的演化[96] . 适量的初始同理心和噪声所诱导的群体资源配置行为与行为学实验所展现的分配行为相符合. 当噪声较低时，初始同理心越强，越有利于群体决策行为接近绝对公平；而当噪声较高时，初始同理心越强反而不利于公平的涌现. 其五是配置资源总量[97−98] . 你可以轻易地拒绝 100 元的 1%，但你会拒绝 100 亿元的 1% 吗？实验者为证实配置资源对于公平的影响进行了大量实验，但仍缺乏一致性结论. Zhang 等理论分析了最后通牒博弈中配置资源如何影响资源配置行为[99] . 推导了社团结构群体中平均提议量和响应量，发现二者所占比例反比于配置资源，即随着配置资源量的增加，群体所展现的决策行为越来越接近于子博弈完美纳什均衡. 而群体平均提议量和响应量本身的大小二次依赖于配置资源，其中配置资源越大，提议量越大，而适中的配置资源诱导最大的响应量. “角色分配”和“声望”属于博弈双方的关系因素，“角色分配”指的是博弈中的身份，并非随机指定，而是通过一定手段获得提议者的身份，“声望” 指的是提议者做决策时会考虑提议方案影响自身的声望；“恶意”和“同理心”属于分配意图方面的博弈决策情境因素，“恶意”指的是厌恶对方的情绪，“同理心“指的是以自己的标准要求别人；“配置资源总量”属于分配物的数量因素. 除了上述因素外，Deng 等提出每个主体同时位于两个物理网络的模型[100] ，发现耦合的两个网络相比于单个网络更加促进公平偏好的演化稳定，双向通信要比单向通信更加高效. Zhao 等发现内群偏私能有效提升群体平均提议量和响应量[101] ，内群偏私意味给予相似个体更多分配额，同时接受对方较低提议量. 4 总结及未来发展趋势复杂网络上演化博弈理论不断发展和完善，尤其在两策略竞争理论分析方法上获得了里程碑式进步. 本文首先介绍了在演化博弈框架下合作演化机制的相关研究，详细给出了近年来被广泛关注的个体异质性和环境反馈对于合作演化的影响；其次阐述了五种复杂网络上演化博弈的理论分析方法，包括适用于任意网络结构和更新规则的溯祖随机游走理论；再次总结了在演化博弈框架下的资源配置问题，所采用的博弈模型是最后通牒博弈. 然而最后通牒博弈是典型的连续策略博弈，连续策略在复杂网络中传播所诱导的群体状态维度比两策略庞大很多，因此相应理论分析更具挑战性，相关研究还未形成较为成熟的理论分析框架. 结合目前研究现状，我们发现：利用最后通牒博弈研究公平偏好涌现问题大多采用计算机仿真，而理论分析是深刻理解网络群体中策略竞争的必要条件. 目前关于最后通牒博弈的理论分析往往只是针对特定网络群体，故亟待寻找新工具、新方法来处理一般网络群体的最后通牒博弈. 对于个体交互网络，大多数文献只是关注给定交互异质性的网络群体如何影响公平偏好的涌现. 而不同社会网络所对应的交互异质性往往不同，目前还没有相应成果系统对比异质性不同所诱导的公平行为的差异性. 对于个体资源，往往假定所有个体都是相同的. 鉴于普遍存在的贫富分化现象和收入不均现象，个体资源通常因人而异，所有个体具有相同资源是一种理想化的假设，无法描述个体的差异性属性，由此限制相应理论结果的应用范围，例如无法展现穷人和富人在资源配置过程中决策行为的差异性. 张艳玲等：演化博弈与资源配置综述 · 407 ·

408 工程科学学报，第44卷.第3期目前最后通牒博弈的研究均是在恒定环境下 [16]Debarre F.Fidelity of parent-offspring transmission and the 进行.而策略演化动力学与环境相互影响而形成 evolution of social behavior in structured populations.J Theor 的反馈在生物和社会系统中普遍存在，同时环境 Biol,2017,420:26 [17]McAvoy A,Fraiman N,Hauert C,et al.Public goods games in 反馈已被证实可以促进合作的演化.则环境反馈 populations with fluctuating size.Theor Popul Biol,2018,121: 如何影响公平行为的涌现是一个值得深入探讨和 72 研究的科学问题 [18] Szabo G,Borsos I.Evolutionary potential games on lattices.Phys Rep,2016,624:1 参考文献 [19]Lessard S,Soares C D.Frequency-dependent growth in class- [1] Barabasi A L,Albert R.Emergence of scaling in random structured populations:Continuous dynamics in the limit of weak networks.Science,1999,286(5439):509 selection.J Math Biol,2018,77(1):229 [2] Wang L.Wu T,Zhang Y L.Feedback mechanism in [20]Smith J M,Price G R.The logic of animal conflict.Nature,1973, coevolutionary games.Control Theory Appl,2014,31(7):823 246(5427):15 (王龙，吴特，张艳玲.共演化博弈中的反馈机制.控制理论与 [21]Khoo T,Fu F,Pauls S.Spillover modes in multiplex games: 应用，2014,31(7)：823) Double-edged effects on cooperation and their coevolution.Sci [3] Gallo E,Yan C.The effects of reputational and social knowledge Rep,2018,8:6922 on cooperation.Proc Natl Acad Sci USA,2015,112(12):3647 [22]Wang Q,He N R,Chen X J.Replicator dynamics for public [4] Li X,Cao L.Largest Laplacian eigenvalue predicts the goods game with resource allocation in large populations.Appl emergence of costly punishment in the evolutionary ultimatum Math Comput,2018,328:162 game on networks.Plys Rev E,2009,80(6):066101 [23]Perc M,Jordan J J,Rand D G,et al.Statistical physics of human [5] Doebeli M,Ispolatov Y,Simon B.Point of view:Towards a cooperation.Phys Rep,2017,687:1 mechanistic foundation of evolutionary theory.Elife,2019,6: [24]Hilbe C,Martinez-Vaquero L A,Chatterjee K,et al.Memory-n e23804 strategies of direct reciprocity.Proc Natl Acad Sci USA.2017. [6] Goswami A,Gupta R,Parashari G S.Reputation-based resource 114(18):4715 allocation in P2P systems:A game theoretic perspective./EEE [25] Cheng D Z,Liu Z Q.Application of semi-tensor product of Commmn Lett,2017,21(6):1273 matrices to finite games.Control Theory Appl,2019,36(11): [7] Hilbe C,Wu B,Traulsen A,et al.Cooperation and control in 1812 multiplayer social dilemmas.Proc Natl Acad Sci USA,2014, (程代展，刘泽群.有限博弈的矩阵半张量积方法.控制理论与 111(46):16425 应用.2019,36(11)：1812) [8] Tan S L,Wang Y N.Graphical Nash equilibria and replicator [26] Deng Z H,Nian X H.Distributed generalized Nash equilibrium dynamics on complex networks.IEEE Trans Neural Networks seeking algorithm design for aggregative games over weight- Learn Syst,2020,31(6:1831 balanced digraphs.IEEE Trans Neural Networks Learn Syst, [9] Julou T,Mora T,Guillon L,et al.Cell-cell contacts confine 2019.30(3):695 public goods diffusion inside pseudomonas aeruginosa clonal [27]Zhang R,Zhu Q Y.A game-theoretic approach to design secure microcolonies.Proc Natl Acad Sci USA,2013,110(31):12577 and resilient distributed support vector machines.IEEE Trans [10]Qi S,Footer O,Camerer C F,et al.A collaborator's reputation Neural Networks Learn Syst,2018,29(11):5512 can bias decisions and anxiety under uncertainty.J Neurosci, [28]Chotibut T,Nelson D R.Population genetics with fluctuating 2018,38(9:2262 population sizes.J Stat Phys,2017,167(3-4):777 [11]Feng C,Luo Y J,Krueger F.Neural signatures of fairness-related [29]Constable G W,Rogers T,McKane A J,et al.Demographic noise normative decision making in the ultimatum game:A coordinate- can reverse the direction of deterministic selection.Proc Narl based meta-analysis.Humn Brain Mapp,2015,36(2):591 Acad Sci US4,2016,113(32):4745 [12]Duradoni M,Paolucci M,Bagnoli F,et al.Faimess and trust in [30]Liu Y,Zhang J.An B.et al.A simulation framework for virtual environments:The effects of reputation.Future Internet, measuring robustness of incentive mechanisms and its 2018,10(6:50 implementation in reputation systems.Auton Agents Multi Agent [13]Jeong HC,Oh S Y,Allen B,et al.Optional games on cycles and S31,2016,30(4):581 complete graphs.J Theor Biol,2014,356:98 [31]Zhang Y L,Liu A Z,Sun C Y.Development of several studies on [14]Melamed D,Harrell A,Simpson B.Cooperation,clustering,and indirect reciprocity and the evolution of cooperation.Acta Autom assortative mixing in dynamic networks.Proc Natl Acad Sci Sim,2018,44(1):1 S4,2018,115(5):951 (张艳玲，刘爱志，孙长银.间接互惠与合作演化的若干问题研 [15]Adami C,Schossau J,Hintze A.Evolutionary game theory using 究进展.自动化学报，2018,44(1)：1) agent-based methods.Phys Life Rev,2016,19:1 [32]Rong Z H,Xu X R,Wu Z X.Experiment research on the

目前最后通牒博弈的研究均是在恒定环境下进行. 而策略演化动力学与环境相互影响而形成的反馈在生物和社会系统中普遍存在，同时环境反馈已被证实可以促进合作的演化. 则环境反馈如何影响公平行为的涌现是一个值得深入探讨和研究的科学问题. 参考文献 Barabási A L, Albert R. Emergence of scaling in random networks. Science, 1999, 286（5439）: 509 [1] Wang L, Wu T, Zhang Y L. Feedback mechanism in coevolutionary games. Control Theory Appl, 2014, 31（7）: 823 （王龙, 吴特, 张艳玲. 共演化博弈中的反馈机制. 控制理论与应用, 2014, 31（7）：823） [2] Gallo E, Yan C. The effects of reputational and social knowledge on cooperation. Proc Natl Acad Sci USA, 2015, 112（12）: 3647 [3] Li X, Cao L. Largest Laplacian eigenvalue predicts the emergence of costly punishment in the evolutionary ultimatum game on networks. Phys Rev E, 2009, 80（6）: 066101 [4] Doebeli M, Ispolatov Y, Simon B. Point of view: Towards a mechanistic foundation of evolutionary theory. Elife, 2019, 6: e23804 [5] Goswami A, Gupta R, Parashari G S. Reputation-based resource allocation in P2P systems: A game theoretic perspective. IEEE Commun Lett, 2017, 21（6）: 1273 [6] Hilbe C, Wu B, Traulsen A, et al. Cooperation and control in multiplayer social dilemmas. Proc Natl Acad Sci USA, 2014, 111（46）: 16425 [7] Tan S L, Wang Y N. Graphical Nash equilibria and replicator dynamics on complex networks. IEEE Trans Neural Networks Learn Syst, 2020, 31（6）: 1831 [8] Julou T, Mora T, Guillon L, et al. Cell-cell contacts confine public goods diffusion inside pseudomonas aeruginosa clonal microcolonies. Proc Natl Acad Sci USA, 2013, 110（31）: 12577 [9] Qi S, Footer O, Camerer C F, et al. A collaborator's reputation can bias decisions and anxiety under uncertainty. J Neurosci, 2018, 38（9）: 2262 [10] Feng C, Luo Y J, Krueger F. Neural signatures of fairness-related normative decision making in the ultimatum game: A coordinatebased meta-analysis. Hum Brain Mapp, 2015, 36（2）: 591 [11] Duradoni M, Paolucci M, Bagnoli F, et al. Fairness and trust in virtual environments: The effects of reputation. Future Internet, 2018, 10（6）: 50 [12] Jeong H C, Oh S Y, Allen B, et al. Optional games on cycles and complete graphs. J Theor Biol, 2014, 356: 98 [13] Melamed D, Harrell A, Simpson B. Cooperation, clustering, and assortative mixing in dynamic networks. Proc Natl Acad Sci USA, 2018, 115（5）: 951 [14] Adami C, Schossau J, Hintze A. Evolutionary game theory using agent-based methods. Phys Life Rev, 2016, 19: 1 [15] Débarre F. Fidelity of parent-offspring transmission and the evolution of social behavior in structured populations. J Theor Biol, 2017, 420: 26 [16] McAvoy A, Fraiman N, Hauert C, et al. Public goods games in populations with fluctuating size. Theor Popul Biol, 2018, 121: 72 [17] Szabó G, Borsos I. Evolutionary potential games on lattices. Phys Rep, 2016, 624: 1 [18] Lessard S, Soares C D. Frequency-dependent growth in classstructured populations: Continuous dynamics in the limit of weak selection. J Math Biol, 2018, 77（1）: 229 [19] Smith J M, Price G R. The logic of animal conflict. Nature, 1973, 246（5427）: 15 [20] Khoo T, Fu F, Pauls S. Spillover modes in multiplex games: Double-edged effects on cooperation and their coevolution. Sci Rep, 2018, 8: 6922 [21] Wang Q, He N R, Chen X J. Replicator dynamics for public goods game with resource allocation in large populations. Appl Math Comput, 2018, 328: 162 [22] Perc M, Jordan J J, Rand D G, et al. Statistical physics of human cooperation. Phys Rep, 2017, 687: 1 [23] Hilbe C, Martinez-Vaquero L A, Chatterjee K, et al. Memory-n strategies of direct reciprocity. Proc Natl Acad Sci USA, 2017, 114（18）: 4715 [24] Cheng D Z, Liu Z Q. Application of semi-tensor product of matrices to finite games. Control Theory Appl, 2019, 36（11）: 1812 （程代展, 刘泽群. 有限博弈的矩阵半张量积方法. 控制理论与应用, 2019, 36（11）：1812） [25] Deng Z H, Nian X H. Distributed generalized Nash equilibrium seeking algorithm design for aggregative games over weightbalanced digraphs. IEEE Trans Neural Networks Learn Syst, 2019, 30（3）: 695 [26] Zhang R, Zhu Q Y. A game-theoretic approach to design secure and resilient distributed support vector machines. IEEE Trans Neural Networks Learn Syst, 2018, 29（11）: 5512 [27] Chotibut T, Nelson D R. Population genetics with fluctuating population sizes. J Stat Phys, 2017, 167（3-4）: 777 [28] Constable G W, Rogers T, McKane A J, et al. Demographic noise can reverse the direction of deterministic selection. Proc Natl Acad Sci USA, 2016, 113（32）: 4745 [29] Liu Y, Zhang J, An B, et al. A simulation framework for measuring robustness of incentive mechanisms and its implementation in reputation systems. Auton Agents Multi Agent Syst, 2016, 30（4）: 581 [30] Zhang Y L, Liu A Z, Sun C Y. Development of several studies on indirect reciprocity and the evolution of cooperation. Acta Autom Sin, 2018, 44（1）: 1 （张艳玲, 刘爱志, 孙长银. 间接互惠与合作演化的若干问题研究进展. 自动化学报, 2018, 44（1）：1） [31] [32] Rong Z H, Xu X R, Wu Z X. Experiment research on the · 408 · 工程科学学报，第 44 卷，第 3 期

张艳玲等：演化博弈与资源配置综述 409. evolution of cooperation and network game theory.Sci Sin Phys games.Proc Natl Acad Sci USA,2014,111(49):17558 Mech Astron,.2020,50(1):118 [53]Hilbe C.Simsa S,Chatteriee K,et al.Evolution of cooperation in (荣智海，许雄锐，吴枝喜.合作演化与网络博弈实验研究进展 stochastic games.Nature,2018,559(7713):246 中国科学：物理学力学天文学，2020,50(1)：118) [54]Su Q,MeAvoy A,Wang L,et al.Evolutionary dynamics with [33]Perc M,Gomez-Gardenes J,Szolnoki A,et al.Evolutionary game transitions.Proc Natl Acad Sci USA,2019,116(51):25398 dynamics of group interactions on structured populations:A [55] WeitzJS,Eksin C,Paarporn K,et al.An oscillating tragedy of review.J R Soc Interface,2013,10(80):20120997 the commons in replicator dynamics with game-environment [34]Nowak M A.Five rules for the evolution of cooperation.Science, feedback.Proc Natl Acad Sci USA,2016,113(47):E7518 2006.314(5805):1560 [56] Chen P,Li Q,Zhang D Z,et al.A survey of multimodal machine [35]Van Cleve J.Building a synthetic basis for kin selection and learning.Chin Eng,2020,42(5):557 evolutionary game theory using population genetics.Theor Popul (陈鹏，李擎，张德政，等.多模态学习方法综述.工程科学学报 Biol,2020,133:65 202042(5):557) [36]Allen B,Nowak M A.There is no inclusive fitness at the level of [57]Lin Y H,Weitz J S.Spatial interactions and oscillatory tragedies the individual.Curr Opin Behay Sci,2016,12:122 of the commons.Phys Rev Lett,2019,122(14):148102 [37]Hilbe C,Chatterjee K,Nowak M A.Partners and rivals in direct [58]Chen X,Szolnoki A.Punishment and inspection for governing reciprocity.Nat Hum Behay,2018,2(7):469 the commons in a feedback-evolving game.PLoS Comput Biol, [38]Donahue K,Hauser O P,Nowak M A,et al.Evolving 2018,14(7):e1006347 cooperation in multichannel games.Nat Commm,2020,11:3885 [59]Nowak M A,May R M.Evolutionary games and spatial chaos. [39]Hilbe C,Schmid L,Tkadlec J,et al.Indirect reciprocity with Nature,1992,359(6398):826 private,noisy,and incomplete information.Proc Natl Acad Sci [60]Barabasi A L.Scale-free networks:A decade and beyond. US4,2018,115(48):12241 Science,.2009,325(5939):412 [40]Clark D,Fudenberg D,Wolitzky A.Indirect reciprocity with [61] McAvoy A,Adlam B,Allen B,et al.Stationary frequencies and simple records.Proc Natl Acad Sci USA,2020,117(21):11344 mixing times for neutral drift processes with spatial structure. [41] Hauert C,Saade C,McAvoy A.Asymmetric evolutionary games Pr0 c R Soc A,2018,474(2218):20180238 with environmental feedback./Theor Biol,2019,462:347 [62] Liu J Z,Meng H R,Wang W,et al.Evolution of cooperation on [42] Szolnoki A,Perc M.Second-order free-riding on antisocial independent networks:The influence of asymmetric information punishment restores the effectiveness of prosocial punishment. sharing updating mechanism.App/Math Comput,2019,340:234 Phy3RevX,2017,7(4):041027 [63]Deng Z H,Huang Y J,Gu Z Y,et al.Multi-games on [43]Cooney D B.Analysis of multilevel replicator dynamics for interdependent networks and the evolution of cooperation.Phys general two-strategy social dilemma.Bull Math Biol,2020. 4,2018,510:83 82(6):66 [64] Zhao J Q,Luo C,Zheng Y J.Evolutionary dynamics of the [44]McAvoy A,Allen B,Nowak M A.Social goods dilemmas in cooperation clusters on interdependent networks.Phys 4,2019, heterogeneous societies.Nat Hum Behav,2020,4(8):819 517:132 [45]Su Q,Li A,Wang L.Evolutionary dynamics under interactive [65]Chu C.Hu X.Shen C.et al.Self-organized interdependence diversity.New Phys,2017,19:103023 among populations promotes cooperation by means of [46]Su Q,Zhou L,Wang L.Evolutionary multiplayer games on coevolution.Chaos,2019,29(1):013139 graphs with edge diversity.PLoS Comput Biol,2019,15(4): [66] Szolnoki A,Perc M.Information sharing promotes prosocial e1006947 behaviour.New Phys,2013,15(5):053010 [47]Zhou L,Li A M,Wang L.Evolution of cooperation on complex [67]Szolnoki A.Chen X.Reciprocity-based cooperative phalanx networks with synergistic and discounted group interactions maintained by overconfident players.Phys Rev E,2018,98(2-1): EPL,2015,110(6):60006 022309 [48]Su Q,Li A,Wang L.Evolution of cooperation with interactive [68]Xia C Y,Li X P.Wang Z,et al.Doubly effects of information identity and diversity.J Theor Biol,2018,442:149 sharing on interdependent network reciprocity.New /Phys,2018, [49]Hauser O P,Hilbe C,Chatterjee K,et al.Social dilemmas among 20(7):075005 unequals.Nature,2019,572(7770):524 [69] Ibsen-Jensen R,Chatterjee K,Nowak M A.Computational [50]Szolnoki A,Chen X J.Environmental feedback drives complexity of ecological and evolutionary spatial dynamics.Proc cooperation in spatial social dilemmas.EPL,2017,120(5): Natl Acad Sci USA,2015,112(51):15636 58001 [70]Tarnita C E,Wage N,Nowak M A.Multiple strategies in [51]Akeay E.Collapse and rescue of cooperation in evolving structured populations.Proc Natl Acad Sci US4,2011,108(6): dynamic networks.Nat Commun,2018,9:2692 2334 [52]Stewart A J,Plotkin J B.Collapse of cooperation in evolving [71]Antal T,Ohtsuki H,Wakeley J,et al.Evolution of cooperation by

evolution of cooperation and network game theory. Sci Sin Phys Mech Astron, 2020, 50（1）: 118 （荣智海, 许雄锐, 吴枝喜. 合作演化与网络博弈实验研究进展. 中国科学:物理学力学天文学, 2020, 50（1）：118） Perc M, Gómez-Gardeñes J, Szolnoki A, et al. Evolutionary dynamics of group interactions on structured populations: A review. J R Soc Interface, 2013, 10（80）: 20120997 [33] Nowak M A. Five rules for the evolution of cooperation. Science, 2006, 314（5805）: 1560 [34] Van Cleve J. Building a synthetic basis for kin selection and evolutionary game theory using population genetics. Theor Popul Biol, 2020, 133: 65 [35] Allen B, Nowak M A. There is no inclusive fitness at the level of the individual. Curr Opin Behav Sci, 2016, 12: 122 [36] Hilbe C, Chatterjee K, Nowak M A. Partners and rivals in direct reciprocity. Nat Hum Behav, 2018, 2（7）: 469 [37] Donahue K, Hauser O P, Nowak M A, et al. Evolving cooperation in multichannel games. Nat Commun, 2020, 11: 3885 [38] Hilbe C, Schmid L, Tkadlec J, et al. Indirect reciprocity with private, noisy, and incomplete information. Proc Natl Acad Sci USA, 2018, 115（48）: 12241 [39] Clark D, Fudenberg D, Wolitzky A. Indirect reciprocity with simple records. Proc Natl Acad Sci USA, 2020, 117（21）: 11344 [40] Hauert C, Saade C, McAvoy A. Asymmetric evolutionary games with environmental feedback. J Theor Biol, 2019, 462: 347 [41] Szolnoki A, Perc M. Second-order free-riding on antisocial punishment restores the effectiveness of prosocial punishment. Phys Rev X, 2017, 7（4）: 041027 [42] Cooney D B. Analysis of multilevel replicator dynamics for general two-strategy social dilemma. Bull Math Biol, 2020, 82（6）: 66 [43] McAvoy A, Allen B, Nowak M A. Social goods dilemmas in heterogeneous societies. Nat Hum Behav, 2020, 4（8）: 819 [44] Su Q, Li A, Wang L. Evolutionary dynamics under interactive diversity. New J Phys, 2017, 19: 103023 [45] Su Q, Zhou L, Wang L. Evolutionary multiplayer games on graphs with edge diversity. PLoS Comput Biol, 2019, 15（4）: e1006947 [46] Zhou L, Li A M, Wang L. Evolution of cooperation on complex networks with synergistic and discounted group interactions. EPL, 2015, 110（6）: 60006 [47] Su Q, Li A, Wang L. Evolution of cooperation with interactive identity and diversity. J Theor Biol, 2018, 442: 149 [48] Hauser O P, Hilbe C, Chatterjee K, et al. Social dilemmas among unequals. Nature, 2019, 572（7770）: 524 [49] Szolnoki A, Chen X J. Environmental feedback drives cooperation in spatial social dilemmas. EPL, 2017, 120（5）: 58001 [50] Akçay E. Collapse and rescue of cooperation in evolving dynamic networks. Nat Commun, 2018, 9: 2692 [51] [52] Stewart A J, Plotkin J B. Collapse of cooperation in evolving games. Proc Natl Acad Sci USA, 2014, 111（49）: 17558 Hilbe C, Šimsa Š, Chatterjee K, et al. Evolution of cooperation in stochastic games. Nature, 2018, 559（7713）: 246 [53] Su Q, McAvoy A, Wang L, et al. Evolutionary dynamics with game transitions. Proc Natl Acad Sci USA, 2019, 116（51）: 25398 [54] Weitz J S, Eksin C, Paarporn K, et al. An oscillating tragedy of the commons in replicator dynamics with game-environment feedback. Proc Natl Acad Sci USA, 2016, 113（47）: E7518 [55] Chen P, Li Q, Zhang D Z, et al. A survey of multimodal machine learning. Chin J Eng, 2020, 42（5）: 557 （陈鹏, 李擎, 张德政, 等. 多模态学习方法综述. 工程科学学报, 2020, 42（5）：557） [56] Lin Y H, Weitz J S. Spatial interactions and oscillatory tragedies of the commons. Phys Rev Lett, 2019, 122（14）: 148102 [57] Chen X, Szolnoki A. Punishment and inspection for governing the commons in a feedback-evolving game. PLoS Comput Biol, 2018, 14（7）: e1006347 [58] Nowak M A, May R M. Evolutionary games and spatial chaos. Nature, 1992, 359（6398）: 826 [59] Barabási A L. Scale-free networks: A decade and beyond. Science, 2009, 325（5939）: 412 [60] McAvoy A, Adlam B, Allen B, et al. Stationary frequencies and mixing times for neutral drift processes with spatial structure. Proc R Soc A, 2018, 474（2218）: 20180238 [61] Liu J Z, Meng H R, Wang W, et al. Evolution of cooperation on independent networks: The influence of asymmetric information sharing updating mechanism. Appl Math Comput, 2019, 340: 234 [62] Deng Z H, Huang Y J, Gu Z Y, et al. Multi-games on interdependent networks and the evolution of cooperation. Phys A, 2018, 510: 83 [63] Zhao J Q, Luo C, Zheng Y J. Evolutionary dynamics of the cooperation clusters on interdependent networks. Phys A, 2019, 517: 132 [64] Chu C, Hu X, Shen C, et al. Self-organized interdependence among populations promotes cooperation by means of coevolution. Chaos, 2019, 29（1）: 013139 [65] Szolnoki A, Perc M. Information sharing promotes prosocial behaviour. New J Phys, 2013, 15（5）: 053010 [66] Szolnoki A, Chen X. Reciprocity-based cooperative phalanx maintained by overconfident players. Phys Rev E, 2018, 98（2-1）: 022309 [67] Xia C Y, Li X P, Wang Z, et al. Doubly effects of information sharing on interdependent network reciprocity. New J Phys, 2018, 20（7）: 075005 [68] Ibsen-Jensen R, Chatterjee K, Nowak M A. Computational complexity of ecological and evolutionary spatial dynamics. Proc Natl Acad Sci USA, 2015, 112（51）: 15636 [69] Tarnita C E, Wage N, Nowak M A. Multiple strategies in structured populations. Proc Natl Acad Sci USA, 2011, 108（6）: 2334 [70] [71] Antal T, Ohtsuki H, Wakeley J, et al. Evolution of cooperation by 张艳玲等：演化博弈与资源配置综述 · 409 ·

410 工程科学学报，第44卷，第3期 phenotypic similarity.Proc Natl Acad Sci USA,2009,106(21): promotes rational sharing.Sci Rep,2018,8(1):1222 8597 [88]Rand D G,Tarnita C E.Ohtsuki H,et al.Evolution of fairness in [72]Zhang Y,Liu A,Sun C.Impact of migration on the multi-strategy the one-shot anonymous Ultimatum Game.Proc Natl Acad Sci selection in finite group-structured populations.Sci Rep,2016,6: US4,2013,110(7):2581 35114 [89]Killingback T,Studer E.Spatial Ultimatum Games, [73]Ohtsuki H.Hauert C.Lieberman E,et al.A simple rule for the collaborations and the evolution of fairness.Proc Biol Sci,2001, evolution of cooperation on graphs and social networks.Nature, 268(1478):1797 2006,441(7092):502 [90]Wu T,Fu F,Zhang Y,et al.Adaptive role switching promotes [74]Allen B,Lippner G.Chen Y T,et al.Evolutionary dynamics on fairness in networked ultimatum game.Sci Rep,2013,3:1550 any population structure.Narre,2017,544(7649):227 [91]Yang Z H,Li Z.Wu T,et al.Effects of partner choice and role [75]Allen B,McAvoy A.A mathematical formalism for natural assignation in the spatial ultimatum game.EPL,2015,109(4): selection with arbitrary spatial and genetic structure.Math Biol, 40013 2019,78(4):1147 [92] Forber P,Smead R.The evolution of fairness through spite.Proc [76]Allen B,Nowak M.Games on graphs.EMS Surv Math Sci,2014, Biol Sci,2014,281(1780):20132439 1(1):113 [93] Zhang YL.Fu F.Strategy intervention for the evolution of [77]Zhang Y L,Fu F,Wu T,et al.A tale of two contribution fairess.PLoS One,2018,13(5):e0196524 mechanisms for nonlinear public goods.Sci Rep,2013,3:2021 [94] Szolnoki A,Perc M,Szabo G.Defense mechanisms of [78]Debove S,Baumard N.Andre J B.Models of the evolution of empathetic players in the spatial ultimatum game.Phys Rey Lett, fairness in the ultimatum game:A review and classification.Evol 2012,109(7):078701 Hum Behav,2016,37(3):245 [95]Page K M,Nowak M A.Empathy leads to fairness.Bull Math [79] Santos F P,Santos F C,Paiva A,et al.Evolutionary dynamics of BioL,2002,64(6):1101 group fairness.Theor Biol,2015,378:96 [96]Zhang Y L,Liu J,Li A M.Effects of empathy on the [80] Takesue H,Ozawa A,Morikawa S.Evolution of favoritism and evolutionary dynamics of fairness in group-structured systems. group fairness in a co-evolving three-person ultimatum game. EPL,2017,118(4):48002 Complexi0,2019,2019:2915020 [81] Page K M,Nowak M A,Sigmund K.The spatial ultimatum [97]Wang X,Chen X,Wang L.Random allocation of pies promotes game.Proc R Soc Lond B,2000,267(1458):2177 the evolution of fairess in the Ultimatum Game.Sci Rep,2014, [82] Alexander J M K.The Structural Evolution of Morality. 4:4534 Cambridge University Press,2007 [98]Chen W,Wu T,Li Z W,et al.Heterogenous allocation of chips [83] Iranzo J,Roman J,Sanchez A.The spatial Ultimatum game promotes faimess in the Ultimatum Game.EPL,2015,109(6): revisited.J Theor Biol,2011,278(1):1 68006 [84]Gao J,Li Z,Wu T,et al.The coevolutionary ultimatum game. [99]Zhang Y L,Chen X J,Liu A Z,et al.The effect of the stake size EPL,2011,93(4:48003 on the evolution of faimess.Appl Math Comput,2018,321:641 [85]Wang X F,Chen X J,Wang L.Evolutionary dynamics of fairness [100]Deng LL,Lin Y,Wang C,et al.Effects of coupling strength and on graphs with migration.J Theor Biol,2015,380:103 coupling schemes between interdependent lattices on the [86]Szolnoki A,Perc M,Szabo G.Accuracy in strategy imitations evolutionary ultimatum game.Phys,2020,540:123173 promotes the evolution of fairness in the spatial ultimatum game. [101]Zhao Y K,Xiong T,Zheng L,et al.The effect of similarity on the EPL,2012,100(2):28005 evolution of faimess in the ultimatum game.Chaos Soliton Fract, [87]Han X,Cao S,Bao J Z,et al.Equal status in Ultimatum Games 2020,131:109494

phenotypic similarity. Proc Natl Acad Sci USA, 2009, 106（21）: 8597 Zhang Y, Liu A, Sun C. Impact of migration on the multi-strategy selection in finite group-structured populations. Sci Rep, 2016, 6: 35114 [72] Ohtsuki H, Hauert C, Lieberman E, et al. A simple rule for the evolution of cooperation on graphs and social networks. Nature, 2006, 441（7092）: 502 [73] Allen B, Lippner G, Chen Y T, et al. Evolutionary dynamics on any population structure. Nature, 2017, 544（7649）: 227 [74] Allen B, McAvoy A. A mathematical formalism for natural selection with arbitrary spatial and genetic structure. J Math Biol, 2019, 78（4）: 1147 [75] Allen B, Nowak M. Games on graphs. EMS Surv Math Sci, 2014, 1（1）: 113 [76] Zhang Y L, Fu F, Wu T, et al. A tale of two contribution mechanisms for nonlinear public goods. Sci Rep, 2013, 3: 2021 [77] Debove S, Baumard N, André J B. Models of the evolution of fairness in the ultimatum game: A review and classification. Evol Hum Behav, 2016, 37（3）: 245 [78] Santos F P, Santos F C, Paiva A, et al. Evolutionary dynamics of group fairness. J Theor Biol, 2015, 378: 96 [79] Takesue H, Ozawa A, Morikawa S. Evolution of favoritism and group fairness in a co-evolving three-person ultimatum game. EPL, 2017, 118（4）: 48002 [80] Page K M, Nowak M A, Sigmund K. The spatial ultimatum game. Proc R Soc Lond B, 2000, 267（1458）: 2177 [81] Alexander J M K. The Structural Evolution of Morality. Cambridge University Press, 2007 [82] Iranzo J, Román J, Sánchez A. The spatial Ultimatum game revisited. J Theor Biol, 2011, 278（1）: 1 [83] Gao J, Li Z, Wu T, et al. The coevolutionary ultimatum game. EPL, 2011, 93（4）: 48003 [84] Wang X F, Chen X J, Wang L. Evolutionary dynamics of fairness on graphs with migration. J Theor Biol, 2015, 380: 103 [85] Szolnoki A, Perc M, Szabó G. Accuracy in strategy imitations promotes the evolution of fairness in the spatial ultimatum game. EPL, 2012, 100（2）: 28005 [86] [87] Han X, Cao S, Bao J Z, et al. Equal status in Ultimatum Games promotes rational sharing. Sci Rep, 2018, 8（1）: 1222 Rand D G, Tarnita C E, Ohtsuki H, et al. Evolution of fairness in the one-shot anonymous Ultimatum Game. Proc Natl Acad Sci USA, 2013, 110（7）: 2581 [88] Killingback T, Studer E. Spatial Ultimatum Games, collaborations and the evolution of fairness. Proc Biol Sci, 2001, 268（1478）: 1797 [89] Wu T, Fu F, Zhang Y, et al. Adaptive role switching promotes fairness in networked ultimatum game. Sci Rep, 2013, 3: 1550 [90] Yang Z H, Li Z, Wu T, et al. Effects of partner choice and role assignation in the spatial ultimatum game. EPL, 2015, 109（4）: 40013 [91] Forber P, Smead R. The evolution of fairness through spite. Proc Biol Sci, 2014, 281（1780）: 20132439 [92] Zhang Y L, Fu F. Strategy intervention for the evolution of fairness. PLoS One, 2018, 13（5）: e0196524 [93] Szolnoki A, Perc M, Szabó G. Defense mechanisms of empathetic players in the spatial ultimatum game. Phys Rev Lett, 2012, 109（7）: 078701 [94] Page K M, Nowak M A. Empathy leads to fairness. Bull Math Biol, 2002, 64（6）: 1101 [95] Zhang Y L, Liu J, Li A M. Effects of empathy on the evolutionary dynamics of fairness in group-structured systems. Complexity, 2019, 2019: 2915020 [96] Wang X, Chen X, Wang L. Random allocation of pies promotes the evolution of fairness in the Ultimatum Game. Sci Rep, 2014, 4: 4534 [97] Chen W, Wu T, Li Z W, et al. Heterogenous allocation of chips promotes fairness in the Ultimatum Game. EPL, 2015, 109（6）: 68006 [98] Zhang Y L, Chen X J, Liu A Z, et al. The effect of the stake size on the evolution of fairness. Appl Math Comput, 2018, 321: 641 [99] Deng L L, Lin Y, Wang C, et al. Effects of coupling strength and coupling schemes between interdependent lattices on the evolutionary ultimatum game. Phys A, 2020, 540: 123173 [100] Zhao Y K, Xiong T, Zheng L, et al. The effect of similarity on the evolution of fairness in the ultimatum game. Chaos Soliton Fract, 2020, 131: 109494 [101] · 410 · 工程科学学报，第 44 卷，第 3 期

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录