404 工程科学学报,第44卷.第3期 (a 致不同的收益矩阵,环境通过收益矩阵的变化直 接反过来影响策略演化动力学.Hilbe等将随机博 弈思想融入重复博弈,具体而言,每一轮的个体行 为及博弈共同决定下一轮的博弈5]此时,环境反 馈和直接互惠可以极大促进合作的演化,远高于 只有环境反馈或直接互惠所诱导的合作水平.类 似地,Su等将随机博弈思想融入规则网络群体54, d 其中博弈转移大大放松合作演化的条件,特别地, 即使在每个备选博弈中合作无法演化,而在备选 博弈间转移却能够促进合作的演化.Weitz等将群 体中博弈的变化由一个类似的复制动力学刻画, 图1五大促进合作涌现的机制(a)亲缘选择:(b)直接互惠:(c)间 发现群体在好环境、坏环境、合作、背叛间不断往 接互惠;(d)群组选择:(e)网络互惠 复震荡啊稍后的研究表明类似的震荡环也出现 Fig.I Five mechanisms for the emergence of cooperation(a)kin 在环境反馈下的非对称两人博弈和网络群体65刃 selection;(b)direct reciprocity;(c)indirect reciprocity;(d)group 同时研究框架被推广到公共品博弈58],发现资源反 selection;(e)network reciprocity 馈可以有效促进合作的演化 较过程中,展现出来的身心特征上的彼此各不相 2复杂网络上演化博弈的理论分析方法 同的现象,这主要是由于个体的成长过程受遗传 和环境的交互影响.例如,主体间的能力有高低之 自从Nowak和May开创性地研究了方格网络 分,不同主体才能的形成有早有晚,且各有所长 群体中的囚徒困境5网,复杂网络上的演化博弈成 个体异质性在群体竞争中普遍存在,演化博弈研 为研究网络群体中策略竞争的有效工具.常见的网 究的异质个体可归为三类:其一是异质网络中,每 络包括规则网络、小世界网络、无标度网络和社 个主体参与博弈总次数呈现天然异质性,而这种 团结构网络,如图2所示5960.目前,国内外学者 异质性从整体上利于合作的演化.其二是个体 对复杂网络上的两策略竞争进行了系统的研究61-6烈, 间行为模式存在异质性,即个体与不同对手采取 相关研究大多利用计算机仿真进行63-8】而理论 不同策略、不同交互概率和模仿概率,这种差异性 分析是深刻理解网络群体中策略竞争的必要条 可以在一定条件下促进两人博弈啊或多人博弈中 件.在中性选择这种适应度与收益无关的特殊情 合作的演化6其三是公共品博弈的投资、产出和 形下,策略在网络的扩散过程仅仅依赖随机漂移 分配额因人而异.当产出的协同效应和折扣效应 (由状态更新过程本身的随机性所决定).相应固 以概率共存时,高概率的协同效应能够促进合作叨: 定概率具有封闭形式计算公式,这里的固定概率 在分配额越大的博弈中投资越多,越有利于合作 指的是单个变异体传播到整个群体的概率,具体 的演化,在重复博弈中,投资的极端异质性抑制 数值往往与变异体出现的位置相关.然而,复杂网 合作,而当个体间分配额存在差异时,适当的投资 络上一般演化博弈的理论研究较为稀少,且在弱 异质性反而是促进合作的必要条件例 选择情形下进行.弱选择意味适应度对收益依赖 策略演化动力学与环境相互影响而形成的反 程度较小,允许扰动理论的使用,从而获得解析成 馈在生物和社会系统中普遍存在.例如,接种疫苗 果.同时探索弱选择情形的演化博弈具有现实意 的不充分往往导致本可以预防的传染病大规模爆 义,因为每个主体在生活中参与大量博弈,而单一 发;之后,政府通过宣传疫苗接种必要性等反馈措 博弈对适应度的影响往往很小.况且在强选择情 施改善疫苗的接种环境和群体的决策行为.最近, 形下,即适应度依赖收益的程度较大,相应固定概 环境反馈对于合作演化的影响激发了研究人员的 率已被证明没有封闭形式计算公式,也不能被一 浓厚兴趣0-,这里探讨的环境反馈是在随机博 个多项式时间算法所求解69下面,将分别阐述两 弈的研究框架下的定义的,随机博弈通常包括若 类主流的复杂网络上演化博弈理论分析方法:针 干个博弈主体、各主体的策略集合、收益矩阵及 对离散策略,计算σ-占优条件;针对连续策略,分 更新过程.收益矩阵和更新过程令部分主体改变 析适应动力学 自身策略,从而影响环境状态;环境状态的变化导 针对离散策略,弱选择情形下最一般理论结较过程中,展现出来的身心特征上的彼此各不相 同的现象,这主要是由于个体的成长过程受遗传 和环境的交互影响. 例如,主体间的能力有高低之 分,不同主体才能的形成有早有晚,且各有所长. 个体异质性在群体竞争中普遍存在,演化博弈研 究的异质个体可归为三类:其一是异质网络中,每 个主体参与博弈总次数呈现天然异质性,而这种 异质性从整体上利于合作的演化[44] . 其二是个体 间行为模式存在异质性,即个体与不同对手采取 不同策略、不同交互概率和模仿概率,这种差异性 可以在一定条件下促进两人博弈[45] 或多人博弈中 合作的演化[46] . 其三是公共品博弈的投资、产出和 分配额因人而异. 当产出的协同效应和折扣效应 以概率共存时,高概率的协同效应能够促进合作[47] ; 在分配额越大的博弈中投资越多,越有利于合作 的演化[48] ;在重复博弈中,投资的极端异质性抑制 合作,而当个体间分配额存在差异时,适当的投资 异质性反而是促进合作的必要条件[49] . 策略演化动力学与环境相互影响而形成的反 馈在生物和社会系统中普遍存在. 例如,接种疫苗 的不充分往往导致本可以预防的传染病大规模爆 发;之后,政府通过宣传疫苗接种必要性等反馈措 施改善疫苗的接种环境和群体的决策行为. 最近, 环境反馈对于合作演化的影响激发了研究人员的 浓厚兴趣[50−52] ,这里探讨的环境反馈是在随机博 弈的研究框架下的定义的,随机博弈通常包括若 干个博弈主体、各主体的策略集合、收益矩阵及 更新过程. 收益矩阵和更新过程令部分主体改变 自身策略,从而影响环境状态;环境状态的变化导 致不同的收益矩阵,环境通过收益矩阵的变化直 接反过来影响策略演化动力学. Hilbe 等将随机博 弈思想融入重复博弈,具体而言,每一轮的个体行 为及博弈共同决定下一轮的博弈[53] . 此时,环境反 馈和直接互惠可以极大促进合作的演化,远高于 只有环境反馈或直接互惠所诱导的合作水平. 类 似地,Su 等将随机博弈思想融入规则网络群体[54] , 其中博弈转移大大放松合作演化的条件,特别地, 即使在每个备选博弈中合作无法演化,而在备选 博弈间转移却能够促进合作的演化. Weitz 等将群 体中博弈的变化由一个类似的复制动力学刻画, 发现群体在好环境、坏环境、合作、背叛间不断往 复震荡[55] . 稍后的研究表明类似的震荡环也出现 在环境反馈下的非对称两人博弈和网络群体[56−57] . 同时研究框架被推广到公共品博弈[58] ,发现资源反 馈可以有效促进合作的演化. 2 复杂网络上演化博弈的理论分析方法 σ− 自从 Nowak 和 May 开创性地研究了方格网络 群体中的囚徒困境[59] ,复杂网络上的演化博弈成 为研究网络群体中策略竞争的有效工具. 常见的网 络包括规则网络、小世界网络、无标度网络和社 团结构网络,如图 2 所示[59−60] . 目前,国内外学者 对复杂网络上的两策略竞争进行了系统的研究[61−62] , 相关研究大多利用计算机仿真进行[63−68] . 而理论 分析是深刻理解网络群体中策略竞争的必要条 件. 在中性选择这种适应度与收益无关的特殊情 形下,策略在网络的扩散过程仅仅依赖随机漂移 (由状态更新过程本身的随机性所决定). 相应固 定概率具有封闭形式计算公式,这里的固定概率 指的是单个变异体传播到整个群体的概率,具体 数值往往与变异体出现的位置相关. 然而,复杂网 络上一般演化博弈的理论研究较为稀少,且在弱 选择情形下进行. 弱选择意味适应度对收益依赖 程度较小,允许扰动理论的使用,从而获得解析成 果. 同时探索弱选择情形的演化博弈具有现实意 义,因为每个主体在生活中参与大量博弈,而单一 博弈对适应度的影响往往很小. 况且在强选择情 形下,即适应度依赖收益的程度较大,相应固定概 率已被证明没有封闭形式计算公式,也不能被一 个多项式时间算法所求解[69] . 下面,将分别阐述两 类主流的复杂网络上演化博弈理论分析方法:针 对离散策略,计算 占优条件;针对连续策略,分 析适应动力学. 针对离散策略,弱选择情形下最一般理论结 (a) (b) (c) (e) (d) 图 1 五大促进合作涌现的机制[34] . (a)亲缘选择;(b)直接互惠;(c)间 接互惠;(d)群组选择;(e)网络互惠 Fig.1 Five mechanisms for the emergence of cooperation[34] : (a) kin selection; (b) direct reciprocity; (c) indirect reciprocity; (d) group selection; (e) network reciprocity · 404 · 工程科学学报,第 44 卷,第 3 期