正在加载图片...
张艳玲等:演化博弈与资源配置综述 407 响应者为了获得较高收益而提高自身响应量.但 的声望;“恶意”和“同理心”属于分配意图方面的 提议量也没有必要高于50%,一旦超过50%,个体 博弈决策情境因素,“恶意”指的是厌恶对方的情 更愿意担当响应者 绪,“同理心“指的是以自己的标准要求别人;“配 其三是恶意四和非单调拒绝.恶意指的是所 置资源总量”属于分配物的数量因素.除了上述因 采取的行为令对手获得较少收益或遭受更多损 素外,Deng等提出每个主体同时位于两个物理网 失,具体表现为个体作为提议者提供给对方较低 络的模型0,发现耦合的两个网络相比于单个网 分配额,而作为响应者拒绝较低提议量.非单调拒 络更加促进公平偏好的演化稳定,双向通信要比 绝指的是个体不仅拒绝较低的还拒绝较高的提议 单向通信更加高效,Zhao等发现内群偏私能有效 量.这两种行为的存在性已被行为学实验所证实, 提升群体平均提议量和响应量),内群偏私意味 同时也激发了大量行为学实验调查它们对于公平 给予相似个体更多分配额,同时接受对方较低提 演化的影响.鉴于此,Zhang与Fu在任意网络群体 议量 中,从理论上对融入这两种行为的离散策略最后 4总结及未来发展趋势 通牒博弈模型进行了分析9)以策略干预的研究 思路,即在原本旗鼓相当的公平和自私的竞争中, 复杂网络上演化博弈理论不断发展和完善, 通过依次加入利他策略、恶意策略、非单调拒绝 尤其在两策略竞争理论分析方法上获得了里程碑 行为,发现利他抑制公平的演化,恶意和非单调拒 式进步.本文首先介绍了在演化博弈框架下合作 绝促进公平的演化 演化机制的相关研究,详细给出了近年来被广泛 其四是同理心侧-同理心指的是个体提议 关注的个体异质性和环境反馈对于合作演化的影 量等于其响应量,意味个体期待对方给予自身的 响:其次阐述了五种复杂网络上演化博弈的理论 份额不低于自身给予他人的份额.大量研究通常 分析方法,包括适用于任意网络结构和更新规则 将同理心的存在作为前提假设,发现其在众多网 的潮祖随机游走理论:再次总结了在演化博弈框 络群体中能够促进公平的涌现.Zhang等在社团结 架下的资源配置问题,所采用的博弈模型是最后 构群体中假设同理心可随时间演化,研究同理心 通牒博弈.然而最后通牒博弈是典型的连续策略 与噪声如何共同影响公平的演化适量的初始 博弈,连续策略在复杂网络中传播所诱导的群体 同理心和噪声所诱导的群体资源配置行为与行为 状态维度比两策略庞大很多,因此相应理论分析 学实验所展现的分配行为相符合.当噪声较低时, 更具挑战性,相关研究还未形成较为成熟的理论 初始同理心越强,越有利于群体决策行为接近绝 分析框架.结合目前研究现状,我们发现: 对公平;而当噪声较高时,初始同理心越强反而不 利用最后通牒博弈研究公平偏好涌现问题大 利于公平的涌现 多采用计算机仿真,而理论分析是深刻理解网络 其五是配置资源总量7]你可以轻易地拒 群体中策略竞争的必要条件.目前关于最后通牒 绝100元的1%,但你会拒绝100亿元的1%吗? 博弈的理论分析往往只是针对特定网络群体,故 实验者为证实配置资源对于公平的影响进行了大 亟待寻找新工具、新方法来处理一般网络群体的 量实验,但仍缺乏一致性结论.Zhang等理论分析 最后通牒博弈 了最后通牒博弈中配置资源如何影响资源配置行 对于个体交互网络,大多数文献只是关注给 为四.推导了社团结构群体中平均提议量和响应 定交互异质性的网络群体如何影响公平偏好的涌 量,发现二者所占比例反比于配置资源,即随着配 现.而不同社会网络所对应的交互异质性往往不 置资源量的增加,群体所展现的决策行为越来越 同,目前还没有相应成果系统对比异质性不同所 接近于子博弈完美纳什均衡.而群体平均提议量 诱导的公平行为的差异性 和响应量本身的大小二次依赖于配置资源,其中 对于个体资源,往往假定所有个体都是相同 配置资源越大,提议量越大,而适中的配置资源诱 的.鉴于普遍存在的贫富分化现象和收入不均现 导最大的响应量 象,个体资源通常因人而异,所有个体具有相同资 “角色分配”和“声望”属于博弈双方的关系因 源是一种理想化的假设,无法描述个体的差异性 素,“角色分配”指的是博弈中的身份,并非随机指 属性,由此限制相应理论结果的应用范围,例如无 定,而是通过一定手段获得提议者的身份,“声望” 法展现穷人和富人在资源配置过程中决策行为的 指的是提议者做决策时会考虑提议方案影响自身 差异性50% 50% 响应者为了获得较高收益而提高自身响应量. 但 提议量也没有必要高于 ,一旦超过 ,个体 更愿意担当响应者. 其三是恶意[92] 和非单调拒绝. 恶意指的是所 采取的行为令对手获得较少收益或遭受更多损 失,具体表现为个体作为提议者提供给对方较低 分配额,而作为响应者拒绝较低提议量. 非单调拒 绝指的是个体不仅拒绝较低的还拒绝较高的提议 量. 这两种行为的存在性已被行为学实验所证实, 同时也激发了大量行为学实验调查它们对于公平 演化的影响. 鉴于此,Zhang 与 Fu 在任意网络群体 中,从理论上对融入这两种行为的离散策略最后 通牒博弈模型进行了分析[93] . 以策略干预的研究 思路,即在原本旗鼓相当的公平和自私的竞争中, 通过依次加入利他策略、恶意策略、非单调拒绝 行为,发现利他抑制公平的演化,恶意和非单调拒 绝促进公平的演化. 其四是同理心[94−95] . 同理心指的是个体提议 量等于其响应量,意味个体期待对方给予自身的 份额不低于自身给予他人的份额. 大量研究通常 将同理心的存在作为前提假设,发现其在众多网 络群体中能够促进公平的涌现. Zhang 等在社团结 构群体中假设同理心可随时间演化,研究同理心 与噪声如何共同影响公平的演化[96] . 适量的初始 同理心和噪声所诱导的群体资源配置行为与行为 学实验所展现的分配行为相符合. 当噪声较低时, 初始同理心越强,越有利于群体决策行为接近绝 对公平;而当噪声较高时,初始同理心越强反而不 利于公平的涌现. 其五是配置资源总量[97−98] . 你可以轻易地拒 绝 100 元的 1%,但你会拒绝 100 亿元的 1% 吗? 实验者为证实配置资源对于公平的影响进行了大 量实验,但仍缺乏一致性结论. Zhang 等理论分析 了最后通牒博弈中配置资源如何影响资源配置行 为[99] . 推导了社团结构群体中平均提议量和响应 量,发现二者所占比例反比于配置资源,即随着配 置资源量的增加,群体所展现的决策行为越来越 接近于子博弈完美纳什均衡. 而群体平均提议量 和响应量本身的大小二次依赖于配置资源,其中 配置资源越大,提议量越大,而适中的配置资源诱 导最大的响应量. “角色分配”和“声望”属于博弈双方的关系因 素,“角色分配”指的是博弈中的身份,并非随机指 定,而是通过一定手段获得提议者的身份,“声望” 指的是提议者做决策时会考虑提议方案影响自身 的声望;“恶意”和“同理心”属于分配意图方面的 博弈决策情境因素,“恶意”指的是厌恶对方的情 绪,“同理心“指的是以自己的标准要求别人;“配 置资源总量”属于分配物的数量因素. 除了上述因 素外,Deng 等提出每个主体同时位于两个物理网 络的模型[100] ,发现耦合的两个网络相比于单个网 络更加促进公平偏好的演化稳定,双向通信要比 单向通信更加高效. Zhao 等发现内群偏私能有效 提升群体平均提议量和响应量[101] ,内群偏私意味 给予相似个体更多分配额,同时接受对方较低提 议量. 4    总结及未来发展趋势 复杂网络上演化博弈理论不断发展和完善, 尤其在两策略竞争理论分析方法上获得了里程碑 式进步. 本文首先介绍了在演化博弈框架下合作 演化机制的相关研究,详细给出了近年来被广泛 关注的个体异质性和环境反馈对于合作演化的影 响;其次阐述了五种复杂网络上演化博弈的理论 分析方法,包括适用于任意网络结构和更新规则 的溯祖随机游走理论;再次总结了在演化博弈框 架下的资源配置问题,所采用的博弈模型是最后 通牒博弈. 然而最后通牒博弈是典型的连续策略 博弈,连续策略在复杂网络中传播所诱导的群体 状态维度比两策略庞大很多,因此相应理论分析 更具挑战性,相关研究还未形成较为成熟的理论 分析框架. 结合目前研究现状,我们发现: 利用最后通牒博弈研究公平偏好涌现问题大 多采用计算机仿真,而理论分析是深刻理解网络 群体中策略竞争的必要条件. 目前关于最后通牒 博弈的理论分析往往只是针对特定网络群体,故 亟待寻找新工具、新方法来处理一般网络群体的 最后通牒博弈. 对于个体交互网络,大多数文献只是关注给 定交互异质性的网络群体如何影响公平偏好的涌 现. 而不同社会网络所对应的交互异质性往往不 同,目前还没有相应成果系统对比异质性不同所 诱导的公平行为的差异性. 对于个体资源,往往假定所有个体都是相同 的. 鉴于普遍存在的贫富分化现象和收入不均现 象,个体资源通常因人而异,所有个体具有相同资 源是一种理想化的假设,无法描述个体的差异性 属性,由此限制相应理论结果的应用范围,例如无 法展现穷人和富人在资源配置过程中决策行为的 差异性. 张艳玲等: 演化博弈与资源配置综述 · 407 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有