正在加载图片...
第3期 邓云生,等:基于囚徒困境策略的改进HK网络上的合作博弈 ·483· (13) 以50%的比例随机存在于网络中,博弈演化规则如 图4所示,博弈次数1000次,取最后50次博弈中 式中b>1。令S代表博弈个体的策略类型,其取值为 合作者密度的平均值为达到动态平衡时的合作者密 [10]'(代表合作)或[01'(代表背叛);个体i与其邻 度,记为f仿真结果如图5所示。 居进行一次博弈所得收益u,可以表示为叫,=SPS, 初始策略以一定 在每一轮博弈过程中,每个博弈个体都与自己直接 比例随机分布在 相连的邻居进行博弈,将博弈个体得到的收益总和 网络中 记为 U,=∑SPS, 节点从邻接 (14) 点处获得累 计收益U 式中2:为i的所有邻居节点集合。然后所有个体更 新它们的策略,即个体随机选择自己的邻居j,比较 根据动力学 它们的收益,若有4≥,则个体在下一轮中采取的 规则及概率 博弈策略不变;否则个体将以概率,采取其邻居 P更新策略 j的策略进行下一轮博弈。其中 15-4 P=(T-S)max (ki,k) (15) 系统是否达到预先设定 式中max(k,k,)表示节点i与j中度数较大者,若在博 的时间步 弈过程中使用收益矩阵公式(13),那么则有T-S=b。 r 式(15)说明节点接纳其邻居j的策略的概率正比于 、输出合作比例P。 两者收益之差,同时也说明高收益节点所采用的策 略容易被其低收益的邻居节点所采纳,反之低收益 图4博弈演化流程 节点所采用的策略不可能侵犯高收益的节点。 Fig.4 Process of game evolution 此外合作者密度P()是用来刻画网络博弈行为 1.00 的重要物理量,其定义为采取合作策略的博弈个体 0.95 0.90 占所有博弈个体的比例,即p()=nmW-,nw表示 0.85 博弈时采用合作策略的博弈个体数量。在网络科 0.80 学研究的过程中通常会关注某一类节点的整体行 0.75 eEHK网络 0.70 为。当网络博弈进行的某一时刻,网络中采取合作 0 0.10.20.30.40.50.60.70.80.91.0 策略的节点比例趋于稳定不再发生变化,则称这些 图5合作者比例随聚类系数变化 采取合作策略的节点达到合作稳定状态。这种多数 Fig.5 Variation in the partner proportion and clustering 节点的合作稳定状态也正是本文需要研究的内容。 coefficient 博弈初始时刻,采用合作策略和背叛策略的博弈个 图5中每个数据是相同初始条件下10次重复 体均以50%的比例随机存在于生成的EHK网络 实验所得到的平均值。由图5仿真结果可知合作者 中,每个博弈个体根据其初始策略和收益矩阵按照 比例维持在0.75以上,这充分表明EHK网络对合 式()计算其收益总和,然后根据策略更新规则式(15) 作行为具有较大的促进作用。其原因是,EHK网络 更新其策略,更新完后的策略作为博弈个体下一轮 是高聚类异质网络,其中必然会存在许多具有多三 博弈中使用的策略。每一次博弈策略的更新会使合 角形结构的高连接度的hub节点,若hub节点选择 作者密度ρ(①)在下一次博弈之前发生变化,随着博 合作策略,由于其采用累计收益的计算方式,会使 弈的不断进行,合作者密度()会逐渐达到动态平 hub节点获得较高的收益,由式(15)可知其所采用 衡状态。博弈演化流程如图4所示。 的合作策略容易被其低收益的邻居节点采纳。由 3.2仿真分析 式(13)可知采用(C,C)策略的双方收益都为1,而 3.2.1高聚类特性对合作行为的影响 hub节点采用累计收益的计算方式,会使其始终成 由第2节的研究可知,相同条件下可调节概率 为被模仿的对象,这有利于合作行为在网络中进行 p的值越大,其生成网络的聚类系数越高,故可直接 传播。 用p值对网络动力学特征进行讨论。在由m=m=2、 若hub节点初始采用背叛策略,则由累计收益 T=1.5生成N=1000的EHK网络上进行博弈,初始 的计算方式和式(I3)可知,hub节点会从其大量采 时采用合作策略的个体和采用背叛策略的个体均 用合作策略的邻居中获得较高的收益,由博弈演化P = [ 1 0 b 0 ] (13) b > 1 S [1 0] T [0 1] T i j ui ui = S T i PSj i 式中 。令 代表博弈个体的策略类型,其取值为 (代表合作) 或 (代表背叛);个体 与其邻 居 进行一次博弈所得收益 可以表示为 , 在每一轮博弈过程中,每个博弈个体都与自己直接 相连的邻居进行博弈,将博弈个体 得到的收益总和 记为 Ui = ∑ j∈Ωi S T i PSj (14) Ωi i i j ui ⩾ uj i i pi←j j 式中 为 的所有邻居节点集合。然后所有个体更 新它们的策略,即个体 随机选择自己的邻居 ,比较 它们的收益,若有 ,则个体 在下一轮中采取的 博弈策略不变;否则个体 将以概率 采取其邻居 的策略进行下一轮博弈。其中 pi←j = uj −ui (T −S)max( ki , kj ) (15) max( ki , kj ) i j T −S = b i j 式中 表示节点 与 中度数较大者,若在博 弈过程中使用收益矩阵公式 (13),那么则有 。 式 (15) 说明节点 接纳其邻居 的策略的概率正比于 两者收益之差,同时也说明高收益节点所采用的策 略容易被其低收益的邻居节点所采纳,反之低收益 节点所采用的策略不可能侵犯高收益的节点。 ρc (t) ρc (t) = nc(t)N −1 nc(t) t ρc (t) ρc (t) 此外合作者密度 是用来刻画网络博弈行为 的重要物理量,其定义为采取合作策略的博弈个体 占所有博弈个体的比例,即 , 表示 博弈时采用合作策略的博弈个体数量。在网络科 学研究的过程中通常会关注某一类节点的整体行 为。当网络博弈进行的某一时刻,网络中采取合作 策略的节点比例趋于稳定不再发生变化,则称这些 采取合作策略的节点达到合作稳定状态。这种多数 节点的合作稳定状态也正是本文需要研究的内容。 博弈初始时刻,采用合作策略和背叛策略的博弈个 体均以 50% 的比例随机存在于生成的 EHK 网络 中,每个博弈个体根据其初始策略和收益矩阵按照 式 (1) 计算其收益总和,然后根据策略更新规则式 (15) 更新其策略,更新完后的策略作为博弈个体下一轮 博弈中使用的策略。每一次博弈策略的更新会使合 作者密度 在下一次博弈之前发生变化,随着博 弈的不断进行,合作者密度 会逐渐达到动态平 衡状态。博弈演化流程如图 4 所示。 3.2 仿真分析 3.2.1 高聚类特性对合作行为的影响 p p m0 = m = 2 T = 1.5 N = 1 000 由第 2 节的研究可知,相同条件下可调节概率 的值越大,其生成网络的聚类系数越高,故可直接 用 值对网络动力学特征进行讨论。在由 、 生成 的 EHK 网络上进行博弈,初始 时采用合作策略的个体和采用背叛策略的个体均 fc 以 50% 的比例随机存在于网络中,博弈演化规则如 图 4 所示,博弈次数 1 000 次,取最后 50 次博弈中 合作者密度的平均值为达到动态平衡时的合作者密 度,记为 仿真结果如图 5 所示。 N Y ݉໷も⪑Б̬჆ ℀ҷ䮻ᱦܲጯ౔ 㑽㐈͙ 㞮◥iϺ䗧ᣑ ◥ะ㣣ᓃ㉛ 䃍ᩢ⯶Ui ᵥᢚ߇ߔ႒ 㻰ࣶ݅Ắ⢳ Pi←jᰠ᫜も⪑ ㈧㐋᭛॒䓪ݜ䶰ٴ䃪჆ ⮰ᬢ䬠ₑ 䒿ܦऴ҈℀ҷPc 图 4 博弈演化流程 Fig. 4 Process of game evolution 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 0.75 0.70 0.80 0.85 0.90 0.95 1.00 fc P EHK网络 图 5 合作者比例随聚类系数变化 Fig. 5 Variation in the partner proportion and clustering coefficient 图 5 中每个数据是相同初始条件下 10 次重复 实验所得到的平均值。由图 5 仿真结果可知合作者 比例维持在 0.75 以上,这充分表明 EHK 网络对合 作行为具有较大的促进作用。其原因是,EHK 网络 是高聚类异质网络,其中必然会存在许多具有多三 角形结构的高连接度的 hub 节点,若 hub 节点选择 合作策略,由于其采用累计收益的计算方式,会使 hub 节点获得较高的收益,由式 (15) 可知其所采用 的合作策略容易被其低收益的邻居节点采纳。由 式 (13) 可知采用 (C, C) 策略的双方收益都为 1,而 hub 节点采用累计收益的计算方式,会使其始终成 为被模仿的对象,这有利于合作行为在网络中进行 传播。 若 hub 节点初始采用背叛策略,则由累计收益 的计算方式和式 (13) 可知,hub 节点会从其大量采 用合作策略的邻居中获得较高的收益,由博弈演化 第 3 期 邓云生,等:基于囚徒困境策略的改进 HK 网络上的合作博弈 ·483·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有