正在加载图片...
第5期 武利琴,等:基于半张量积的企业创新网络演化博弈 ·779· 0 0 结构矩阵,可由此来分析博弈的演化动态。 通过半张量积方法,由博弈动态方程式(13) 引理481对于双层网络演化博弈G=(G,S, 可得到博弈结构矩阵L。分析结构矩阵可得到博 弈的稳定点、极限环,因此有定理1。 S),支付函数满足式(11)、(12),则G存在一个纳什 定理1若存在整数1≤j≤2",同时满足以下 均衡,当且仅当存在一个整数1≤j≤2,满足Col(M)≥ 两个条件: 0,对应{d刻Col(M)≥0,1≤j≤2"是所有纳什均衡 1)Col(Mp)≥0; 的集合,其中Mp=[MgMg…MgM…MJF。 2)jEN.Trace(L),L=L.(IL)W: 对于1≤r≤k-1, 则称为全局稳定纳什均衡局势。 Mr=M[l⑧(L-M] 证明根据引理4可知,满足定理1中条件1) Mg=[MgM2…Mgk-] 的所有都是纳什均衡点,但纳什均衡点不一定 对于1≤y≤k-1, 唯一,也不一定是稳定点。根据引理3可知,如果 My=Mn[L⑧(L-MgJ 满足定理1中条件2),则对应策略局势为稳定 M=[M,M2…Mk-] 点。因此如果j同时满足定理1中条件1)、2),那么 引理4只考虑了某一时刻该网络博弈的纳什 结论成立,为全局稳定纯策略纳什均衡局势。 均衡,而无法判断随着演化某些不稳定的局势逐 证毕。 渐演化为稳定的纳什均衡局势。因此,计算整个 推论1设J为所有满足定理1的j(1≤j≤2) 网络演化的转移矩阵是非常有必要的。 的集合,令h∈J满足: 由引理2和支付函数表达式(11)、(12),可得 Colh(M,)≥Col(M,) (14) 到整个网络演化博弈的转移矩阵,步骤如下: colM)≥col(M)..jeJ 1)重写式(11)、(12)为 则必称为为全局稳定最优纳什均衡局势。 p.(x(t).y(1))=M'y(t)x:(t) 证明由定理1可知,所有J中元素对应的 p.(x(t).y:(t))=My(t)x;(t) 6都是稳定的纳什均衡点,如果h∈J满足式(14), 2)对于任意的策略x、y,大企业玩家的最优 可知欧是使各玩家收益总和最大的稳定纳什均衡 反应策略为BR,=Ly,1≤i≤n, 点,则称为最优稳定纳什均衡点。证毕。 I=min(Col(Blk,(M),1≤1≤k. 2.3政府调控下的演化博弈 Col (L)= 本部分通过政府调控改变基本博弈矩阵,从 小企业玩家的最优反应策略为 而使整个网络的演化达到理想的局势状态,即大 BRw=Ly,1≤i≤2 小企业全部创新,且为稳定或者最优稳定纳什均 Im=min(Col(Blk(M)1≤1≤k) 衡状态。大小企业选择创新,由于投资成本过 Col (L)=6m 高,且收益相对减少,短时不能获取到创新带来 的收益,因此政府通过调控诱发企业选择创新策 3)根据优先权式(10)模仿同组邻居收益最大 略是非常必要的。控制设计如下。 玩家的策略,有如下形式: 政府的对企业创新的直接补贴为a,对只想搭 x(t+1)=Lvy(t) 便车的不创新企业进行惩罚,惩罚力度设为b,对 M=Row(A,+I)L.L… P 应双收益矩阵为 min alRow (M),Col,(L)=6g" x/y S1 S2 yi(t+1)=L,x(t) s1(5+a,1+a(4+a,4-b) (15) M=Row(A+laL。…K s2(9-b,-1+a)(-b,-b) 上述控制表示政府对企业的补贴与惩罚是同 B.=minBlRowe(MB..Col,(L)= 时进行的。设计控制的宗旨是政府对企业创新只 于是xt+1)=Ly(t),yt+1)=Lwx(),其中L,=L* 起调控作用,尽可能少地进行投资或者获利。因 Ln家…*L,Lw=Ln*Ln*…*Lo 此可假设补贴力度与惩罚力度相同,即a=b(a>0, 4)将3)中不同层的策略相乘,有 b>0)0 x(t+1)y(t+1)=Lvy(t)Lx(t)=L.(I L)y(t)x(t)= L,(L⑧Lw)Wty0)=Lrt) 假设没有a=b这一条件,则a=0,表示企业只 (13) 对不创新企业进行惩罚;若b=0,表示企业只对创 式中L=L(I⑧L)W为双层耦合网络演化的 新企业进行补贴。Θk ( i k−1 ) =    i−1 k−1 , i > 0 1, i = 0 G, G 1⩽ j⩽2 n Col(Mp) ⩾ { δ j 2 n Colj(Mp) ⩾ 0,1 ⩽ j ⩽ 2 n } Mp=[MT v1 MT v2 ··· MT vn1 MT w1 ··· MT wn2 ] T 引理 4 [18] 对于双层网络演化博弈 G =( S1, S2 ),支付函数满足式 (11)、(12),则 存在一个纳什 均衡,当且仅当存在一个整数 ,满足 0,对应 是所有纳什均衡 的集合,其中 。 对于 1 ⩽ r ⩽ k−1, Mvi,r = Mvi [Ik i−1 ⊗(Ik − Mr o,k )] MT vi = [MT vi,1 MT vi,2 ··· MT vi,k−1 ] 对于 1 ⩽ γ ⩽ k−1, Mwi,γ = Mwi [Ik n1+i−1 ⊗(Ik − M γ o,k )] MT wi = [MT wi,1 MT wi,2 ··· MT wi,k−1 ] 引理 4 只考虑了某一时刻该网络博弈的纳什 均衡,而无法判断随着演化某些不稳定的局势逐 渐演化为稳定的纳什均衡局势。因此,计算整个 网络演化的转移矩阵是非常有必要的。 由引理 2 和支付函数表达式 (11)、(12),可得 到整个网络演化博弈的转移矩阵,步骤如下: 1) 重写式 (11)、(12) 为 pvi (xi(t), y(t)) = M′ vi y(t)xi(t) pwi (x(t), yi(t)) = M′ wi y(t)xi(t) x、y BRvi = L ′ vi y, 1 ⩽ i ⩽ n1 2) 对于任意的策略 ,大企业玩家的最优 反应策略为 , lj,vi = min{l|Coll(Blkj(M′ vi )), 1 ⩽ l ⩽ k}, Colj(L ′ vi ) = δ lj,vi k 小企业玩家的最优反应策略为 BRwi = L ′ wi y, 1 ⩽ i ⩽ n2 lj,wi = min{l|Coll(Blkj(M′ wi )),1 ⩽ l ⩽ k} Colj(L ′ wi ) = δ lj,wi k 3) 根据优先权式 (10) 模仿同组邻居收益最大 玩家的策略,有如下形式: xi(t+1) = Lvi y(t) Mvi = Rowi(Av + In1 ) [ L ′ v1 L ′ v2 ··· L ′ vn1 ]T αs,vi = min{α|Rowα(Mvi )αs} Cols(Lvi ) = δ αs,vi , k 。 yi(t+1) = Lwi x(t) Mwi = Rowi(Aw + In2 ) [ L ′ w1 L ′ w2 ··· L ′ wn2 ]T βs,wi = min{β|Rowβ(Mwi )βs} Cols(Lwi ) = δ βs,wi , k 。 x(t+1) = Lvy(t), y(t+1) = Lw x(t) Lv =Lv1 ∗ Lv2 ∗ ··· ∗ Lvn1 , Lw = Lw1 ∗ Lw2 ∗ ··· ∗ Lwn2 于 是 ,其中 。 4) 将 3) 中不同层的策略相乘,有 x(t+1)y(t+1) = Lvy(t)Lwx(t) = Lv(Ik n2 ⊗ Lw)y(t)x(t) = Lv(Ik n2 ⊗ Lw)W[k n1 ,k n2 ]x(t)y(t) := Lx(t)y(t) (13) L = Lv(Ik n2 ⊗ Lw)W[k n1 ,k n 式中 2 ] 为双层耦合网络演化的 结构矩阵,可由此来分析博弈的演化动态。 L 通过半张量积方法,由博弈动态方程式 (13) 可得到博弈结构矩阵 。分析结构矩阵可得到博 弈的稳定点、极限环,因此有定理 1。 1 ⩽ j ⩽ 2 定理 n 1 若存在整数 ,同时满足以下 两个条件: Col 1) j(Mp) ⩾ 0 ; j ∈ Ne = Trace(L), L = Lv(Ik n2 ⊗ Lw)W[k n1 ,k n2 ] 2) ; δ j 2 则称 n为全局稳定纳什均衡局势。 δ j 2 n j δ j 2 n j δ j 2 n 证明 根据引理 4 可知,满足定理 1 中条件 1) 的所有 都是纳什均衡点,但纳什均衡点不一定 唯一,也不一定是稳定点。根据引理 3 可知,如果 满足定理 1 中条件 2),则 对应策略局势为稳定 点。因此如果 同时满足定理 1 中条件 1)、2),那么 结论成立, 为全局稳定纯策略纳什均衡局势。 证毕。 J j (1 ⩽ j ⩽ 2 n ) h ∈ J 推论 1 设 为所有满足定理 1 的 的集合,令 满足: { Colh(Mvi ) ⩾ Colj(Mvi ) Colh(Mwi ) ⩾ Colj(Mwi ) , h, j ∈ J (14) δ h 2 则 n称为为全局稳定最优纳什均衡局势。 J δ j 2 n h ∈ J δ h 2 n 证明 由定理 1 可知,所有 中元素对应的 都是稳定的纳什均衡点,如果 满足式 (14), 可知 是使各玩家收益总和最大的稳定纳什均衡 点,则称为最优稳定纳什均衡点。证毕。 2.3 政府调控下的演化博弈 本部分通过政府调控改变基本博弈矩阵,从 而使整个网络的演化达到理想的局势状态,即大 小企业全部创新,且为稳定或者最优稳定纳什均 衡状态。大小企业选择创新,由于投资成本过 高,且收益相对减少,短时不能获取到创新带来 的收益,因此政府通过调控诱发企业选择创新策 略是非常必要的。控制设计如下。 a b 政府的对企业创新的直接补贴为 ,对只想搭 便车的不创新企业进行惩罚,惩罚力度设为 ,对 应双收益矩阵为   x/y s1 s2 s1 (5+a,1+a) (4+a,4−b) s2 (9−b,−1+a) (−b,−b)   (15) a = b (a > 0, b > 0) 上述控制表示政府对企业的补贴与惩罚是同 时进行的。设计控制的宗旨是政府对企业创新只 起调控作用,尽可能少地进行投资或者获利。因 此可假设补贴力度与惩罚力度相同,即 。 a = b a = 0 b = 0 假设没有 这一条件,则 ,表示企业只 对不创新企业进行惩罚;若 ,表示企业只对创 新企业进行补贴。 第 5 期 武利琴,等:基于半张量积的企业创新网络演化博弈 ·779·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有