·778· 智能系统学报 第13卷 双方创新成本为2,收益均为10。博弈分为4种 argmax jesN,P(x(》={ii,ji2,…,jin} 情况:若大小企业都创新,双方获得创新收益比为 argmax jess,pj(y(t))= 7:3:若仅大企业创新,小企业可剽窃大企业的创新 则优先权如式(10): 成果,并抢先占领市场,两者创新收益比为6:4; 元=minA∈argmax sN.P,(x(t)川 (10) 若仅小企业进行创新,大企业可凭借其规模效应 j=minl4μ∈argmax eN,pO(t)》 获得更大的利润,两者收益比为9:1;若大小企业都 N={v,v)∈E)=SN UDN,表示玩家i的所 不创新,双方收益均为零。对应基本净收益矩阵: 有邻居。SN,={vw,y)eE,UE表示与i同组的 x/y 52 邻居,DN,={vlw,y)eE}表示与i不同组的邻 5(5,1)(4,4) (5) S2 (9,-1)(0,0) 居。由于大小企业之间存在合作竞争关系,本文 式中:x表示大企业群体;y表示小企业群体;s表 考虑博弈发生在不同组邻居DN,中,策略更新发生 在同组邻居SN,中。 示创新策略;2表示不创新策略。企业拥有独立 2.2博弈动态演化分析 选择策略的权利,因此可建立博弈模型来分析企 业创新网络随时间演化的博弈动态过程。 网络博弈随着时刻的变化不断更新策略局 势,对应收益函数也发生变化,从而形成动态网 2.1企业创新网络博弈模型 络演化博弈。根据网络的拓扑结构,可得到企业 对应上述双层网络演化博弈的过程构建模型。 创新双层耦合网络的邻接矩阵: 1)企业创新双层耦合网络:上层网络G1=(V,E,) 其中V,={m,2,…,ya是大企业玩家集,E,CV,×V, A= (A.)m.xm (Av)mxm (Aw)nxn:(A.)nxn 是大企业内部相互联系的边集。下层网络G,= 式中:A,=A,Aw=A,Aw=A。为了研究方便, (V,E),其中Vw={ww2,…,wm}是小企业玩家集, 可将博弈过程进行代数公式化。不妨定义:玩家 EcV×V.是小企业内部相互联系的边集。 v,在时刻的状态为x()(1<i<n);玩家w,在时刻r的 EmcV,×V是网络G1和G2间相互联系的边集。故 状态为()1<i<2);第j个策略用S,表示,且 双层耦合网络由无向图G=(VE)表示,满足V= 3~。 VUVw={y,2,…,m,w1,w2,…,wm}={W1,2,…,V小,n= 玩家(1<i<n)的收益函数表达式为 n1+n2,E=EUEwUEnro p.(④=VTMx0∑y0=VM)x0Row(A 2)基本网络博弈:由两个连通玩家(不同层) jEDN, 形成的基本博弈G,且策略集S1=S2={s1,52,…,5, Πy(t)=VT(M1)L⑧Row:(Aπ)mx(t):= 对应收益双矩阵: M,x(t)y(t) (11) (C1,C1)(C1,C2)·(c1,Ck) (c2,G)(2,)… (C2.Ck) 玩家w(1<i<2)的收益函数表达式为 M= (6) .: p.()=V(M.y.())=V(M.)WuRow.(A..) (ck,G)(C,C3)·(C,CG) Ⅱxt)xy0)=F(M2T)WRow:(Am 令M表示M中每个数组的第一个元素所组成的矩 (L4⑧元)x(t)y(t)=Mx(t0y(t) 阵,M表示第二个元素所组成的矩阵。 (12) 3)策略更新规则:采用确定性无条件模仿策 式中:x0=1x(),y0)=y()。 略更新规则。玩家在t+1时刻的策略模仿它同层 基于上述双层耦合网络演化博弈过程,考虑 邻居j∈SN,在t时刻最优收益对应的策略,设 网络纯策略纳什均衡(本文策略选择是确定型 j=argmax jesN,Pj(x(t)) 的,因此在后文中全部简称为纳什均衡)的存在 广=argmax jesN,.PO() (7) 性,本文采用确定型策略更新规则。 则 定义31】对于一个博弈G,一个策略局势 x(t+1)=x(),yt+1)=y() (8) x=(xi,,…,x)eS1×S2×…×Sn是一个纳什均衡, 那么整个网络的策略更新表示为 如果满足p,(,)≥p(x,x)对所有的ieN,∈S (xt+1),(t+1)=fx(),J() (9) 均成立,其中N={1,2,…,n是玩家集,S是第个玩 式中:x()和y()是t时刻玩家y,和w,的策略,x()= 家的策略集,且心,=(G,巧,…,-+…,)。 ((),x2(),…,xn(),y()=y1(t)y2(),…ym()》。 命题2181对于任给的x,yE4,x≠y,必然存 4)策略模仿优先权:若3)内策略更新规则中 在一个整数1≤r≤k-1满足x=My,其中M= 被模仿的邻居玩家不唯一,令 6,[23…k1]是k值逻辑算子O的结构矩阵,且满足双方创新成本为 2,收益均为 10。博弈分为 4 种 情况:若大小企业都创新,双方获得创新收益比为 7∶3;若仅大企业创新,小企业可剽窃大企业的创新 成果,并抢先占领市场,两者创新收益比为 6∶4; 若仅小企业进行创新,大企业可凭借其规模效应 获得更大的利润,两者收益比为 9∶1;若大小企业都 不创新,双方收益均为零。对应基本净收益矩阵: x/y s1 s2 s1 (5, 1) (4, 4) s2 (9, −1) (0, 0) (5) x y s1 s2 式中: 表示大企业群体; 表示小企业群体; 表 示创新策略; 表示不创新策略。企业拥有独立 选择策略的权利,因此可建立博弈模型来分析企 业创新网络随时间演化的博弈动态过程。 2.1 企业创新网络博弈模型 对应上述双层网络演化博弈的过程构建模型。 G1 =(Vv ,Ev) Vv = {v1, v2,··· , vn1 } Ev ⊂ Vv ×Vv G2 = (Vw,Ew) Vw = {w1,w2,··· ,wn2 } Ew ⊂ Vw ×Vw Evw ⊂ Vv ×Vw G1 G2 G = (V,E) V = Vv ∪Vw ={v1, v2,··· , vn1 ,w1,w2,··· ,wn2 }={v1, v2,··· , vn} n = n1 +n2, E = Ev ∪ Ew ∪ Evw 1) 企业创新双层耦合网络:上层网络 , 其中 是大企业玩家集, 是大企业内部相互联系的边集。下层网络 ,其中 是小企业玩家集, 是小企业内部相互联系的边集。 是网络 和 间相互联系的边集。故 双层耦合网络由无向图 表示,满足 , 。 G S 1 = S 2 ={s1,s2,··· ,sk} 2) 基本网络博弈:由两个连通玩家 (不同层) 形成的基本博弈 ,且策略集 , 对应收益双矩阵: M = (c1, c1 ) (c1, c2 ) ··· (c1, ck ) (c2, c1 ) (c2, c2 ) ··· (c2, ck ) . . . . . . . . . (ck , c1 ) (ck , c2 ) ··· (ck , ck ) (6) M1 M M2 令 表示 中每个数组的第一个元素所组成的矩 阵, 表示第二个元素所组成的矩阵。 i t+1 j ∈ SNi t 3) 策略更新规则:采用确定性无条件模仿策 略更新规则。玩家 在 时刻的策略模仿它同层 邻居 在 时刻最优收益对应的策略,设 j ∗ v = argmaxj∈SNi pj(x(t)) j ∗ w = argmaxj∈SNi pj(y(t)) (7) 则 xi(t+1) = xj ∗ v (t), yi(t+1) = yj ∗ w (t) (8) 那么整个网络的策略更新表示为 (xi(t+1), yi(t+1)) = f(x(t), y(t)) (9) xi(t) yi(t) t vi wi x(t) = (x1(t), x2(t),··· , xn1 (t)) y(t) = (y1(t), y2(t),··· , yn2 (t)) 式中: 和 是 时刻玩家 和 的策略, , 。 4) 策略模仿优先权:若 3) 内策略更新规则中 被模仿的邻居玩家不唯一,令 argmaxj∈SNi pj(x(t)) = {j ∗ v1 , j ∗ v2 ,··· , j ∗ vr1 } argmaxj∈SNi pj(y(t)) = {j ∗ w1 , j ∗ w2 ,··· , j ∗ wr2 } 则优先权如式 (10): { j ∗ v = min{λ|λ ∈ argmaxj∈SNi pj(x(t))} j ∗ w = min{µ|µ ∈ argmaxj∈SNi pj(y(t))} (10) Ni = { vj (vi , vj) ∈ E} = SNi ∪DNi i SNi = { vj (vi , vj) ∈ Ev ∪ Ew} i DNi = { vj (vi , vj) ∈ Evw} i DNi SNi 表示玩家 的 所 有邻居。 表示与 同组的 邻居, 表示与 不同组的邻 居。由于大小企业之间存在合作竞争关系,本文 考虑博弈发生在不同组邻居 中,策略更新发生 在同组邻居 中。 2.2 博弈动态演化分析 网络博弈随着时刻的变化不断更新策略局 势,对应收益函数也发生变化,从而形成动态网 络演化博弈。根据网络的拓扑结构,可得到企业 创新双层耦合网络的邻接矩阵: A = [ (Av)n1×n1 (Avw)n1×n2 (Awv)n2×n1 (Aw)n2×n2 ] Av = A T v Aw = A T w Awv = A T vw vi t xi(t)(1 < i < n1) wi t yi(t)(1 < i < n2) j sj ∼ δ j k 式中: , , 。为了研究方便, 可将博弈过程进行代数公式化。不妨定义:玩家 在时刻 的状态为 ;玩家 在时刻 的 状态为 ; 第 个策略 用 sj 表示,且 。 玩家 vi(1 < i < n1) 的收益函数表达式为 pvi (t) = V T r (M1)xi(t) ∑ j∈DNi yj(t) = V T r (M1)xi(t)Rowi(Avw)· Π n2 y(t) = V T r (M1)(Ik ⊗Rowi(Avw)π n2 )π n1 i x(t)y(t) := Mvi x(t)y(t) (11) 玩家 wi(1 < i < n2) 的收益函数表达式为 pwi (t) = V T r (M2 T )yi(t) ∑ j∈DNi xj(t) = V T r (M2 T )W[k,k]Rowi(Awv)· Π n1 x(t)π n2 i y(t) = V T r (M2 T )W[k,k]Rowi(Awv)· Π n1 (Ik n1 ⊗π n2 i )x(t)y(t) := Mwi x(t)y(t) (12) x(t) = ⋉ n1 i=1 xi(t) y(t) = ⋉ n2 i=1 式中: , yi(t)。 基于上述双层耦合网络演化博弈过程,考虑 网络纯策略纳什均衡 (本文策略选择是确定型 的,因此在后文中全部简称为纳什均衡) 的存在 性,本文采用确定型策略更新规则。 G x ∗ = (x ∗ 1 , x ∗ 2 ,··· , x ∗ n ) ∈ S 1 ×S 2 × ··· ×S n pi(x ∗ i , x ∗ −i ) ⩾ pi(xi , x ∗ −i ) i ∈ N, xi ∈ S i N = {1,2,··· ,n} S i i x ∗ −i = (x ∗ 1 , x ∗ 2 ,··· , x ∗ i−1 , x ∗ i+1 ,··· , x ∗ n )。 定义 3 [18] 对于一个博弈 ,一个策略局势 是一个纳什均衡, 如果满足 对所有的 均成立,其中 是玩家集, 是第 个玩 家的策略集,且 x, y ∈ ∆k , x , y 1 ⩽ r ⩽ k−1 x = Mr o,k y Mo,k = δk[2 3 ··· k 1] k Θk 命题 2 [18] 对于任给的 ,必然存 在一个整数 满 足 ,其中 是 值逻辑算子 的结构矩阵,且满足 ·778· 智 能 系 统 学 报 第 13 卷