第13卷第5期 智能系统学报 Vol.13 No.5 2018年10月 CAAI Transactions on Intelligent Systems Oct.2018 D0:10.11992/tis.201706064 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.tp.20180423.1635.018.html 基于半张量积的企业创新网络演化博弈 武利琴',徐勇,王金环,李杰 (1.河北工业大学理学院,天津300401:2.河北工业大学经济管理学院,天津300401) 摘要:当代经济环境下,创新已经成为企业生存发展的必要条件。将所有企业按规模分为大小两种企业,建 立企业创新双层耦合网络,并研究了企业间的博弈过程。首先,运用矩阵半张量积方法,以“智猪博弈”为基本 博弈,得到每一时刻各企业的策略,而非企业总体创新的比例:其次,根据收益函数得到整个企业创新网络的 最优稳定纳什均衡点:最后,增加政府调控,改变博弈基本支付矩阵,从而达到最优稳定纳什均衡状态,即所有 企业全部创新。 关键词:企业创新;半张量积;创新网络:演化博弈;纳什均衡;政府调控:智猪博弈;策略局势 中图分类号:F270:TP18文献标志码:A文章编号:1673-4785(201805-0776-07 中文引用格式:武利琴,徐勇,王金环,等.基于半张量积的企业创新网络演化博弈.智能系统学报,2018,13(5):776-782. 英文引用格式:VU Liqin,XU Yong,WANG Jinhuan,.et al.Evolutionary enterprise innovation networked game based on the semi- tensor product of matrices[J].CAAI transactions on intelligent systems,2018,13(5):776-782. Evolutionary enterprise innovation networked game based on the semi-tensor product of matrices WU Liqin',XU Yong',WANG Jinhuan',LI Jie? (1.School of Sciences,Hebei University of Technology,Tianjin 300401,China;2.School of Economics and Management,Hebei University of Technology,Tianjin 300401,China) Abstract:In the contemporary economic environment,innovation has become the inevitable condition for the survival and development of enterprises.In this paper,all the enterprises were classified into two categories according to the scale,establishing a double-layer coupling network of enterprise innovation,and the process of the game between enter- prises was studied.Firstly,taking"Boxed Pig Game"as the basic game,the semi-tensor product method was used to get the strategy of each enterprise at every moment,not the proportion of the enterprise overall innovation.Secondly,the optimal stability for the Nash equilibrium of the whole enterprise innovation network was reached according to the pay- off function.Finally,the government regulation was introduced to change the basic matrix of the game and therefore reach a stable state of the optimal Nash equilibrium;that is,all enterprises realized innovation all round. Keywords:enterprise innovation;semi-tensor product;innovation networks;evolutionary game;Nash equilibrium;gov- ernment regulation;Boxed Pig game;strategy profile 网络上的演化博弈称为网络演化博弈,能够 密地联系在了一起。在一个网络演化博弈中,节 很好地刻画生物系统、物流系统、社会系统、多智 点和边分别代表玩家和玩家之间的相互关系。在 能体系统的演化规律,引起了众多学者的广泛研 某些特定的策略调整规则下,玩家根据邻居上一 究,如文献[1-4]就将网络演化博弈与各个系统紧 时刻的策略和收益,不断更新自己下一时刻的策 收稿日期:2017-06-19.网络出版日期:2018-04-24. 略。随着时间变化,整个网络演化局势和博弈动 基金项目:国家社会科学基金项目(16FGL014):国家自然科学 态都在不断变化。网络演化博弈理论有助于理解 基金项目(61203142):河北省自然科学基金项目 F2014202206). 合作的涌现及演化规律,经常被用于研究经济管 通信作者:徐勇.E-mail:xuyong@hebut.edu.cn 理方面的问题6
DOI: 10.11992/tis.201706064 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.tp.20180423.1635.018.html 基于半张量积的企业创新网络演化博弈 武利琴1 ,徐勇1 ,王金环1 ,李杰2 (1. 河北工业大学 理学院,天津 300401; 2. 河北工业大学 经济管理学院,天津 300401) 摘 要:当代经济环境下,创新已经成为企业生存发展的必要条件。将所有企业按规模分为大小两种企业,建 立企业创新双层耦合网络,并研究了企业间的博弈过程。首先,运用矩阵半张量积方法,以“智猪博弈”为基本 博弈,得到每一时刻各企业的策略,而非企业总体创新的比例;其次,根据收益函数得到整个企业创新网络的 最优稳定纳什均衡点;最后,增加政府调控,改变博弈基本支付矩阵,从而达到最优稳定纳什均衡状态,即所有 企业全部创新。 关键词:企业创新;半张量积;创新网络;演化博弈;纳什均衡;政府调控;智猪博弈;策略局势 中图分类号:F270;TP18 文献标志码:A 文章编号:1673−4785(2018)05−0776−07 中文引用格式:武利琴, 徐勇, 王金环, 等. 基于半张量积的企业创新网络演化博弈[J]. 智能系统学报, 2018, 13(5): 776–782. 英文引用格式:WU Liqin, XU Yong, WANG Jinhuan, et al. Evolutionary enterprise innovation networked game based on the semitensor product of matrices[J]. CAAI transactions on intelligent systems, 2018, 13(5): 776–782. Evolutionary enterprise innovation networked game based on the semi-tensor product of matrices WU Liqin1 ,XU Yong1 ,WANG Jinhuan1 ,LI Jie2 (1. School of Sciences, Hebei University of Technology, Tianjin 300401, China; 2. School of Economics and Management, Hebei University of Technology, Tianjin 300401, China) Abstract: In the contemporary economic environment, innovation has become the inevitable condition for the survival and development of enterprises. In this paper, all the enterprises were classified into two categories according to the scale, establishing a double-layer coupling network of enterprise innovation, and the process of the game between enterprises was studied. Firstly, taking “Boxed Pig Game” as the basic game, the semi-tensor product method was used to get the strategy of each enterprise at every moment, not the proportion of the enterprise overall innovation. Secondly, the optimal stability for the Nash equilibrium of the whole enterprise innovation network was reached according to the payoff function. Finally, the government regulation was introduced to change the basic matrix of the game and therefore reach a stable state of the optimal Nash equilibrium; that is, all enterprises realized innovation all round. Keywords: enterprise innovation; semi-tensor product; innovation networks; evolutionary game; Nash equilibrium; government regulation; Boxed Pig game; strategy profile 网络上的演化博弈称为网络演化博弈,能够 很好地刻画生物系统、物流系统、社会系统、多智 能体系统的演化规律,引起了众多学者的广泛研 究,如文献[1-4]就将网络演化博弈与各个系统紧 密地联系在了一起。在一个网络演化博弈中,节 点和边分别代表玩家和玩家之间的相互关系。在 某些特定的策略调整规则下,玩家根据邻居上一 时刻的策略和收益,不断更新自己下一时刻的策 略。随着时间变化,整个网络演化局势和博弈动 态都在不断变化。网络演化博弈理论有助于理解 合作的涌现及演化规律,经常被用于研究经济管 理方面的问题[5-6]。 收稿日期:2017−06−19. 网络出版日期:2018−04−24. 基金项目:国家社会科学基金项目 (16FGL014);国家自然科学 基金项目 (61203142);河北省自然科学基金项目 (F2014202206). 通信作者:徐勇. E-mail:xuyong@hebut.edu.cn. 第 13 卷第 5 期 智 能 系 统 学 报 Vol.13 No.5 2018 年 10 月 CAAI Transactions on Intelligent Systems Oct. 2018
第5期 武利琴,等:基于半张量积的企业创新网络演化博弈 ·777· 当下经济发展背景下,企业唯有不断创新才 常省略半张量符号“x”。 能长久生存发展下去。由于创新成本高额,部分 定义2o设A∈Mpa,BEMoxno它们的Khatri-- 企业不愿意改变原有模式,每个企业都想追求自 Rao积,记A*B,定义为 己的收益最大,然而对于政府或者整个社会来说, A*B= 所有企业全部创新,才是最好的局势。当前已有 [Col1(A)⑧Col(B)Col2(A)⑧Col2B·Col,(A⑧Coln(B]∈ 一些对企业间创新博弈的研究方法,如文献[5-8], Mpaxn 通过构建微分方程组,利用给定的初始条件,得 命题11)设X∈R"及Y∈R为两列向量, 到方程组的解。该解描述了企业的总体构成P(创 则WinXY=YX,WYX=XY,其中nXmn维矩 新比例)随时间的演化趋势,并通过数据仿真方 阵Wmn被称为换位矩阵,且W=Wa; 法将博弈动态趋势以图的形态呈现,然而并不 2)设A∈Mmxm,那么 WimnV-(A)=Ve(A).WimV(A)=V,(A) 能展示每一次博弈后整个企业网络的博弈动态。 3)设X∈R和A∈Rm,则XA=(I,⑧A)X,这称 本文通过构建精确的理论框架来分析和控制 为伪交换性质。 企业创新网络演化的博弈动态,获得每次博弈后 各企业的收益、策略等性质,主要运用了矩阵半 引理1假设x,∈4,i=1,2…,n和x=1x, 张量积这种新的方法。半张量最先由程代展教授 则有x:=元x,其中元=l⑧⑧lk,i=1,2,…,n,m= [(π)(π)T…(πg)门T。 提出,成功应用于逻辑网络的分析与控制01),包 引理2山设f:D→R是一伪逻辑函数,则 括布尔网络稳定性、可控性、可观测性及最优控 制47。半张量积在网络演化博弈动态行为及策 存在一个唯一的矩阵M∈Rx,称为f的结构矩 阵.满足 略最优控制方面的研究也取得了显著成果182 fx1,x2,…,xn)=My1x (1) 并在智能电网、经济破产机制等实际问题中得到 式中:∈4,i=1,2,…,n,且M列举了x=:= 了广泛应用212。同时,也可用于企业创新方面 到x=过程中fx)所有可能的值。引理2显示了 的研究。 怎样将一个逻辑函数表示成它的代数形式。 在企业创新网络中,本文将所有企业按规模 引理3山考虑一个k值逻辑动态网络: 分为大小两种企业,建立企业创新双层耦合网络。 x(t+1)=Lx(t) (2) 网络中各节点不同时刻采取的策略不同,会影响整 式中:x(0)=x,①),LeCg,则 个网络的演化趋势。因此可通过政府调控使得整个 1)8是结构矩阵L的稳定点,当且仅当L主对 网络都达到创新的稳定局势,并能永久保持下去。 角线上的元素等于1。可得到式(2)中均衡点的 1预备知识 数量,用N表示,有 N.=Trace(L) (3) 本节给出关于半张量积的常用符号、定义和 2)长度为s环的数量用C,表示 基本性质。 C1=Ne 1)Mmxn表示m×n实矩阵的集合。 Trace(L-∑kCt (4) 2)Col(M)表示矩阵M的第i列,Col(M)表示矩 kep(s) C,= ,2≤s≤ 阵M的列集合。 3)D=(1,2,…,k}。 式中:p(s)代表s真因子的集合,s的真因子是正整 4)4n={⊙i=1,2,…,m,其中为单位矩阵1n的 数k<,满足无e乙。 第列。 5)矩阵L=[所…]为n×1逻辑矩阵,简写 2企业创新网络演化博弈 为L=6n[i12…,l,通常用Cnx表示n×t逻辑矩阵的 本文主要考虑企业群体之间的创新问题。企 集合。 业创新成本投入和风险承担是必需的,由于其规 6)V,(A)=[a1.1a12…a1n…am1am2…amnJ表示矩 模不同,导致资金周转与风险抵御能力的差距巨 阵A中行的展开。 大,因此将“智猪博弈”作为基本博弈是非常适合 定义1Io设A∈Mm,B∈Mpa,I=Icmin,.pl为 的。将参与博弈的企业群体按照规模分为两类: n与p的最小公倍数,那么A与B的半张量积定义为 大企业和小企业。将每个企业作为网络中参与博 A×B≌(A⑧Ln)(B⑧Ip) 弈的玩家,从而构建企业创新双层耦合网络,上 半张量积是普通矩阵乘积的一般化,因此通 层表示大企业群体,下层表示小企业群体。假设
当下经济发展背景下,企业唯有不断创新才 能长久生存发展下去。由于创新成本高额,部分 企业不愿意改变原有模式,每个企业都想追求自 己的收益最大,然而对于政府或者整个社会来说, 所有企业全部创新,才是最好的局势。当前已有 一些对企业间创新博弈的研究方法,如文献[5-8], 通过构建微分方程组,利用给定的初始条件,得 到方程组的解。该解描述了企业的总体构成 P(创 新比例) 随时间的演化趋势,并通过数据仿真方 法将博弈动态趋势以图的形态呈现[9] ,然而并不 能展示每一次博弈后整个企业网络的博弈动态。 本文通过构建精确的理论框架来分析和控制 企业创新网络演化的博弈动态,获得每次博弈后 各企业的收益、策略等性质,主要运用了矩阵半 张量积这种新的方法。半张量最先由程代展教授 提出,成功应用于逻辑网络的分析与控制[10-13] ,包 括布尔网络稳定性、可控性、可观测性及最优控 制 [14-17]。半张量积在网络演化博弈动态行为及策 略最优控制方面的研究也取得了显著成果[18-20] , 并在智能电网、经济破产机制等实际问题中得到 了广泛应用[21-22]。同时,也可用于企业创新方面 的研究。 在企业创新网络中,本文将所有企业按规模 分为大小两种企业,建立企业创新双层耦合网络。 网络中各节点不同时刻采取的策略不同,会影响整 个网络的演化趋势。因此可通过政府调控使得整个 网络都达到创新的稳定局势,并能永久保持下去。 1 预备知识 本节给出关于半张量积的常用符号、定义和 基本性质。 1) Mm×n表示m×n实矩阵的集合。 Coli(M) M i Col(M) M 2) 表示矩阵 的第 列 , 表示矩 阵 的列集合。 Dk 3) := {1,2,··· , k}。 ∆n := {δ i n |i = 1,2,··· ,n} δ i n In i 4) , 其中 为单位矩阵 的 第 列。 L = [δ i1 n δ i2 n ··· δ it n ] n×t L = δn[i1 i2 ··· it] Ln×t n×t 5) 矩阵 为 逻辑矩阵, 简写 为 , 通常用 表示 逻辑矩阵的 集合。 Vr(A) = [a1,1 a1,2 ···a1,n ···am,1 am,2 ···am,n] T 6) 表示矩 阵 A 中行的展开。 A ∈ Mm×n, B ∈ Mp×q, l = lcm{n, p} n p A B 定义 1 [10] 设 为 与 的最小公倍数,那么 与 的半张量积定义为 A⋉ B ∆ = (A⊗ Il/n)(B⊗ Il/p) 半张量积是普通矩阵乘积的一般化, 因此通 常省略半张量符号“⋉”。 A ∈ Mp×n, B ∈ Mq×n A∗ B 定义 2 [10] 设 。它们的 KhatriRao 积, 记 , 定义为 A∗ B = [Col1(A)⊗Col1(B) Col2(A)⊗Col2(B) ··· Coln(A)⊗Coln(B)] ∈ Mpq×n X ∈ R m Y ∈ R n W[m,n]XY = YX, W[n,m]YX = XY mn×mn W[m,n] W[n,n] := W[n] 命题 1 [11] 1) 设 及 为两列向量, 则 ,其中 维矩 阵 被称为换位矩阵, 且 ; 2) 设 A ∈ Mm×n , 那么 W[m,n]Vr(A) = Vc(A), W[n,m]Vc(A) = Vr(A) X ∈ R t A ∈ R 3) 设 和 m×n , 则 XA = (It ⊗ A)X, 这称 为伪交换性质。 xi ∈ ∆k , i = 1,2,··· ,n x = ⋉ n i=1 xi xi = π n i x π n i = lk i−l ⊗ Ik ⊗ lk n−i , i = 1,2,··· ,n,Πn = [(π n 1 T ) (π n 2 ) T ···(π n n ) T ] T。 引理 1 [18] 假设 和 , 则有 ,其中 f : Dn k → R Mf ∈ R 1×k n f 引理 2 [11] 设 是一伪逻辑函数, 则 存在一个唯一的矩阵 , 称为 的结构矩 阵, 满足 f(x1, x2, ··· , xn) = Mf ⋉ n i=1 xi (1) xi ∈ ∆k , i = 1,2,··· ,n Mf x = ⋉ n i=1 xi = δ 1 k n x = δ k n k n f(x) 式中: ,且 列举了 到 过程中 所有可能的值。引理 2 显示了 怎样将一个逻辑函数表示成它的代数形式。 引理 3 k [11] 考虑一个 值逻辑动态网络: x(t+1) = Lx(t) (2) x(t) = ⋉ n i=1 xi(t) L ∈ Lk n×k 式中: , n,则 δ i k L ℓii Ne 1) 是结构矩阵 L 的稳定点,当且仅当 主对 角线上的元素 等于 1。可得到式 (2) 中均衡点的 数量,用 表示,有 Ne = Trace(L) (3) 2) 长度为 s 环的数量用 Cs表示 C1 = Ne Cs = Trace(L s )− ∑ k∈ρ(s) kCk s , 2 ⩽ s ⩽ k n (4) ρ(s) s s k < s s k ∈ Z+ 式中: 代表 真因子的集合, 的真因子是正整 数 , 满足 。 2 企业创新网络演化博弈 本文主要考虑企业群体之间的创新问题。企 业创新成本投入和风险承担是必需的,由于其规 模不同,导致资金周转与风险抵御能力的差距巨 大,因此将“智猪博弈”作为基本博弈是非常适合 的。将参与博弈的企业群体按照规模分为两类: 大企业和小企业。将每个企业作为网络中参与博 弈的玩家,从而构建企业创新双层耦合网络,上 层表示大企业群体,下层表示小企业群体。假设 第 5 期 武利琴,等:基于半张量积的企业创新网络演化博弈 ·777·
·778· 智能系统学报 第13卷 双方创新成本为2,收益均为10。博弈分为4种 argmax jesN,P(x(》={ii,ji2,…,jin} 情况:若大小企业都创新,双方获得创新收益比为 argmax jess,pj(y(t))= 7:3:若仅大企业创新,小企业可剽窃大企业的创新 则优先权如式(10): 成果,并抢先占领市场,两者创新收益比为6:4; 元=minA∈argmax sN.P,(x(t)川 (10) 若仅小企业进行创新,大企业可凭借其规模效应 j=minl4μ∈argmax eN,pO(t)》 获得更大的利润,两者收益比为9:1;若大小企业都 N={v,v)∈E)=SN UDN,表示玩家i的所 不创新,双方收益均为零。对应基本净收益矩阵: 有邻居。SN,={vw,y)eE,UE表示与i同组的 x/y 52 邻居,DN,={vlw,y)eE}表示与i不同组的邻 5(5,1)(4,4) (5) S2 (9,-1)(0,0) 居。由于大小企业之间存在合作竞争关系,本文 式中:x表示大企业群体;y表示小企业群体;s表 考虑博弈发生在不同组邻居DN,中,策略更新发生 在同组邻居SN,中。 示创新策略;2表示不创新策略。企业拥有独立 2.2博弈动态演化分析 选择策略的权利,因此可建立博弈模型来分析企 业创新网络随时间演化的博弈动态过程。 网络博弈随着时刻的变化不断更新策略局 势,对应收益函数也发生变化,从而形成动态网 2.1企业创新网络博弈模型 络演化博弈。根据网络的拓扑结构,可得到企业 对应上述双层网络演化博弈的过程构建模型。 创新双层耦合网络的邻接矩阵: 1)企业创新双层耦合网络:上层网络G1=(V,E,) 其中V,={m,2,…,ya是大企业玩家集,E,CV,×V, A= (A.)m.xm (Av)mxm (Aw)nxn:(A.)nxn 是大企业内部相互联系的边集。下层网络G,= 式中:A,=A,Aw=A,Aw=A。为了研究方便, (V,E),其中Vw={ww2,…,wm}是小企业玩家集, 可将博弈过程进行代数公式化。不妨定义:玩家 EcV×V.是小企业内部相互联系的边集。 v,在时刻的状态为x()(1<i<n);玩家w,在时刻r的 EmcV,×V是网络G1和G2间相互联系的边集。故 状态为()1<i<2);第j个策略用S,表示,且 双层耦合网络由无向图G=(VE)表示,满足V= 3~。 VUVw={y,2,…,m,w1,w2,…,wm}={W1,2,…,V小,n= 玩家(1<i<n)的收益函数表达式为 n1+n2,E=EUEwUEnro p.(④=VTMx0∑y0=VM)x0Row(A 2)基本网络博弈:由两个连通玩家(不同层) jEDN, 形成的基本博弈G,且策略集S1=S2={s1,52,…,5, Πy(t)=VT(M1)L⑧Row:(Aπ)mx(t):= 对应收益双矩阵: M,x(t)y(t) (11) (C1,C1)(C1,C2)·(c1,Ck) (c2,G)(2,)… (C2.Ck) 玩家w(1<i<2)的收益函数表达式为 M= (6) .: p.()=V(M.y.())=V(M.)WuRow.(A..) (ck,G)(C,C3)·(C,CG) Ⅱxt)xy0)=F(M2T)WRow:(Am 令M表示M中每个数组的第一个元素所组成的矩 (L4⑧元)x(t)y(t)=Mx(t0y(t) 阵,M表示第二个元素所组成的矩阵。 (12) 3)策略更新规则:采用确定性无条件模仿策 式中:x0=1x(),y0)=y()。 略更新规则。玩家在t+1时刻的策略模仿它同层 基于上述双层耦合网络演化博弈过程,考虑 邻居j∈SN,在t时刻最优收益对应的策略,设 网络纯策略纳什均衡(本文策略选择是确定型 j=argmax jesN,Pj(x(t)) 的,因此在后文中全部简称为纳什均衡)的存在 广=argmax jesN,.PO() (7) 性,本文采用确定型策略更新规则。 则 定义31】对于一个博弈G,一个策略局势 x(t+1)=x(),yt+1)=y() (8) x=(xi,,…,x)eS1×S2×…×Sn是一个纳什均衡, 那么整个网络的策略更新表示为 如果满足p,(,)≥p(x,x)对所有的ieN,∈S (xt+1),(t+1)=fx(),J() (9) 均成立,其中N={1,2,…,n是玩家集,S是第个玩 式中:x()和y()是t时刻玩家y,和w,的策略,x()= 家的策略集,且心,=(G,巧,…,-+…,)。 ((),x2(),…,xn(),y()=y1(t)y2(),…ym()》。 命题2181对于任给的x,yE4,x≠y,必然存 4)策略模仿优先权:若3)内策略更新规则中 在一个整数1≤r≤k-1满足x=My,其中M= 被模仿的邻居玩家不唯一,令 6,[23…k1]是k值逻辑算子O的结构矩阵,且满足
双方创新成本为 2,收益均为 10。博弈分为 4 种 情况:若大小企业都创新,双方获得创新收益比为 7∶3;若仅大企业创新,小企业可剽窃大企业的创新 成果,并抢先占领市场,两者创新收益比为 6∶4; 若仅小企业进行创新,大企业可凭借其规模效应 获得更大的利润,两者收益比为 9∶1;若大小企业都 不创新,双方收益均为零。对应基本净收益矩阵: x/y s1 s2 s1 (5, 1) (4, 4) s2 (9, −1) (0, 0) (5) x y s1 s2 式中: 表示大企业群体; 表示小企业群体; 表 示创新策略; 表示不创新策略。企业拥有独立 选择策略的权利,因此可建立博弈模型来分析企 业创新网络随时间演化的博弈动态过程。 2.1 企业创新网络博弈模型 对应上述双层网络演化博弈的过程构建模型。 G1 =(Vv ,Ev) Vv = {v1, v2,··· , vn1 } Ev ⊂ Vv ×Vv G2 = (Vw,Ew) Vw = {w1,w2,··· ,wn2 } Ew ⊂ Vw ×Vw Evw ⊂ Vv ×Vw G1 G2 G = (V,E) V = Vv ∪Vw ={v1, v2,··· , vn1 ,w1,w2,··· ,wn2 }={v1, v2,··· , vn} n = n1 +n2, E = Ev ∪ Ew ∪ Evw 1) 企业创新双层耦合网络:上层网络 , 其中 是大企业玩家集, 是大企业内部相互联系的边集。下层网络 ,其中 是小企业玩家集, 是小企业内部相互联系的边集。 是网络 和 间相互联系的边集。故 双层耦合网络由无向图 表示,满足 , 。 G S 1 = S 2 ={s1,s2,··· ,sk} 2) 基本网络博弈:由两个连通玩家 (不同层) 形成的基本博弈 ,且策略集 , 对应收益双矩阵: M = (c1, c1 ) (c1, c2 ) ··· (c1, ck ) (c2, c1 ) (c2, c2 ) ··· (c2, ck ) . . . . . . . . . (ck , c1 ) (ck , c2 ) ··· (ck , ck ) (6) M1 M M2 令 表示 中每个数组的第一个元素所组成的矩 阵, 表示第二个元素所组成的矩阵。 i t+1 j ∈ SNi t 3) 策略更新规则:采用确定性无条件模仿策 略更新规则。玩家 在 时刻的策略模仿它同层 邻居 在 时刻最优收益对应的策略,设 j ∗ v = argmaxj∈SNi pj(x(t)) j ∗ w = argmaxj∈SNi pj(y(t)) (7) 则 xi(t+1) = xj ∗ v (t), yi(t+1) = yj ∗ w (t) (8) 那么整个网络的策略更新表示为 (xi(t+1), yi(t+1)) = f(x(t), y(t)) (9) xi(t) yi(t) t vi wi x(t) = (x1(t), x2(t),··· , xn1 (t)) y(t) = (y1(t), y2(t),··· , yn2 (t)) 式中: 和 是 时刻玩家 和 的策略, , 。 4) 策略模仿优先权:若 3) 内策略更新规则中 被模仿的邻居玩家不唯一,令 argmaxj∈SNi pj(x(t)) = {j ∗ v1 , j ∗ v2 ,··· , j ∗ vr1 } argmaxj∈SNi pj(y(t)) = {j ∗ w1 , j ∗ w2 ,··· , j ∗ wr2 } 则优先权如式 (10): { j ∗ v = min{λ|λ ∈ argmaxj∈SNi pj(x(t))} j ∗ w = min{µ|µ ∈ argmaxj∈SNi pj(y(t))} (10) Ni = { vj (vi , vj) ∈ E} = SNi ∪DNi i SNi = { vj (vi , vj) ∈ Ev ∪ Ew} i DNi = { vj (vi , vj) ∈ Evw} i DNi SNi 表示玩家 的 所 有邻居。 表示与 同组的 邻居, 表示与 不同组的邻 居。由于大小企业之间存在合作竞争关系,本文 考虑博弈发生在不同组邻居 中,策略更新发生 在同组邻居 中。 2.2 博弈动态演化分析 网络博弈随着时刻的变化不断更新策略局 势,对应收益函数也发生变化,从而形成动态网 络演化博弈。根据网络的拓扑结构,可得到企业 创新双层耦合网络的邻接矩阵: A = [ (Av)n1×n1 (Avw)n1×n2 (Awv)n2×n1 (Aw)n2×n2 ] Av = A T v Aw = A T w Awv = A T vw vi t xi(t)(1 < i < n1) wi t yi(t)(1 < i < n2) j sj ∼ δ j k 式中: , , 。为了研究方便, 可将博弈过程进行代数公式化。不妨定义:玩家 在时刻 的状态为 ;玩家 在时刻 的 状态为 ; 第 个策略 用 sj 表示,且 。 玩家 vi(1 < i < n1) 的收益函数表达式为 pvi (t) = V T r (M1)xi(t) ∑ j∈DNi yj(t) = V T r (M1)xi(t)Rowi(Avw)· Π n2 y(t) = V T r (M1)(Ik ⊗Rowi(Avw)π n2 )π n1 i x(t)y(t) := Mvi x(t)y(t) (11) 玩家 wi(1 < i < n2) 的收益函数表达式为 pwi (t) = V T r (M2 T )yi(t) ∑ j∈DNi xj(t) = V T r (M2 T )W[k,k]Rowi(Awv)· Π n1 x(t)π n2 i y(t) = V T r (M2 T )W[k,k]Rowi(Awv)· Π n1 (Ik n1 ⊗π n2 i )x(t)y(t) := Mwi x(t)y(t) (12) x(t) = ⋉ n1 i=1 xi(t) y(t) = ⋉ n2 i=1 式中: , yi(t)。 基于上述双层耦合网络演化博弈过程,考虑 网络纯策略纳什均衡 (本文策略选择是确定型 的,因此在后文中全部简称为纳什均衡) 的存在 性,本文采用确定型策略更新规则。 G x ∗ = (x ∗ 1 , x ∗ 2 ,··· , x ∗ n ) ∈ S 1 ×S 2 × ··· ×S n pi(x ∗ i , x ∗ −i ) ⩾ pi(xi , x ∗ −i ) i ∈ N, xi ∈ S i N = {1,2,··· ,n} S i i x ∗ −i = (x ∗ 1 , x ∗ 2 ,··· , x ∗ i−1 , x ∗ i+1 ,··· , x ∗ n )。 定义 3 [18] 对于一个博弈 ,一个策略局势 是一个纳什均衡, 如果满足 对所有的 均成立,其中 是玩家集, 是第 个玩 家的策略集,且 x, y ∈ ∆k , x , y 1 ⩽ r ⩽ k−1 x = Mr o,k y Mo,k = δk[2 3 ··· k 1] k Θk 命题 2 [18] 对于任给的 ,必然存 在一个整数 满 足 ,其中 是 值逻辑算子 的结构矩阵,且满足 ·778· 智 能 系 统 学 报 第 13 卷
第5期 武利琴,等:基于半张量积的企业创新网络演化博弈 ·779· 0 0 结构矩阵,可由此来分析博弈的演化动态。 通过半张量积方法,由博弈动态方程式(13) 引理481对于双层网络演化博弈G=(G,S, 可得到博弈结构矩阵L。分析结构矩阵可得到博 弈的稳定点、极限环,因此有定理1。 S),支付函数满足式(11)、(12),则G存在一个纳什 定理1若存在整数1≤j≤2",同时满足以下 均衡,当且仅当存在一个整数1≤j≤2,满足Col(M)≥ 两个条件: 0,对应{d刻Col(M)≥0,1≤j≤2"是所有纳什均衡 1)Col(Mp)≥0; 的集合,其中Mp=[MgMg…MgM…MJF。 2)jEN.Trace(L),L=L.(IL)W: 对于1≤r≤k-1, 则称为全局稳定纳什均衡局势。 Mr=M[l⑧(L-M] 证明根据引理4可知,满足定理1中条件1) Mg=[MgM2…Mgk-] 的所有都是纳什均衡点,但纳什均衡点不一定 对于1≤y≤k-1, 唯一,也不一定是稳定点。根据引理3可知,如果 My=Mn[L⑧(L-MgJ 满足定理1中条件2),则对应策略局势为稳定 M=[M,M2…Mk-] 点。因此如果j同时满足定理1中条件1)、2),那么 引理4只考虑了某一时刻该网络博弈的纳什 结论成立,为全局稳定纯策略纳什均衡局势。 均衡,而无法判断随着演化某些不稳定的局势逐 证毕。 渐演化为稳定的纳什均衡局势。因此,计算整个 推论1设J为所有满足定理1的j(1≤j≤2) 网络演化的转移矩阵是非常有必要的。 的集合,令h∈J满足: 由引理2和支付函数表达式(11)、(12),可得 Colh(M,)≥Col(M,) (14) 到整个网络演化博弈的转移矩阵,步骤如下: colM)≥col(M)..jeJ 1)重写式(11)、(12)为 则必称为为全局稳定最优纳什均衡局势。 p.(x(t).y(1))=M'y(t)x:(t) 证明由定理1可知,所有J中元素对应的 p.(x(t).y:(t))=My(t)x;(t) 6都是稳定的纳什均衡点,如果h∈J满足式(14), 2)对于任意的策略x、y,大企业玩家的最优 可知欧是使各玩家收益总和最大的稳定纳什均衡 反应策略为BR,=Ly,1≤i≤n, 点,则称为最优稳定纳什均衡点。证毕。 I=min(Col(Blk,(M),1≤1≤k. 2.3政府调控下的演化博弈 Col (L)= 本部分通过政府调控改变基本博弈矩阵,从 小企业玩家的最优反应策略为 而使整个网络的演化达到理想的局势状态,即大 BRw=Ly,1≤i≤2 小企业全部创新,且为稳定或者最优稳定纳什均 Im=min(Col(Blk(M)1≤1≤k) 衡状态。大小企业选择创新,由于投资成本过 Col (L)=6m 高,且收益相对减少,短时不能获取到创新带来 的收益,因此政府通过调控诱发企业选择创新策 3)根据优先权式(10)模仿同组邻居收益最大 略是非常必要的。控制设计如下。 玩家的策略,有如下形式: 政府的对企业创新的直接补贴为a,对只想搭 x(t+1)=Lvy(t) 便车的不创新企业进行惩罚,惩罚力度设为b,对 M=Row(A,+I)L.L… P 应双收益矩阵为 min alRow (M),Col,(L)=6g" x/y S1 S2 yi(t+1)=L,x(t) s1(5+a,1+a(4+a,4-b) (15) M=Row(A+laL。…K s2(9-b,-1+a)(-b,-b) 上述控制表示政府对企业的补贴与惩罚是同 B.=minBlRowe(MB..Col,(L)= 时进行的。设计控制的宗旨是政府对企业创新只 于是xt+1)=Ly(t),yt+1)=Lwx(),其中L,=L* 起调控作用,尽可能少地进行投资或者获利。因 Ln家…*L,Lw=Ln*Ln*…*Lo 此可假设补贴力度与惩罚力度相同,即a=b(a>0, 4)将3)中不同层的策略相乘,有 b>0)0 x(t+1)y(t+1)=Lvy(t)Lx(t)=L.(I L)y(t)x(t)= L,(L⑧Lw)Wty0)=Lrt) 假设没有a=b这一条件,则a=0,表示企业只 (13) 对不创新企业进行惩罚;若b=0,表示企业只对创 式中L=L(I⑧L)W为双层耦合网络演化的 新企业进行补贴
Θk ( i k−1 ) = i−1 k−1 , i > 0 1, i = 0 G, G 1⩽ j⩽2 n Col(Mp) ⩾ { δ j 2 n Colj(Mp) ⩾ 0,1 ⩽ j ⩽ 2 n } Mp=[MT v1 MT v2 ··· MT vn1 MT w1 ··· MT wn2 ] T 引理 4 [18] 对于双层网络演化博弈 G =( S1, S2 ),支付函数满足式 (11)、(12),则 存在一个纳什 均衡,当且仅当存在一个整数 ,满足 0,对应 是所有纳什均衡 的集合,其中 。 对于 1 ⩽ r ⩽ k−1, Mvi,r = Mvi [Ik i−1 ⊗(Ik − Mr o,k )] MT vi = [MT vi,1 MT vi,2 ··· MT vi,k−1 ] 对于 1 ⩽ γ ⩽ k−1, Mwi,γ = Mwi [Ik n1+i−1 ⊗(Ik − M γ o,k )] MT wi = [MT wi,1 MT wi,2 ··· MT wi,k−1 ] 引理 4 只考虑了某一时刻该网络博弈的纳什 均衡,而无法判断随着演化某些不稳定的局势逐 渐演化为稳定的纳什均衡局势。因此,计算整个 网络演化的转移矩阵是非常有必要的。 由引理 2 和支付函数表达式 (11)、(12),可得 到整个网络演化博弈的转移矩阵,步骤如下: 1) 重写式 (11)、(12) 为 pvi (xi(t), y(t)) = M′ vi y(t)xi(t) pwi (x(t), yi(t)) = M′ wi y(t)xi(t) x、y BRvi = L ′ vi y, 1 ⩽ i ⩽ n1 2) 对于任意的策略 ,大企业玩家的最优 反应策略为 , lj,vi = min{l|Coll(Blkj(M′ vi )), 1 ⩽ l ⩽ k}, Colj(L ′ vi ) = δ lj,vi k 小企业玩家的最优反应策略为 BRwi = L ′ wi y, 1 ⩽ i ⩽ n2 lj,wi = min{l|Coll(Blkj(M′ wi )),1 ⩽ l ⩽ k} Colj(L ′ wi ) = δ lj,wi k 3) 根据优先权式 (10) 模仿同组邻居收益最大 玩家的策略,有如下形式: xi(t+1) = Lvi y(t) Mvi = Rowi(Av + In1 ) [ L ′ v1 L ′ v2 ··· L ′ vn1 ]T αs,vi = min{α|Rowα(Mvi )αs} Cols(Lvi ) = δ αs,vi , k 。 yi(t+1) = Lwi x(t) Mwi = Rowi(Aw + In2 ) [ L ′ w1 L ′ w2 ··· L ′ wn2 ]T βs,wi = min{β|Rowβ(Mwi )βs} Cols(Lwi ) = δ βs,wi , k 。 x(t+1) = Lvy(t), y(t+1) = Lw x(t) Lv =Lv1 ∗ Lv2 ∗ ··· ∗ Lvn1 , Lw = Lw1 ∗ Lw2 ∗ ··· ∗ Lwn2 于 是 ,其中 。 4) 将 3) 中不同层的策略相乘,有 x(t+1)y(t+1) = Lvy(t)Lwx(t) = Lv(Ik n2 ⊗ Lw)y(t)x(t) = Lv(Ik n2 ⊗ Lw)W[k n1 ,k n2 ]x(t)y(t) := Lx(t)y(t) (13) L = Lv(Ik n2 ⊗ Lw)W[k n1 ,k n 式中 2 ] 为双层耦合网络演化的 结构矩阵,可由此来分析博弈的演化动态。 L 通过半张量积方法,由博弈动态方程式 (13) 可得到博弈结构矩阵 。分析结构矩阵可得到博 弈的稳定点、极限环,因此有定理 1。 1 ⩽ j ⩽ 2 定理 n 1 若存在整数 ,同时满足以下 两个条件: Col 1) j(Mp) ⩾ 0 ; j ∈ Ne = Trace(L), L = Lv(Ik n2 ⊗ Lw)W[k n1 ,k n2 ] 2) ; δ j 2 则称 n为全局稳定纳什均衡局势。 δ j 2 n j δ j 2 n j δ j 2 n 证明 根据引理 4 可知,满足定理 1 中条件 1) 的所有 都是纳什均衡点,但纳什均衡点不一定 唯一,也不一定是稳定点。根据引理 3 可知,如果 满足定理 1 中条件 2),则 对应策略局势为稳定 点。因此如果 同时满足定理 1 中条件 1)、2),那么 结论成立, 为全局稳定纯策略纳什均衡局势。 证毕。 J j (1 ⩽ j ⩽ 2 n ) h ∈ J 推论 1 设 为所有满足定理 1 的 的集合,令 满足: { Colh(Mvi ) ⩾ Colj(Mvi ) Colh(Mwi ) ⩾ Colj(Mwi ) , h, j ∈ J (14) δ h 2 则 n称为为全局稳定最优纳什均衡局势。 J δ j 2 n h ∈ J δ h 2 n 证明 由定理 1 可知,所有 中元素对应的 都是稳定的纳什均衡点,如果 满足式 (14), 可知 是使各玩家收益总和最大的稳定纳什均衡 点,则称为最优稳定纳什均衡点。证毕。 2.3 政府调控下的演化博弈 本部分通过政府调控改变基本博弈矩阵,从 而使整个网络的演化达到理想的局势状态,即大 小企业全部创新,且为稳定或者最优稳定纳什均 衡状态。大小企业选择创新,由于投资成本过 高,且收益相对减少,短时不能获取到创新带来 的收益,因此政府通过调控诱发企业选择创新策 略是非常必要的。控制设计如下。 a b 政府的对企业创新的直接补贴为 ,对只想搭 便车的不创新企业进行惩罚,惩罚力度设为 ,对 应双收益矩阵为 x/y s1 s2 s1 (5+a,1+a) (4+a,4−b) s2 (9−b,−1+a) (−b,−b) (15) a = b (a > 0, b > 0) 上述控制表示政府对企业的补贴与惩罚是同 时进行的。设计控制的宗旨是政府对企业创新只 起调控作用,尽可能少地进行投资或者获利。因 此可假设补贴力度与惩罚力度相同,即 。 a = b a = 0 b = 0 假设没有 这一条件,则 ,表示企业只 对不创新企业进行惩罚;若 ,表示企业只对创 新企业进行补贴。 第 5 期 武利琴,等:基于半张量积的企业创新网络演化博弈 ·779·
·780· 智能系统学报 第13卷 通过仿真寻找恰当的a、b值,使得全局稳定 个企业创新网络的演化动态。 点刚好为最优纯策略纳什均衡点,且大小企业全 为了计算简便,以3个大企业和2个小企业 部创新,政府获利与投资之差尽可能小。当然, 组成的企业创新网络为例,分析演化博弈过程。 补贴或者惩罚力度不是盲目的,为了实现大小企 网络拓扑结构图如图1所示,其中第一层为大企 业全部创新的目标,补贴力度a=a,+a2,惩罚力度 业,n1={1,2,3;第二层为小企业,2={4,5。 b=b1+b2,需要同时满足方程组式(16): (5+a)+(1+a)≥(4+a)+(4-b) (5+a2)+(1+a2)≥(9-b2)+(-1+a2) (16) a1=b1 a=b2 于是,可得a=b=2,即补贴和惩罚力度均为2。 ! 博弈矩阵改变后,重新计算式(13),可得博弈 的转移矩阵L,通过定理1和推论1分析博弈的 图1不同规模企业博弈结构图 演化性质。若达不到所有企业全部创新的理想状 Fig.1 The game structure graph of different scale enter- 态,则调整控制力度,直到大小企业玩家全部选 prises 择创新策略51。 根据网络拓扑结构图,我们可得到网络的邻 上述调控借鉴了“智猪博弈”中防止小猪搭便 接矩阵: 车,促使大猪小猪都行动的思想,即政府通过同 010 时对创新企业进行补贴,对不创新企业进行惩 A= 101 010 L-L- 罚,从而干预企业的创新决策,促使大小企业全 情形1政府不进行干预(a=b=c=d=0), 部创新。 企业根据市场调节不断演化。收益矩阵为 3举例分析 M= &8M-8- 本节主要通过举例,研究增加政府调控后整 首先,根据引理4中的计算,有 [-4-444-4-444-4-444-4-44444-4-444-4-444-4-444-4-4 -44-44-44-444-44-44-44-4-44-44-44-444-44-44-44-4 Mp= -8008800-8-8008800-8-8008800-8-8008800-8 -6-666-4-444-6-666-4-444-4-444-2-222-4-444-2-222 -66-66-44-44-44-44-22-22 -66-66-44-44-44-44-22-22 5×32 此时ColL(M)>0,可得策略局势62=666号 其次,由博弈动态方程 为整个网络博弈的纳什均衡状态。此时5个企业 x(t+1)y(t+1)=Lx(t)y(t) 中,大企业全部创新,小企业全部不创新。 得到L为 L=6244444444444444444444444444444444 由引理3知,博弈的最终状态是稳定点,即策 a=b>2,不妨设a=b=2.25,通过计算Mn可得 略局势2=6666,没有出现极限环。根据定理1 J=(1},且L=632[1111…1111],由推论1可得整 和推论1可知,局势,为全局最优稳定纯策略纳个网络博弈的全局最优稳定纳什均衡点为 什均衡点,但只有大企业创新。为了让所有的玩家 62=6!6,满足控制大小企业全部创新的目 都实现创新,且达到稳定状态,我们考虑以下情形。 标;当a=b<2时,由于政府补贴与惩罚力度不 情形2政府对创新企业补贴为a,对不创新 够,整个演化局势依然保持无政府干预状态。 企业惩罚为b。由式(15)、(16)可得临界值 比较上述两种情形可知,政府对企业的调控, a=b=2。通过MATLAB仿真,当a=b=2时,通 有效遏制了小企业“搭便车”的行为,从而促使大 过计算Mn可得J={1,5,9,13,17,21,25,29,L= 小企业实现全部创新。 62[1111…1111]。由定理1和推论1可知,全 4结束语 局稳定纳什均衡点为6,=6666;,即大小企 业全部选择创新,且为最优稳定纳什均衡;若 本文将所有企业按规模分为大小两种企业
a、b a = a1 +a2 b = b1 +b2 通过仿真寻找恰当的 值,使得全局稳定 点刚好为最优纯策略纳什均衡点,且大小企业全 部创新,政府获利与投资之差尽可能小。当然, 补贴或者惩罚力度不是盲目的,为了实现大小企 业全部创新的目标,补贴力度 ,惩罚力度 ,需要同时满足方程组式 (16): (5+a1)+(1+a1) ⩾ (4+a1)+(4−b1) (5+a2)+(1+a2) ⩾ (9−b2)+(−1+a2) a1 = b1 a2 = b2 (16) 于是,可得a = b = 2 ,即补贴和惩罚力度均为 2。 s1 博弈矩阵改变后,重新计算式 (13),可得博弈 的转移矩阵 L,通过定理 1 和推论 1 分析博弈的 演化性质。若达不到所有企业全部创新的理想状 态,则调整控制力度,直到大小企业玩家全部选 择创新策略 。 上述调控借鉴了“智猪博弈”中防止小猪搭便 车,促使大猪小猪都行动的思想,即政府通过同 时对创新企业进行补贴,对不创新企业进行惩 罚,从而干预企业的创新决策,促使大小企业全 部创新。 3 举例分析 本节主要通过举例,研究增加政府调控后整 个企业创新网络的演化动态。 n1 = {1,2,3} n2 = {4,5} 为了计算简便,以 3 个大企业和 2 个小企业 组成的企业创新网络为例,分析演化博弈过程。 网络拓扑结构图如图 1 所示,其中第一层为大企 业, ;第二层为小企业, 。 2 3 4 5 1 图 1 不同规模企业博弈结构图 Fig. 1 The game structure graph of different scale enterprises 根据网络拓扑结构图,我们可得到网络的邻 接矩阵: Av = 0 1 0 1 0 1 0 1 0 3×3 , Aw = [ 0 1 1 0 ] 2×2 , Avw = 1 0 0 1 1 1 3×2 情形 1 政府不进行干预 (a = b = c = d = 0 ), 企业根据市场调节不断演化。收益矩阵为 M = [ (5,1) (4,4) (9,−1) (0,0) ] , M1 = [ 5 4 9 0 ] , M2 = [ 1 4 −1 0 ] 首先,根据引理 4 中的计算,有 Mp = −4 −4 4 4 −4 −4 4 4 −4 −4 4 4 −4 −4 4 4 −4 4 −4 4 −4 4 −4 4 4 −4 4 −4 4 −4 4 −4 −8 0 0 8 8 0 0 −8 −8 0 0 8 8 0 0 −8 −6 −6 6 6 −4 −4 4 4 −6 −6 6 6 −4 −4 4 4 −6 6 −6 6 −4 4 −4 4 −4 4 −4 4 −2 2 −2 2 4 4 −4 −4 4 4 −4 −4 4 4 −4 −4 4 4 −4 −4 −4 4 −4 4 −4 4 −4 4 4 −4 4 −4 4 −4 4 −4 −8 0 0 8 8 0 0 −8 −8 0 0 8 8 0 0 −8 −4 −4 4 4 −2 −2 2 2 −4 −4 4 4 −2 −2 2 2 −6 6 −6 6 −4 4 −4 4 −4 4 −4 4 −2 2 −2 2 5×32 Col4(Mp) > 0 δ 4 32 = δ 1 2 δ 1 2 δ 1 2 δ 2 2 δ 2 此时 ,可得策略局势 2 为整个网络博弈的纳什均衡状态。此时 5 个企业 中,大企业全部创新,小企业全部不创新。 其次,由博弈动态方程 x(t+1)y(t+1) = Lx(t)y(t) 得到 L 为 L = δ32 [ 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 4 ] δ 4 32 = δ 1 2 δ 1 2 δ 1 2 δ 2 2 δ 2 2 δ 4 32 由引理 3 知,博弈的最终状态是稳定点,即策 略局势 ,没有出现极限环。根据定理 1 和推论 1 可知,局势 为全局最优稳定纯策略纳 什均衡点,但只有大企业创新。为了让所有的玩家 都实现创新,且达到稳定状态,我们考虑以下情形。 a b a = b = 2 a = b = 2 Mp J = {1,5,9,13,17,21,25,29} L = δ32 [1 1 1 1···1 1 1 1] δ 1 32 = δ 1 2 δ 1 2 δ 1 2 δ 1 2 δ 1 2 情形 2 政府对创新企业补贴为 ,对不创新 企业惩罚为 。 由 式 (15) 、 (16 ) 可得临界值 。通过 MATLAB 仿真,当 时,通 过计算 可 得 , 。由定理 1 和推论 1可知,全 局稳定纳什均衡点为 , 即大小企 业全部选择创新,且为最优稳定纳什均衡;若 a = b > 2 a = b = 2.25 Mp J = {1} L = δ32 [1 1 1 1···1 1 1 1] δ 1 32 = δ 1 2 δ 1 2 δ 1 2 δ 1 2 δ 1 2 a = b < 2 ,不妨设 ,通过计算 可 得 ,且 ,由推论 1 可得整 个网络博弈的全局最优稳定纳什均衡点为 ,满足控制大小企业全部创新的目 标;当 时,由于政府补贴与惩罚力度不 够,整个演化局势依然保持无政府干预状态。 比较上述两种情形可知,政府对企业的调控, 有效遏制了小企业“搭便车”的行为,从而促使大 小企业实现全部创新。 4 结束语 本文将所有企业按规模分为大小两种企业, ·780· 智 能 系 统 学 报 第 13 卷
第5期 武利琴,等:基于半张量积的企业创新网络演化博弈 ·781· 建立企业创新双层耦合网络。运用矩阵半张量积 IUR evolutionary game model on the patent cooperate of 方法,以“智猪博弈”为基本博弈,得到每一时刻各 Shandong China[J].Physic A:statistical mechanics and its 企业的策略,整个网络局势演化随时间改变;根 applications,2017,475:11-23. 据收益函数得到整个网络的最优稳定纳什均衡 [10]CHENG Daizhan,XU Tingting,QI Hongsheng.Evolu- 点;最后,通过政府调控,改变博弈的基本矩阵, tionary stability strategy of networked evolutionary 从而达到最优稳定纳什均衡状态,即所有企业全 games[J].IEEE transactions on neural networks and 部创新。 learning systems,,2014,25(7):1335-1345. [11]CHENG Daizhan,HE Fenghua,QI Hongsheng,et al. 参考文献: Modeling,analysis and control of networked evolution- ary games[J].IEEE transactions on automatic control, [1]WU Qingchu,LOU Yijun,ZHU Wenfang.Epidemic out- 2015,60(9:2402-2415. break for an SIS model in multiplex networks with immun- [12]CHENG Daizhan,QI Hongsheng,HE F,et al.Semi- ization[J].Mathematical biosciences,2016,277:38-46. tensor product approach to networked evolutionary [2]WANG Danzhu,LANG M X,SUN Yan.Evolutionary games[J].Control theory and technology,2014,12(2): game analysis of co-opetition relationship between region- 198-214. al logistics nodes[J].Journal of applied research and tech- [13]CHENG Daizhan,XU Tingting,HE Fenghua,et al.On nology,2014,122):251-260. dynamics and Nash equilibriums of networked games[J]. [3]ETESAMI S R,BASAR T.Complexity of equilibrium in IEEE/CAA journal of automatica sinica,2014,1(1): diffusion games on social networks[C]//Proceedings of 10-18. 2014 American Control Conference.Portland,USA.2014: [14]ZHAO Yin,GHOSH B K,CHENG Daizhan.Control of 2065-2070. large-scale Boolean networks via network aggregation[J]. [4]YAN Yongyi,CHEN Zengqiang,YUE Jumei.STP ap- IEEE transactions on neural networks and learning sys- proach to controlliability of finite state machines[J].Ifac- tems,2016,27(7):1527-1536. PapersonLine,2015,48(28):138-143. [15]LI Haitao,WANG Yuzhen,XIE Lihua.Output tracking [5]于斌斌,余雷.基于演化博弈的集群企业创新模式选择 control of Boolean control networks via state feedback: 研究.科研管理,2015,36(4):30-38 constant reference signal case[J].Automatica,2015,59: YU Binbin,YU Lei.A study on cluster enterprise techno- 5459. logy innovation selection based on the evolutionary [16]LI Haitao,XIE Lihua,WANG Yuzhen.On robust control game[J].Science research management,2015,36(4): invariance of Boolean control networks[J].Automatica, 30-38. 2016.68:392-396. [6]ZHOU Qing,FANG Gang,WANG Dongpeng,et al.Re- [17]CHENG Daizhan,ZHAO Yin,XU Tingting.Receding search on the robust optimization of the enterprise's de- horizon based feedback optimization for mix-valued lo- cision on the investment to the collaborative innovation: gical networks[J].IEEE transactions on automatic control, under the risk constraints[J].Chaos,solitons and fractals, 2015,60(12):3362-3366. 2016.89:284-289. [18]GUO Peilian,WANG Yuzhen,JIANG Ping.Nash equi- [7]盛光华,张志远.补贴方式对创新模式选择影响的演化 librium,dynamics and control of evolutionary networked 博弈研究U】.管理科学学报,2015,18(9):34-45. games with multi-group[C]//Proceedings of the 35th SHENG Guanghua,ZHANG Zhiyuan.Allowance Chinese Control Conference.Chengdu,China,2016: method's influence on the innovation model choice in 585-590. evolutionary game[J].Journal of management sciences in [19]GUO Peilian,WANG Yuzhen,LI Haitao.Algebraic for- China,2015,18(9):34-45. mulation and strategy optimization for a class of evolu- [8]王健,赵凯.“智猪博弈”下的合作创新研究一基于非 tionary networked games via semi-tensor product 对称演化博弈的分析[】.科技与经济,2016,29(2): method[U.Automatic,.2013,49(11):3384-3389 21-25. [20]ZHAO Guodong,WANG Yuzhen.Formulation and op- WANG Jian,ZHAO Kai.Cooperative innovation of enter- timization control of a class of networked evolutionary prises under "Boxed pig Game"-a research based on games with switched topologies[J].Nonlinear analysis: asymmetric evolutionary game[J].Science and technology hybrid systems,2016,22:98-107. and economy,.2016,292:21-25. [21]ZHU Bing,XIA Xiaohua,WU Zhou.Evolutionary game [9]LIU Mengmeng,MA Yinghong,LIU Zhiyuan,et al.An theoretic demand-side management and control for a class
建立企业创新双层耦合网络。运用矩阵半张量积 方法,以“智猪博弈”为基本博弈, 得到每一时刻各 企业的策略,整个网络局势演化随时间改变; 根 据收益函数得到整个网络的最优稳定纳什均衡 点; 最后,通过政府调控, 改变博弈的基本矩阵, 从而达到最优稳定纳什均衡状态,即所有企业全 部创新。 参考文献: WU Qingchu, LOU Yijun, ZHU Wenfang. Epidemic outbreak for an SIS model in multiplex networks with immunization[J]. Mathematical biosciences, 2016, 277: 38–46. [1] WANG Danzhu, LANG M X, SUN Yan. Evolutionary game analysis of co-opetition relationship between regional logistics nodes[J]. Journal of applied research and technology, 2014, 12(2): 251–260. [2] ETESAMI S R, BASAR T. Complexity of equilibrium in diffusion games on social networks[C]//Proceedings of 2014 American Control Conference. Portland, USA, 2014: 2065–2070. [3] YAN Yongyi, CHEN Zengqiang, YUE Jumei. STP approach to controlliability of finite state machines[J]. IfacPapersonLine, 2015, 48(28): 138–143. [4] 于斌斌, 余雷. 基于演化博弈的集群企业创新模式选择 研究[J]. 科研管理, 2015, 36(4): 30–38. YU Binbin, YU Lei. A study on cluster enterprise technology innovation selection based on the evolutionary game[J]. Science research management, 2015, 36(4): 30–38. [5] ZHOU Qing, FANG Gang, WANG Dongpeng, et al. Research on the robust optimization of the enterprise’s decision on the investment to the collaborative innovation: under the risk constraints[J]. Chaos, solitons and fractals, 2016, 89: 284–289. [6] 盛光华, 张志远. 补贴方式对创新模式选择影响的演化 博弈研究[J]. 管理科学学报, 2015, 18(9): 34–45. SHENG Guanghua, ZHANG Zhiyuan. Allowance method’s influence on the innovation model choice in evolutionary game[J]. Journal of management sciences in China, 2015, 18(9): 34–45. [7] 王健, 赵凯. “智猪博弈”下的合作创新研究——基于非 对称演化博弈的分析[J]. 科技与经济, 2016, 29(2): 21–25. WANG Jian, ZHAO Kai. Cooperative innovation of enterprises under “Boxed pig Game”—a research based on asymmetric evolutionary game[J]. Science and technology and economy, 2016, 29(2): 21–25. [8] [9] LIU Mengmeng, MA Yinghong, LIU Zhiyuan, et al. An IUR evolutionary game model on the patent cooperate of Shandong China[J]. Physic A: statistical mechanics and its applications, 2017, 475: 11–23. CHENG Daizhan, XU Tingting, QI Hongsheng. Evolutionary stability strategy of networked evolutionary games[J]. IEEE transactions on neural networks and learning systems, 2014, 25(7): 1335–1345. [10] CHENG Daizhan, HE Fenghua, QI Hongsheng, et al. Modeling, analysis and control of networked evolutionary games[J]. IEEE transactions on automatic control, 2015, 60(9): 2402–2415. [11] CHENG Daizhan, QI Hongsheng, HE F, et al. Semitensor product approach to networked evolutionary games[J]. Control theory and technology, 2014, 12(2): 198–214. [12] CHENG Daizhan, XU Tingting, HE Fenghua, et al. On dynamics and Nash equilibriums of networked games[J]. IEEE/CAA journal of automatica sinica, 2014, 1(1): 10–18. [13] ZHAO Yin, GHOSH B K, CHENG Daizhan. Control of large-scale Boolean networks via network aggregation[J]. IEEE transactions on neural networks and learning systems, 2016, 27(7): 1527–1536. [14] LI Haitao, WANG Yuzhen, XIE Lihua. Output tracking control of Boolean control networks via state feedback: constant reference signal case[J]. Automatica, 2015, 59: 54–59. [15] LI Haitao, XIE Lihua, WANG Yuzhen. On robust control invariance of Boolean control networks[J]. Automatica, 2016, 68: 392–396. [16] CHENG Daizhan, ZHAO Yin, XU Tingting. Receding horizon based feedback optimization for mix-valued logical networks[J]. IEEE transactions on automatic control, 2015, 60(12): 3362–3366. [17] GUO Peilian, WANG Yuzhen, JIANG Ping. Nash equilibrium, dynamics and control of evolutionary networked games with multi-group[C]//Proceedings of the 35th Chinese Control Conference. Chengdu, China, 2016: 585–590. [18] GUO Peilian, WANG Yuzhen, LI Haitao. Algebraic formulation and strategy optimization for a class of evolutionary networked games via semi-tensor product method[J]. Automatic, 2013, 49(11): 3384–3389. [19] ZHAO Guodong, WANG Yuzhen. Formulation and optimization control of a class of networked evolutionary games with switched topologies[J]. Nonlinear analysis: hybrid systems, 2016, 22: 98–107. [20] ZHU Bing, XIA Xiaohua, WU Zhou. Evolutionary game theoretic demand-side management and control for a class [21] 第 5 期 武利琴,等:基于半张量积的企业创新网络演化博弈 ·781·
·782· 智能系统学报 第13卷 of networked smart grid[J].Automatic,2016,70:94-100. 徐勇,男,1971年生,教授,博士, [22]FU Shihua,WANG Yuzhen,ZHAO Guodong.A matrix 主要研究方向为非线性系统控制、图 论、复杂网络控制与优化。参加或主 approach to the analysis and control of networked evolu- 持省部级科研项目10余项,发表学术 tionary games with bankruptcy mechanism[J].Asian 论文30余篇,被EI检索10余篇。 journal of control,2017,19(2):717-727. 作者简介: 武利琴,女,1992年生,硕士研究 王金环,女,1980年生,副教授 生,主要研究方向为网络演化博弈及 博士,主要研究方向为多智能体系统 应用。 协同控制、网络演化博弈。主持国家 级、省部级科研项目4项,发表学术论 文30余篇,被SCI和EI收录30余篇。 2018年人工智能与云计算大会(AICCC2018) 2018 Artificial Intelligence and Cloud Computing Conference (AICCC 2018) 2018 Artificial Intelligence and Cloud Computing Conference (AICCC 2018)will be held during 21- 23 December.2018 in Tokyo.Japan.This conference is meant for researchers from academia.industries and research development organizations all over the globe interested in the areas of Artificial Intelligence and Cloud Computing.It will put special emphasis on the participations of PhD students,Postdoctoral fellows and other young researchers from all over the world.It would be beneficial to bring together a group of experts from diverse fields to discuss recent pro- gress and to share ideas on open questions.The conference will feature world-class keynote speakers in the main areas. While artificial intelligence(A.I.)has struggled to gain footholds in other niches,it is finding its place in the world of cloud computing,a sort of revolution within the revolution that could rapidly change the face of businesses using cloud computing solutions over the next few years.What Is A.I.?First contemplated and theorized in the 1950s,A.I. generally refers to the ability of machines to perform intellectual tasks.It has branched into several different sub-levels since then,including machine learning,which,beginning around 1980,enabled computers to learn and build models, deep learning,which uses neural networks,and cognitive computing,a product of the last decade or so,which can allow machines to interact naturally with us.Machine learning(ML)and deep learning(DL)are the branches of A.I.most commonly linked to cloud computing.They can be harnessed for unsupervised work in analytics,predictions,and data mining-three absolutely huge parts of thousands of applications used by businesses in the cloud every single day.Deep learning takes machine learning a step forward.Instead of using a singular algorithm to crunch data,it uses a legion of them,all related,to create new,deep networks without human oversight.Deep learning has been successful in image recognition,facial recognition,even prediction of diseases based on a patient's electronic health records.In three areas of cloud computing,A.I.is taking long strides.Those areas are ML algorithms,Big Data and parallel processing
of networked smart grid[J]. Automatic, 2016, 70: 94–100. FU Shihua, WANG Yuzhen, ZHAO Guodong. A matrix approach to the analysis and control of networked evolutionary games with bankruptcy mechanism[J]. Asian journal of control, 2017, 19(2): 717–727. [22] 作者简介: 武利琴,女,1992 年生,硕士研究 生,主要研究方向为网络演化博弈及 应用。 徐勇,男,1971 年生,教授,博士, 主要研究方向为非线性系统控制、图 论、复杂网络控制与优化。参加或主 持省部级科研项目 10 余项,发表学术 论文 30 余篇,被 EI 检索 10 余篇。 王金环,女,1980 年生,副教授, 博士,主要研究方向为多智能体系统 协同控制、网络演化博弈。主持国家 级、省部级科研项目 4 项,发表学术论 文 30 余篇,被 SCI 和 EI 收录 30 余篇。 2018 年人工智能与云计算大会(AICCC 2018) 2018 Artificial Intelligence and Cloud Computing Conference (AICCC 2018) 2018 Artificial Intelligence and Cloud Computing Conference (AICCC 2018) will be held during 21– 23 December, 2018 in Tokyo, Japan. This conference is meant for researchers from academia, industries and research & development organizations all over the globe interested in the areas of Artificial Intelligence and Cloud Computing. It will put special emphasis on the participations of PhD students, Postdoctoral fellows and other young researchers from all over the world. It would be beneficial to bring together a group of experts from diverse fields to discuss recent progress and to share ideas on open questions. The conference will feature world-class keynote speakers in the main areas. While artificial intelligence (A.I.) has struggled to gain footholds in other niches, it is finding its place in the world of cloud computing, a sort of revolution within the revolution that could rapidly change the face of businesses using cloud computing solutions over the next few years. What Is A.I.? First contemplated and theorized in the 1950s, A.I. generally refers to the ability of machines to perform intellectual tasks. It has branched into several different sub-levels since then, including machine learning, which, beginning around 1980, enabled computers to learn and build models, deep learning, which uses neural networks, and cognitive computing, a product of the last decade or so, which can allow machines to interact naturally with us. Machine learning (ML) and deep learning (DL) are the branches of A.I. most commonly linked to cloud computing. They can be harnessed for unsupervised work in analytics, predictions, and data mining-three absolutely huge parts of thousands of applications used by businesses in the cloud every single day. Deep learning takes machine learning a step forward. Instead of using a singular algorithm to crunch data, it uses a legion of them, all related, to create new, deep networks without human oversight. Deep learning has been successful in image recognition, facial recognition, even prediction of diseases based on a patient’s electronic health records. In three areas of cloud computing, A.I. is taking long strides. Those areas are ML algorithms, Big Data and parallel processing. ·782· 智 能 系 统 学 报 第 13 卷