第12卷第2期 智能系统学报 Vol.12 No.2 2017年4月 CAAI Transactions on Intelligent Systems Apr.2017 D0I:10.11992/6is.201601022 网络出版地址:http://www.cnki.net/kcms/detail/23.1538.tp.20170111.1705.012.html 二阶邻居协议下多智能体系统能控能观性保持 王康,纪志坚,晁永翠 (青岛大学自动化与电气工程学院,山东青岛266071) 摘要:为了研究多智能体系统的一致性特点及能控、能观性保持策略,分析了具有时变拓扑结构的多智能体系统 在一阶邻居协议和二阶邻居协议下的一致性速度,针对拓扑结构的特殊性,利用结构能控性性质和拉普拉斯矩阵第 二小特征值与一致性速度之间存在的关系设计出一种使能控性和能观测性保持的控制策略。此外,得出多智能体 系统在二阶邻居协议下,具有更快的一致性速度的结论。文中2个主要定理分别通过算例和仿真进行验证,算例和 仿真结果与定理结论一致。 关键词:多智能体系统:二阶邻居协议:时变拓扑结构:结构能控性:能控性:能观测性:图论 中图分类号:TP13文献标志码:A文章编号:1673-4785(2017)02-0213-08 中文引用格式:王康,纪志坚,晁永翠.二阶邻居协议下多智能体系统能控能观性保持[J].智能系统学报,2017,12(2):213-220. 英文引用格式:WANG Kang,JI Zhijian,CHAO Yongcui..A control strategy for maitaining controllability and observability of a multi-agent system with the second-order neighborhood protocol[J].CAAI transactions on intelligent systems,2017,12(2):213- 220. A control strategy for maitaining controllability and observability of a multi-agent system with the second-order neighborhood protocol WANG Kang,JI Zhijian,CHAO Yongcui (School of Automation Engineering,Qingdao University,Qingdao 266071,China) Abstract:In order to study the characteristics of the consensus,controllability and observability of multi-agent sys- tems,we analyze the consensus speed of a multi-agent system with time-varying topologies under first-order and second-order neighborhood protocols.By utilizing the properties of the structural controllability and the relationship between the second-smallest eigenvalue of the Laplacian matrix and the consensus speed,we designed a control strategy to maintain both controllability and observability.In addition,we concluded that the multi-agent system had a faster consensus speed under the second-order neighborhood protocol.Using examples and simulations,we veri- fied the two main theorems proposed in this paper,with our observed results in full agreement with the conclusions of our theoretical analysis. Keywords:multi-agent system;second-order neighborhood protocol;time varying topologies;structural controlla- bility:controllability:observability;graph theory 近些年,随着计算机网络系统、无人机、卫星系调控制能实现我们所需要的复杂运动,因此有关多 统的高速发展,关于多智能体系统的研究也成为人 智能体系统的研究具有十分重要的意义。在研究多 们研究的热点。由于多智能体系统间各智能体的协 智能体系统时,我们利用代数图论山的知识,把多 智能体系统用拓扑图表示。其中,拓扑图的节点代 收稿日期:2016-01-13.网络出版日期:2017-01-11. 表各智能体,拓扑图的边代表各智能体间的连接关 基金项目:国家自然科学基金项目(61374062):山东省杰出青年科学基 系。在研究过程中,产生了两个重大的结果,能控性 金项目(JQ201419). 通信作者:纪志坚.E-mail:jizhijian(@pku.org.cn. 和一致性。多智能系统的能控性首先是由
第 12 卷第 2 期 智 能 系 统 学 报 Vol.12 №.2 2017 年 4 月 CAAI Transactions on Intelligent Systems Apr. 2017 DOI:10.11992 / tis.201601022 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.tp.20170111.1705.012.html 二阶邻居协议下多智能体系统能控能观性保持 王康,纪志坚,晁永翠 (青岛大学 自动化与电气工程学院,山东 青岛 266071) 摘 要:为了研究多智能体系统的一致性特点及能控、能观性保持策略,分析了具有时变拓扑结构的多智能体系统 在一阶邻居协议和二阶邻居协议下的一致性速度,针对拓扑结构的特殊性,利用结构能控性性质和拉普拉斯矩阵第 二小特征值与一致性速度之间存在的关系设计出一种使能控性和能观测性保持的控制策略。 此外,得出多智能体 系统在二阶邻居协议下,具有更快的一致性速度的结论。 文中 2 个主要定理分别通过算例和仿真进行验证,算例和 仿真结果与定理结论一致。 关键词:多智能体系统;二阶邻居协议;时变拓扑结构;结构能控性;能控性;能观测性;图论 中图分类号: TP13 文献标志码:A 文章编号:1673-4785(2017)02-0213-08 中文引用格式:王康,纪志坚,晁永翠. 二阶邻居协议下多智能体系统能控能观性保持[J]. 智能系统学报, 2017, 12(2): 213-220. 英文引用格式:WANG Kang,JI Zhijian,CHAO Yongcui. A control strategy for maitaining controllability and observability of a multi⁃agent system with the second⁃order neighborhood protocol[J]. CAAI transactions on intelligent systems, 2017, 12(2): 213- 220. A control strategy for maitaining controllability and observability of a multi⁃agent system with the second⁃order neighborhood protocol WANG Kang, JI Zhijian, CHAO Yongcui (School of Automation Engineering, Qingdao University, Qingdao 266071, China) Abstract:In order to study the characteristics of the consensus, controllability and observability of multi⁃agent sys⁃ tems, we analyze the consensus speed of a multi⁃agent system with time⁃varying topologies under first⁃order and second⁃order neighborhood protocols. By utilizing the properties of the structural controllability and the relationship between the second⁃smallest eigenvalue of the Laplacian matrix and the consensus speed, we designed a control strategy to maintain both controllability and observability. In addition, we concluded that the multi⁃agent system had a faster consensus speed under the second⁃order neighborhood protocol. Using examples and simulations, we veri⁃ fied the two main theorems proposed in this paper, with our observed results in full agreement with the conclusions of our theoretical analysis. Keywords: multi⁃agent system; second⁃order neighborhood protocol; time varying topologies; structural controlla⁃ bility; controllability; observability; graph theory 收稿日期:2016-01-13. 网络出版日期:2017-01-11. 基金项目:国家自然科学基金项目(61374062);山东省杰出青年科学基 金项目(JQ201419). 通信作者:纪志坚.E⁃mail:jizhijian@ pku.org.cn. 近些年,随着计算机网络系统、无人机、卫星系 统的高速发展,关于多智能体系统的研究也成为人 们研究的热点。 由于多智能体系统间各智能体的协 调控制能实现我们所需要的复杂运动,因此有关多 智能体系统的研究具有十分重要的意义。 在研究多 智能体系统时,我们利用代数图论[1] 的知识,把多 智能体系统用拓扑图表示。 其中,拓扑图的节点代 表各智能体,拓扑图的边代表各智能体间的连接关 系。 在研究过程中,产生了两个重大的结果,能控性 和一 致 性。 多 智 能 系 统 的 能 控 性 首 先 是 由
.214 智能系统学报 第12卷 Tannert)提出来的,通过利用经典能控性概念,把拉 体系统的能控性和能观测性得到保持。这对于易受 普拉斯矩阵分块为子矩阵,得到能控性判据。近年 外界环境干扰的多智能体系统的研究具有较高的理 来,多智能体系统的能控性研究受到国内外科研工 论价值。 作者的广泛关注3-)。然而,在能控性保持方面的 1预备知识 研究工作则刚刚起步,目前主要是以L.Sabatti- ni9]的研究为主。 在这篇文章中,我们所研究的拓扑图都是初始 一致性问题的研究可以追潮到20世纪70年代 状态连通的无向图。无向图可以用G= 的管理科学和统计领域[3。目前关于一致性问 (V,E,A)表示,其中,集合V表示图的节点集,集合 题的研究很大程度上以T.Vicsek[1]提出的Vicsek E表示连接节点的边集,E={e1,e2,…,e},矩阵 模型为基础。多智能体系统的一致性主要是研究如 A=[a:]为图G的邻接矩阵,其中元素ag为节点: 何基于多智能体系统中个体之间有限的信息交换, 与U之间的边的权重。令矩阵D=[d]为图G的度 实现所有智能体的某个或某些状态量趋于相等的问 矩阵,且当i=j时,元素d表示为节点:的度数;当 题。对一致性协议的研究能让我们清楚地了解到智 i≠j时,d=0。 能体之间信息交换的过程。Olfati-Sabert6提出了 拉普拉斯矩阵是表示拓扑图节点与边关系的一 解决多智能体网络系统的一致性协议的理论框架, 种矩阵,也是我们研究多智能体系统需要借助的一 并且得到在连续时间一阶多智能体系统中,当通信 个重要概念。对于一个包含N个节点的无向图G, 拓扑结构表示的图为无向图时,多智能体系统的一 其拉普拉斯矩阵定义为L=D-A,拉普拉斯矩阵还 致速度取决于图的拉普拉斯矩阵的第二小特征值的 可以表示为L=严1,其中矩阵I=[i]表示把无向 结论,即一致性速度与拓扑图的拉普拉斯矩阵第二 图G规定为具有任意方向有向图的关联矩阵,元素 小特征值入,之间存在正相关的关系。同时在文献 1 x:是e的起点 [1,16-18]中,对第二小特征值入2的物理意义也做 -1, x:是e的终点 出了说明,并指出了入,不仅可以度量一致性速度, 0, x:与e不相关 也可以表示智能体系统的稳定性。 拉普拉斯矩阵具有如下性质: 在一致性问题中,以一阶邻居协议的研究最为 1)对于一个所有元素均为1的列向量,L与该 普遍,即考虑智能体的邻居信息。一阶邻居协议具 列向量的乘积为零矩阵; 有适用面广泛、作用原理简单的优点。然而由于多 2)令入1,入2,…,入w为拉普拉斯矩阵的特征值, 智能体系统越来越复杂,一阶邻居协议的信息交换 则0=入1≤入2≤…≤入N: 方式已经不能满足我们的需要,例如在复杂的全球 3)第1个非零特征值(第2个最小的特征值 卫星网络(GPS)中,采用一阶邻居协议显然会使信 入z)称为代数连通度。 息的交换效率低下,整个卫星系统协同控制效果并 文中对二阶邻居协议下的多智能体系统进行了 不好。而采用二阶邻居协议,由于系统收敛性比前 讨论。因此,我们需要掌握合并图的概念。合并图 者更好,这就为复杂卫星网络系统的运转提供更高 是由节点与实际边组成的实际图g和节点与虚拟边 效的保障。因此,对二阶邻居协议的研究就显得尤 组成的虚拟图g。构成。因此,合并图的拉普拉斯矩 为重要。和一阶邻居协议相比,二阶邻居协议不仅 阵L。分别由图G中实际图的拉普拉斯矩阵L和虚 利用智能体邻居的信息,还利用其二阶邻居的信息, 拟图的拉普拉斯矩阵i构成。即L.=L+i。记D 而系统实际的通信拓扑结构并未发生变化。本文通 过对上述两种一致性协议进行比较,得出了多智能 和A为虚拟图的度矩阵和邻接矩阵,D和A为实际 体系统采用二阶邻居协议时,多智能体系统中各智 图的度矩阵和邻接矩阵,那么L=(D+D)- 能体达到一致性速度更快的结论。同时,针对现实 (A+A)。 中具有时变拓扑结构的系统,为了使网络系统能够 更稳定运转,避免受外部环境的影响,以达到人们需 2系统模型 要的工作状态,这就对系统的能控性和能观测性提 考虑具有N个智能体的多智能体系统,并且此 出了很大要求,就需要领航者对跟随者的控制能力 系统可以用无向图G=(V,E,A)表示。记x:为第i 一直保持下去。本文通过借助结构能控性的概念和 个智能体的状态,每个智能体的状态遵循如下一阶 性质90),设计了一种全新的控制策略,使多智能 动力学方程:
Tanner [2]提出来的,通过利用经典能控性概念,把拉 普拉斯矩阵分块为子矩阵,得到能控性判据。 近年 来,多智能体系统的能控性研究受到国内外科研工 作者的广泛关注[3-8] 。 然而,在能控性保持方面的 研究工作则 刚 刚 起 步, 目 前 主 要 是 以 L. Sabatti⁃ ni [9-12]的研究为主。 一致性问题的研究可以追溯到 20 世纪 70 年代 的管理科学和统计领域[13-14] 。 目前关于一致性问 题的研究很大程度上以 T.Vicsek [15] 提出的 Vicsek 模型为基础。 多智能体系统的一致性主要是研究如 何基于多智能体系统中个体之间有限的信息交换, 实现所有智能体的某个或某些状态量趋于相等的问 题。 对一致性协议的研究能让我们清楚地了解到智 能体之间信息交换的过程。 Olfati⁃Saber [16] 提出了 解决多智能体网络系统的一致性协议的理论框架, 并且得到在连续时间一阶多智能体系统中,当通信 拓扑结构表示的图为无向图时,多智能体系统的一 致速度取决于图的拉普拉斯矩阵的第二小特征值的 结论,即一致性速度与拓扑图的拉普拉斯矩阵第二 小特征值 λ2 之间存在正相关的关系。 同时在文献 [1,16-18]中,对第二小特征值 λ2 的物理意义也做 出了说明,并指出了 λ2 不仅可以度量一致性速度, 也可以表示智能体系统的稳定性。 在一致性问题中,以一阶邻居协议的研究最为 普遍,即考虑智能体的邻居信息。 一阶邻居协议具 有适用面广泛、作用原理简单的优点。 然而由于多 智能体系统越来越复杂,一阶邻居协议的信息交换 方式已经不能满足我们的需要,例如在复杂的全球 卫星网络(GPS)中,采用一阶邻居协议显然会使信 息的交换效率低下,整个卫星系统协同控制效果并 不好。 而采用二阶邻居协议,由于系统收敛性比前 者更好,这就为复杂卫星网络系统的运转提供更高 效的保障。 因此,对二阶邻居协议的研究就显得尤 为重要。 和一阶邻居协议相比,二阶邻居协议不仅 利用智能体邻居的信息,还利用其二阶邻居的信息, 而系统实际的通信拓扑结构并未发生变化。 本文通 过对上述两种一致性协议进行比较,得出了多智能 体系统采用二阶邻居协议时,多智能体系统中各智 能体达到一致性速度更快的结论。 同时,针对现实 中具有时变拓扑结构的系统,为了使网络系统能够 更稳定运转,避免受外部环境的影响,以达到人们需 要的工作状态,这就对系统的能控性和能观测性提 出了很大要求,就需要领航者对跟随者的控制能力 一直保持下去。 本文通过借助结构能控性的概念和 性质[19-20] ,设计了一种全新的控制策略,使多智能 体系统的能控性和能观测性得到保持。 这对于易受 外界环境干扰的多智能体系统的研究具有较高的理 论价值。 1 预备知识 在这篇文章中,我们所研究的拓扑图都是初始 状 态 连 通 的 无 向 图。 无 向 图 可 以 用 G = (V,E,A) 表示,其中,集合 V 表示图的节点集,集合 E 表示连接节点的边集, E = e1 ,e2 ,…,ej { } ,矩阵 A = aij [ ] 为图 G 的邻接矩阵,其中元素 aij 为节点 vi 与 vj 之间的边的权重。 令矩阵 D = dij [ ] 为图 G 的度 矩阵,且当 i = j 时,元素 dij 表示为节点 vi 的度数;当 i ≠ j 时, dij = 0。 拉普拉斯矩阵是表示拓扑图节点与边关系的一 种矩阵,也是我们研究多智能体系统需要借助的一 个重要概念。 对于一个包含 N 个节点的无向图 G , 其拉普拉斯矩阵定义为 L = D - A ,拉普拉斯矩阵还 可以表示为 L = I T I ,其中矩阵 I = [i ij] 表示把无向 图 G 规定为具有任意方向有向图的关联矩阵,元素 i ij = 1 , xi 是 ej 的起点 - 1, xi 是 ej 的终点 0 , xi 与 ej 不相关 ì î í ï ï ï ï 拉普拉斯矩阵具有如下性质: 1)对于一个所有元素均为 1 的列向量, L 与该 列向量的乘积为零矩阵; 2)令 λ1 ,λ2 ,…,λ N 为拉普拉斯矩阵的特征值, 则 0 = λ1 ≤ λ2 ≤ … ≤ λ N ; 3)第 1 个非零特征值(第 2 个最小的特征值 λ2 ) 称为代数连通度。 文中对二阶邻居协议下的多智能体系统进行了 讨论。 因此,我们需要掌握合并图的概念。 合并图 是由节点与实际边组成的实际图 g 和节点与虚拟边 组成的虚拟图 gv 构成。 因此,合并图的拉普拉斯矩 阵 Lc 分别由图 G 中实际图的拉普拉斯矩阵 L 和虚 拟图的拉普拉斯矩阵 L ~ 构成。 即 Lc = L + L ~ 。 记 D ~ 和 A ~ 为虚拟图的度矩阵和邻接矩阵, D 和 A 为实际 图的 度 矩 阵 和 邻 接 矩 阵, 那 么 Lc = D + D ~ ( ) - A + A ~ ( ) 。 2 系统模型 考虑具有 N 个智能体的多智能体系统,并且此 系统可以用无向图 G = (V,E,A) 表示。 记 xi 为第 i 个智能体的状态,每个智能体的状态遵循如下一阶 动力学方程: ·214· 智 能 系 统 学 报 第 12 卷
第2期 王康,等:二阶邻居协议下多智能体系统能控能观性保持 ·215 x:(t)=u:(t),i=1,2,…,n (1) x'LX 入,(G)=min 式中x:(t)和4,(t)分别为智能体i的状态和输入。 ≠0IxI2 1x=0 设N:为智能体i的邻居集,即N:= 即入2(G)‖x‖2≤x'Lx,故 行∈V(G)I(,)∈E(G)}。那么在一阶邻居协 议下, V(x)≤-A2(G)IxI2=-2A2(G)V(x)≤0 所以x的状态与入,相关,当V(x)<0时,说明系统 u,()=-∑0x,)-x()),i=1,2,…,n jeN 渐近稳定且以速度入2进行收敛,当V(x)=0时,说 (2) 明x的状态为0,x:=,即系统中每个智能体达到 设N为智能体i的二阶邻居集,即N好= 一 致性状态。 {k∈k∈yJ∈N:,k≠i,k年N}。所以各智 证毕。 能体之间通过二阶邻居一致性协议进行下式连接: 定理1对于一阶多智能体系统(1),它在二阶 0=-w-0)A.(0- 邻居协议(3)下达到一致性的速度比在一阶邻居协 议(2)下更快。 x(t)),i=1,2,…,n (3) 证明对于一个具有N个节点的无向图G,假 设在一阶邻居协议(2)下它的拉普拉斯矩阵为L, 式中:心,为实际图中节点之间的权值,wk为虚拟图 关联矩阵为I,那么x'Lx=x'Ix=(I'x)Tx。因 节点之间权值。 为对于任意两个节点x:和x,1=±[-11],所 在式(3)中,每个智能体在获取自己的状态信 以1x=±(x:-x),即xx=∑(x,-)2。根 息时不仅利用其邻居的状态信息,还利用其二阶邻 ijeE(G) 居的状态信息。由于智能体i与其二阶邻居之间并 据拉普拉斯矩阵的性质2,可得入,(G)= 不存在实际的通信链路,所以智能体i的二阶邻居 (x:-x)2 ie(G) 的信息由智能体i的邻居间接传递给i。由式(1) -i=1,2,…,n,对于无向连通图 和式(3),系统中每个智能体的状态可以表示为 ,()=-∑0,(x,()-()-∑0(x(t)- G,入2可以表示为 jeN ke好 ∑(x-x)2 x(t)),i=1,2,…,n (4) A2(G)=min (6) x≠0 ∑好 1x=0 令w=10t=1,则 在二阶邻居协议(3)下,节点x:不仅考虑与它 x(0)=- 三x@-)-④) 邻居节点x间的连接关系,还需要考虑与二阶邻居 keN 节点x之间的连接关系。因此,如果k∈ x(t)),i=1,2,…,n E(g)时,其中i为虚拟图g。的关联矩阵。所以 所以系统可以写为如下这种形式: xLx=x(L+L)x= x(t)=-Lx(t)-Lx(t)= ∑(x-x)2+∑(x-)2 ikeE(g:) -(L+L)x(t)=-Lx(i) (5) 因此 引理116)]拉普拉斯矩阵L.的第二小特征值 ∑x-x)2+∑(x-x)2 入,可用于表征系统一致收敛的速度。 jeE(C ikeE(g) 入,(G)=min 证明构造一个李雅普诺夫函数: x*0 1Tx=0 ∑ =r7=方Ix (7) 显然,式(7)大于式(6),即多智能体系统在二 对此函数求导可得 阶邻居协议下达到一致性的速度比在一阶邻居协议 +x1: )=r)x 下更快。证毕。 我们也可以借助例子对定理1做进一步理解。 结合式(5)得 对于具有4个节点的多智能体系统(1),假设各智 V(x)=-xLx 能体在t=0时刻的状态分别为x(0)= 因为图G是无向连通图,所以6: [51-6-8]T。通过借助MATLAB可以分
x · i (t) = ui (t) , i = 1,2,…,n (1) 式中 xi (t) 和 ui (t) 分别为智能体 i 的状态和输入。 设 Ni 为 智 能 体 i 的 邻 居 集, 即 Ni = j ∈ V(G) vi,vj { ( ) ∈ E(G) } 。 那么在一阶邻居协 议下, ui (t) = - ∑ j∈Ni wij xi (t) - xj ( (t) ) ,i = 1,2,…,n (2) 设 N 2 i 为 智 能 体 i 的 二 阶 邻 居 集, 即 N 2 i = k ∈ v k ∈ Nj,j ∈ Ni,k ≠ i,k ∉ Ni { } 。 所以各智 能体之间通过二阶邻居一致性协议进行下式连接: ui(t) = - ∑ j∈Ni wij(xi(t) - xj(t)) - ∑k∈N2 i wik(xi(t) - xk(t)),i = 1,2,…,n (3) 式中: wij 为实际图中节点之间的权值, wik 为虚拟图 节点之间权值。 在式(3)中,每个智能体在获取自己的状态信 息时不仅利用其邻居的状态信息,还利用其二阶邻 居的状态信息。 由于智能体 i 与其二阶邻居之间并 不存在实际的通信链路,所以智能体 i 的二阶邻居 的信息由智能体 i 的邻居间接传递给 i 。 由式(1) 和式(3),系统中每个智能体的状态可以表示为 x · i(t) = - ∑ j∈Ni wij(xi(t) - xj(t)) - ∑k∈N2 i wik(xi(t) - xk(t)),i = 1,2,…,n (4) 令 wij = wik = 1,则 x · i(t) = - ∑ j∈Ni (xi(t) - xj(t)) - ∑k∈N2 i (xi(t) - xk(t)),i = 1,2,…,n 所以系统可以写为如下这种形式: x · (t) = - Lx(t) - L ~ x(t) = - (L + L ~ )x(t) = - Lcx(t) (5) 引理 1 [16] 拉普拉斯矩阵 Lc 的第二小特征值 λ2 可用于表征系统一致收敛的速度。 证明 构造一个李雅普诺夫函数: V(x) = x T 1 2 x = 1 2 ‖x‖2 对此函数求导可得 V · (x) = x ·T 1 2 x + x T 1 2 x · 结合式(5)得 V · (x) = - x TLcx 因为图 G 是无向连通图,所以[16] : λ2 (G) = min x≠0 1 Tx = 0 x TLcx ‖x‖2 即 λ2 (G) ‖x‖2 ≤ x TLx ,故 V · (x) ≤- λ2 (G) ‖x‖2 = - 2λ2 (G) V(x) ≤ 0 所以 x 的状态与 λ2 相关,当 V · (x) < 0 时,说明系统 渐近稳定且以速度 λ2 进行收敛,当 V · (x) = 0 时,说 明 x 的状态为 0, xi = xj ,即系统中每个智能体达到 一致性状态。 证毕。 定理 1 对于一阶多智能体系统(1),它在二阶 邻居协议(3)下达到一致性的速度比在一阶邻居协 议(2)下更快。 证明 对于一个具有 N 个节点的无向图 G ,假 设在一阶邻居协议(2)下它的拉普拉斯矩阵为 L , 关联矩阵为 I ,那么 x TLx = x T II T x = (I T x) T I T x 。 因 为对于任意两个节点 xi 和 xj , I = ± [ - 1 1] ,所 以 I T x = ± xi - xj ( ) ,即 x TLx = ij∈∑E(G) xi - xj ( ) 2 。 根 据 拉 普 拉 斯 矩 阵 的 性 质 2, 可 得 λi (G) = ∑ij∈E (G ) xi - xj ( ) 2 ∑i x 2 i i = 1,2,…,n ,对于无向连通图 G , λ2 可以表示为 λ2 (G) = min x≠0 1 Tx = 0 ∑ij∈E (G ) xi - xj ( ) 2 ∑i x 2 i (6) 在二阶邻居协议(3)下,节点 xi 不仅考虑与它 邻居节点 xj 间的连接关系,还需要考虑与二阶邻居 节点 xk 之 间 的 连 接 关 系。 因 此, 如 果 ik ∈ E gv ( ) 时, 其中 I ~ 为虚拟图 gv 的关联矩阵。 所以 x TLcx = x T L + L ~ ( ) x = ∑ij∈E (G ) xi - xj ( ) 2 + ∑ik∈E gv ( ) xi - xj ( ) 2 因此 λ2 (G) = min x≠0 1 Tx = 0 ∑ij∈E (G ) xi - xj ( ) 2 + ∑ik∈E gv ( ) xi - xk ( ) 2 ∑i x 2 i (7) 显然,式(7)大于式(6),即多智能体系统在二 阶邻居协议下达到一致性的速度比在一阶邻居协议 下更快。 证毕。 我们也可以借助例子对定理 1 做进一步理解。 对于具有 4 个节点的多智能体系统(1),假设各智 能 体 在 t = 0 时 刻 的 状 态 分 别 为 x(0) = [5 1 - 6 - 8] T 。 通过借助 MATLAB 可以分 第 2 期 王康,等: 二阶邻居协议下多智能体系统能控能观性保持 ·215·
216 智能系统学报 第12卷 别绘制出系统在一阶邻居协议(2)下各个智能体的 当在系统中选取后几个节点为领航者时,我们 状态轨迹(图1)和系统在二阶邻居协议(3)下各个 把前N(N。≥1)个节点记为跟随者的个数,其余 智能体的状态轨迹(图2)。 的节点代表领航者的个数,记为N,(N,≥1)。所 6 以在具有N个智能体的系统中,N=N-N,。根据 文献[21],合并图的拉普拉斯矩阵L.可分块为 L。=- 「Fr r B 式中:矩阵F∈Rxr代表跟随者之间的传递关系, 矩阵B∈Rx,代表领航者之间的传递关系,矩阵 r∈Rrx代表领航者和跟随者之间的传递关系。 当在系统中选取任意多个节点为领航者时,假 012345678910 设系统中有N,个领航者,我们规定矩阵r取自矩阵 图1一阶邻居协议下各智能体的状态轨迹 L.中这N,个节点所在的列向量减去这N个节点所 Fig.1 The state trajectory of each agent under the 在行向量和列向量的共同元素后剩余元素所组成的 first-order neighbors protocol Np×N,矩阵。矩阵-F为合并图拉普拉斯矩阵L 6 减去这N,个节点所在行和所在列后剩下的Ne×Ne 4 矩阵。 3实例分析 0 装2 对于一个具有5个节点的拓扑图,我们取第2 个和第4个节点作为领航者,如图3。 -4 -6 1 2 3 4 5 012345678910 图3具有5个节点的拓扑图 图2二阶邻居协议下各智能体的状态轨迹 Fig.3 Topology with 5 nodes Fig.2 The state trajectory of each agent under the sec- 那么 ond-order neighbors protocol 「1 -1 0 0 0 通过对图1和图2进行比较分析,我们发现多 -1 2 -1 0 0 智能体系统(1)在二阶邻居协议(3)下的收敛性更 L=D-A= 0 -1 2 -1 0 好,即在二阶邻居协议(3)下各智能体达到一致性 0 0 -1 2 的速度要比在一阶邻居协议(2)下更快。因此,在 0 0 0 -1 设计多智能体系统时,尽可能地选用基于二阶邻居 的一致性协议,会使系统更快速地达到一致性。 「1 0 -1 0 0 为了控制多智能体系统(1)的状态,我们把能 0 1 0 -1 0 够获得外部控制输入的智能体称为领航者,其余的 i=D-A= -1 0 2 -1 智能体称为跟随者。令V,(G)为领航者的集合, 0 -1 0 0 V(G)=V(G)-V,(G)为跟随者的集合,则基于二 0 0 -1 0 1 阶邻居的一致性协议(3)规则可以修改为 所以 )=-∑(c,()-x0)- 「 2 -1 -1 0 0 -1 3 -1 -1 ∑(c,(0)-x()),:eV(G) (8) 0 e好 L。=L+i= -1-1 4 -1-1 x,(t)=:,:eV(G) 0 -1 -13 -1 式中:u:=u:(t)∈R为外部控制输人,且u及u:都 L00 -1 -12J 是有界的,即3u,∈R,使得 假设领航者能够获得输出向量y,且y∈ Rx1,那么,网络系统的动态方程可以写为文献 ‖w:‖≤u,la:‖≤i,i=i=1,2,…,n [9]所描述的那样: (9)
别绘制出系统在一阶邻居协议(2)下各个智能体的 状态轨迹(图 1)和系统在二阶邻居协议(3)下各个 智能体的状态轨迹(图 2)。 图 1 一阶邻居协议下各智能体的状态轨迹 Fig.1 The state trajectory of each agent under the first⁃order neighbors protocol 图 2 二阶邻居协议下各智能体的状态轨迹 Fig.2 The state trajectory of each agent under the sec⁃ ond⁃order neighbors protocol 通过对图 1 和图 2 进行比较分析,我们发现多 智能体系统(1)在二阶邻居协议(3)下的收敛性更 好,即在二阶邻居协议(3)下各智能体达到一致性 的速度要比在一阶邻居协议(2) 下更快。 因此,在 设计多智能体系统时,尽可能地选用基于二阶邻居 的一致性协议,会使系统更快速地达到一致性。 为了控制多智能体系统(1) 的状态,我们把能 够获得外部控制输入的智能体称为领航者,其余的 智能体称为跟随者。 令 VL (G) 为领航者的集合, VF (G) = V(G) - VL (G) 为跟随者的集合,则基于二 阶邻居的一致性协议(3)规则可以修改为 x · i (t) = - ∑ j∈Ni xi (t) - xj ( (t) ) - ∑k∈N2 i xi (t) - xk ( (t) ) , vi ∈ VF (G) xi (t) = ui, vi ∈ VL (G) ì î í ï ï ï ï ï ï (8) 式中: ui = ui (t) ∈ R 为外部控制输入,且 u 及 u · i 都 是有界的,即 ∃uL ∈ R ,使得 ‖ui‖ ≤ uL ,‖u · i‖ ≤ u · L ,∀i = i = 1,2,…,n (9) 当在系统中选取后几个节点为领航者时,我们 把前 NF (NF ≥ 1) 个节点记为跟随者的个数,其余 的节点代表领航者的个数,记为 NL (NL ≥ 1) 。 所 以在具有 N 个智能体的系统中, NF = N - NL 。 根据 文献[21],合并图的拉普拉斯矩阵 Lc 可分块为 Lc = - F r r T B é ë ê ê ù û ú ú 式中:矩阵 F ∈ R NF ×NF 代表跟随者之间的传递关系, 矩阵 B ∈ R NL ×NL 代表领航者之间的传递关系,矩阵 r ∈R NF ×NL 代表领航者和跟随者之间的传递关系。 当在系统中选取任意多个节点为领航者时,假 设系统中有 NL 个领航者,我们规定矩阵 r 取自矩阵 Lc 中这 NL 个节点所在的列向量减去这 NL 个节点所 在行向量和列向量的共同元素后剩余元素所组成的 NF × NL 矩阵。 矩阵 - F 为合并图拉普拉斯矩阵 Lc 减去这 NL 个节点所在行和所在列后剩下的 NF × NF 矩阵。 3 实例分析 对于一个具有 5 个节点的拓扑图,我们取第 2 个和第 4 个节点作为领航者,如图 3。 图 3 具有 5 个节点的拓扑图 Fig.3 Topology with 5 nodes 那么 L = D - A = 1 - 1 0 0 0 - 1 2 - 1 0 0 0 - 1 2 - 1 0 0 0 - 1 2 - 1 0 0 0 - 1 1 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú L ~ = D ~ - A ~ = 1 0 - 1 0 0 0 1 0 - 1 0 - 1 0 2 0 - 1 0 - 1 0 1 0 0 0 - 1 0 1 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 所以 Lc = L + L ~ = 2 - 1 - 1 0 0 - 1 3 - 1 - 1 0 - 1 - 1 4 - 1 - 1 0 - 1 - 1 3 - 1 0 0 - 1 - 1 2 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 假设领航者能够获得输出向量 y , 且 y ∈ R NL ×1 ,那么,网络系统的动态方程可以写为文献 [9]所描述的那样: ·216· 智 能 系 统 学 报 第 12 卷
第2期 王康,等:二阶邻居协议下多智能体系统能控能观性保持 ·217. 4.1 g =Fxg ru 结构能控性 (10) 定义1对于一个无权重的多智能体系统,如 ly=rxp 果能够找到至少一组权重,使得相应的系统变为能 定理2若合并图的拉普拉斯矩阵L.的子矩阵 控,那么称这个多智能体系统是结构能控的。 F所对应的正交特征向量组成的矩阵U不与向量r 在文章[18]中,可以知道多智能体系统是结构 正交,则此拓扑图所对应的多智能体系统既是能控 能控的,当且仅当系统的拓扑图是连通的,即代数连 的,又是能观测的。 通度入2>0。可以借助结构能控性的概念,通过给 证明根据式(10),可得能控性判别矩阵: 拓扑图的边赋予相应的权值,使本来不能控的系统 C=[rFrF2r…Fm-lr] (11) 变为能控,以达到对多智能体系统的状态要求。 因为拉普拉斯矩阵L与立分别是对称矩阵,所 4.2实例分析 以L+也为对称矩阵。故子矩阵F是对称矩阵。 对于图4所示的简单图G,我们给边赋予一组 根据对称矩阵的性质可得F=UDU,其中D是以 权值,其中,实线表示实际图g的连结方式,虚线表 示虚拟图g。的连结方式,我们选择第4个节点作为 矩阵F的特征值为元素的对角矩阵,U是矩阵F的 领航者,那么:实际图的拉普拉斯矩阵L和虚拟图 正交特征向量组成的矩阵。所以能控性判别矩阵: 的拉普拉斯矩阵分别为 C=[r UDU'r (UDU)'r ..(UDU)r] 「2-2 0 07 可写为 -2 3 -1 -4 L= C=r UDU'r UD'U'r ..UD"-'Ur]= 0 -1 4 -3 -4 -3 7 U[U'r DU'r D'U'r ..D"-U'r] 「3 0 -2 -17 因为U是非奇异矩阵,若使能控性判别矩阵C 0 0 0 0 满秩,只需要保证矩阵 L= -20 2 0 U'r DU'r D'Ur ..D-Ur] -10 0 1 行满秩即可。又因为对角矩阵D是非奇异矩阵,所 所以基于二阶邻居协议下多智能体系统的拉普 以Ur≠0即可保证系统能控。能观性判别矩阵: 拉斯矩阵为 r -2 -2-1 rF -2 3 -4 0= (12) L,=L+L= -2 -1 -3 rFa-t -1-4-3 8 同理,若使能观性判别矩阵O满秩,则也需使 Ur≠0。也就是说,若多智能体系统是能控的,那 么它也是能观测的。证毕。 2 综上所述,在二阶邻居协议下,多智能体系统既 能控又能观测的条件为:矩阵F所对应的特征向量 3 U不与向量r正交。 图4权图 4对结构能控性维持策略的研究 Fig.4 Weight graph 由式(11)得,能控性判别矩阵为 在基于二阶邻居协议(3)下具有时变拓扑结构 「-191157 的多智能体系统(1)随时间变化过程中,各节点之 C= -4-23-167 间边的条数和距离可能发生变化,进而影响系统合 -3-12-67 并图的拉普拉斯矩阵L。,并根据定理2和文献 式中:rank(C)=3。所以,通过给边赋予权值后,网 [1],在某一时刻,可能也会导致代数连通度入,发 络系统具有能控性和能观测性。因此我们就称原系 生改变以及使得系统不能控。因此,为了避免具有 统是结构能控的。 时变拓扑结构的多智能体系统(1)的能控性发生改 根据结构能控性的定义和文献[18],可得到图5 变,我们引入了结构能控性的概念
x · F = FxF + ru y = r T xF { (10) 定理 2 若合并图的拉普拉斯矩阵 Lc 的子矩阵 F 所对应的正交特征向量组成的矩阵 U 不与向量 r 正交,则此拓扑图所对应的多智能体系统既是能控 的,又是能观测的。 证明 根据式(10),可得能控性判别矩阵: C = r Fr F 2 r … F n-1 [ r] (11) 因为拉普拉斯矩阵 L 与 L ~ 分别是对称矩阵,所 以 L + L ~ 也为对称矩阵。 故子矩阵 F 是对称矩阵。 根据对称矩阵的性质可得 F = UD ^ U T ,其中 D ^ 是以 矩阵 F 的特征值为元素的对角矩阵, U 是矩阵 F 的 正交特征向量组成的矩阵。 所以能控性判别矩阵: C = r UD ^ U T r (UD ^ U T ) 2 r … (UD ^ U T ) n-1 [ r] 可写为 C = r UD ^ U T r UD ^ 2U T r … UD ^ n-1U T [ r] = U U T r D ^ U T r D ^ 2U T r … D ^ n-1U T [ r] 因为 U 是非奇异矩阵,若使能控性判别矩阵 C 满秩,只需要保证矩阵 U T r D ^ U T r D ^ 2U T r … D ^ n-1U T [ r] 行满秩即可。 又因为对角矩阵 D ^ 是非奇异矩阵,所 以 U T r ≠ 0 即可保证系统能控。 能观性判别矩阵: O = r T r TF ︙ r TF n-1 é ë ê ê ê ê ê ù û ú ú ú ú ú = C T (12) 同理,若使能观性判别矩阵 O 满秩,则也需使 U T r ≠ 0。 也就是说,若多智能体系统是能控的,那 么它也是能观测的。 证毕。 综上所述,在二阶邻居协议下,多智能体系统既 能控又能观测的条件为:矩阵 F 所对应的特征向量 U 不与向量 r 正交。 4 对结构能控性维持策略的研究 在基于二阶邻居协议(3)下具有时变拓扑结构 的多智能体系统(1)随时间变化过程中,各节点之 间边的条数和距离可能发生变化,进而影响系统合 并图的拉普拉斯矩阵 Lc ,并根据定理 2 和文献 [1],在某一时刻,可能也会导致代数连通度 λ2 发 生改变以及使得系统不能控。 因此,为了避免具有 时变拓扑结构的多智能体系统(1)的能控性发生改 变,我们引入了结构能控性的概念。 4.1 结构能控性 定义 1 对于一个无权重的多智能体系统,如 果能够找到至少一组权重,使得相应的系统变为能 控,那么称这个多智能体系统是结构能控的。 在文章[18]中,可以知道多智能体系统是结构 能控的,当且仅当系统的拓扑图是连通的,即代数连 通度 λ2 > 0。 可以借助结构能控性的概念,通过给 拓扑图的边赋予相应的权值,使本来不能控的系统 变为能控,以达到对多智能体系统的状态要求。 4.2 实例分析 对于图 4 所示的简单图 G ,我们给边赋予一组 权值,其中,实线表示实际图 g 的连结方式,虚线表 示虚拟图 gv 的连结方式,我们选择第 4 个节点作为 领航者,那么:实际图的拉普拉斯矩阵 L 和虚拟图 的拉普拉斯矩阵 L ~ 分别为 L = 2 - 2 0 0 - 2 3 - 1 - 4 0 - 1 4 - 3 0 - 4 - 3 7 é ë ê ê ê ê ê ù û ú ú ú ú ú L ~ = 3 0 - 2 - 1 0 0 0 0 - 2 0 2 0 - 1 0 0 1 é ë ê ê ê ê ê ù û ú ú ú ú ú 所以基于二阶邻居协议下多智能体系统的拉普 拉斯矩阵为 Lc = L + L ~ = 5 - 2 - 2 - 1 - 2 3 - 1 - 4 - 2 - 1 6 - 3 - 1 - 4 - 3 8 é ë ê ê ê ê ê ù û ú ú ú ú ú 图 4 权图 Fig.4 Weight graph 由式(11)得,能控性判别矩阵为 C = - 1 9 115 - 4 - 23 - 167 - 3 - 12 - 67 é ë ê ê ê ù û ú ú ú 式中: rank(C) = 3。 所以,通过给边赋予权值后,网 络系统具有能控性和能观测性。 因此我们就称原系 统是结构能控的。 根据结构能控性的定义和文献[18],可得到图 5 第 2 期 王康,等: 二阶邻居协议下多智能体系统能控能观性保持 ·217·
.218 智能系统学报 第12卷 所示的多智能体系统能控性和结构能控性的关系: e--l2x2, Ix:-xI≤R 0= (14) 拓扑图连通 其他 式中:K满足ex2=w,w是一个比0大的常数。 多智能体 当w,=0时,说明智能体x:x之间没有通信联系, 系统能控 即不存在边e。同理,虚拟图g.的权值: 多智能体系 统结构能控 e-Ix13 Ix:-x‖≤R(15) 0. 其他 图5多智能体系统能控性和结构能控性的关系 式中:为智能体x:与其二阶邻居x间的最大通信 Fig.5 Relationship between controllability and struc- tural controllability of multi-agent system 距离,k满足e2=0.0是一个比0大的常数。 3.3结构能控性的保持方法 由文献[1]可以知道,在权图中,入2与权值w, 在本文中,具有时变拓扑结构的多智能体系统 有关,即随着0减小,对应着入2的值也将减小。但 (1),随着时间的变化,可能会导致已连通的节点之 当心:=0时,由于一条边的减少不一定会导致拓扑 间的距离增加,从而使连通强度改变,导致系统的能 图的连通性发生改变,因此入2不一定为零。而当所 控性发生变化。我们的目的只考虑如何使已连通节 有边的权值都为零,即智能体间都没有通信关系时, 点间的连通强度不随时间消失,而关于不连通的节 拓扑图必定不连通,此时入,=0。 点是否会随时间而靠近从而连通的情况则不进行相 函数E(入2(·))为能量函数,当且满足以下性质: 关分析。如图6所示,其中(a)为网络系统的初始 1)H入2(·)>0,能量函数连续可微; 位置,设点1为领航者,并给它注入某一控制输入, 2)能量函数是非负的。 则各智能体在到达一致状态的过程中,显然由(b) limE(入2(·))=o 可看出,由于第2点和第3点的距离变大,致使两点 A2(·)0 的连接强度减弱,这显然不符合多智能体系统的设 aE(A2()) 计要求。 m。 A2)∥=∞ 因此,可以写出能量函数的表达式为 E,L(G))=A.L(G)-1) -(16) A2(L(G)) 所以网络系统的动态方程可以修改为式(7)形式: (a初始位置 (b)进化后 ,0=-∑(x,0-0)- 图6时变拓扑结构 Fig.6 Time varying topology ∑x,0-x))+,∈V,(G)(17) 因此,为了避免上述情况的出现,在本章节提出 了一个控制策略,如式(13)所示: (t)=:+,:eV(G) 定理3考虑上述基于二阶邻居一致性协议 aE(入2(L(G))) 4=- (13) (3)下的动态系统(1),令系统在t=0时刻是结 ox: 式中:L(G)为合并图的权拉普拉斯矩阵,实际图 构能控的,那么,控制策略=- g的权值与智能体x:、x之间的距离成反比,即随 8E(A2(Lw(G))) 能够确保系统(1)的结构能控 着智能体间距离的增加,权值减小。为了易于理解, ox: 我们给W:赋予通信联系强弱的物理意义。我们可 性得到保持。 以用式(14)来描述权值与智能体距离之间的关系。 证明在t=0时刻,假设多智能体系统(1)结 设R为任意两个智能体间的最大通信距离,即 构能控,即拓扑图连通,此时入2>0。式(17)所描 x:-x,I≤R 述的动态方程可以修改为如下形式: 时,两个智能体间有通信联系,节点x:、x,之间存在 x:=+,i=1,2,…,n (18) 边e,此时w>0。那么 式中:外部输入u是有界的,即3uM∈R,使得
所示的多智能体系统能控性和结构能控性的关系: 图 5 多智能体系统能控性和结构能控性的关系 Fig. 5 Relationship between controllability and struc⁃ tural controllability of multi⁃agent system 3.3 结构能控性的保持方法 在本文中,具有时变拓扑结构的多智能体系统 (1),随着时间的变化,可能会导致已连通的节点之 间的距离增加,从而使连通强度改变,导致系统的能 控性发生变化。 我们的目的只考虑如何使已连通节 点间的连通强度不随时间消失,而关于不连通的节 点是否会随时间而靠近从而连通的情况则不进行相 关分析。 如图 6 所示,其中( a) 为网络系统的初始 位置,设点 1 为领航者,并给它注入某一控制输入, 则各智能体在到达一致状态的过程中,显然由( b) 可看出,由于第 2 点和第 3 点的距离变大,致使两点 的连接强度减弱,这显然不符合多智能体系统的设 计要求。 图 6 时变拓扑结构 Fig.6 Time varying topology 因此,为了避免上述情况的出现,在本章节提出 了一个控制策略,如式(13)所示: u c i = - ∂Ε(λ2 (Lcw (G) ) ) ∂xi (13) 式中: Lcw (G) 为合并图的权拉普拉斯矩阵,实际图 g 的权值与智能体 xi 、 xj 之间的距离成反比,即随 着智能体间距离的增加,权值减小。 为了易于理解, 我们给 wij 赋予通信联系强弱的物理意义。 我们可 以用式(14)来描述权值与智能体距离之间的关系。 设 R 为任意两个智能体间的最大通信距离,即 ‖xi - xj‖ ≤ R 时,两个智能体间有通信联系,节点 xi 、 xj 之间存在 边 eij ,此时 wij > 0。 那么 wij = e -‖xi -xj‖2 / κ2 , ‖xi - xj‖ ≤ R 0, 其他 ì î í ïï ïï (14) 式中: κ 满足 e -R2 / κ2 = ω , ω 是一个比 0 大的常数。 当 wij = 0 时,说明智能体 xi、xj 之间没有通信联系, 即不存在边 eij 。 同理,虚拟图 gv 的权值: wik = e -‖xi -xk‖2 / κ ~ 2 , ‖xi - xk‖ ≤ R ~ 0, 其他 { (15) 式中: R ~ 为智能体 xi 与其二阶邻居 xk 间的最大通信 距离, κ ~ 满足 e - R ~ 2 / κ ~ 2 = ω ~ 。 ω ~ 是一个比 0 大的常数。 由文献[1]可以知道,在权图中, λ2 与权值 wij 有关,即随着 wij 减小,对应着 λ2 的值也将减小。 但 当 wij = 0 时,由于一条边的减少不一定会导致拓扑 图的连通性发生改变,因此 λ2 不一定为零。 而当所 有边的权值都为零,即智能体间都没有通信关系时, 拓扑图必定不连通,此时 λ2 = 0 。 函数 Ε(λ2 (·) ) 为能量函数,当且满足以下性质: 1) ∀λ2 (·) > 0,能量函数连续可微; 2)能量函数是非负的。 lim λ2 (·) →0 Ε(λ2 (·) ) = ¥ lim λ2 (·) →0 ‖ ∂Ε(λ2 (·) ) ∂λ2 (·) ‖ = ¥ 因此,可以写出能量函数的表达式为 Ε(λ2 (Lcw (G) ) ) = (λ2 (Lcw (G) ) - 1) 2 λ2 (Lcw (G) ) (16) 所以网络系统的动态方程可以修改为式(7)形式: x · i (t) = - ∑ j∈Ni xi (t) - xj ( (t) ) - ∑k∈N2 i xi (t) - xk ( (t) ) + u c i ,vi ∈ VF (G) x · i (t) = u · i + u c i ,vi ∈ VL (G) ì î í ï ï ï ï ï ï (17) 定理 3 考虑上述基于二阶邻居一致性协议 (3)下的动态系统( 1) ,令系统在 t = 0 时刻是结 构 能 控 的, 那 么, 控 制 策 略 u c i = - ∂Ε(λ2 (Lcw (G) ) ) ∂xi 能够确保系统( 1) 的结构能控 性得到保持。 证明 在 t = 0 时刻,假设多智能体系统(1)结 构能控,即拓扑图连通,此时 λ2 > 0 。 式(17)所描 述的动态方程可以修改为如下形式: x · i = u c i + u ε i ,∀i = 1,2,…,n (18) 式中:外部输入 u ε i 是有界的,即 ∃uM ∈ R ,使得 ·218· 智 能 系 统 学 报 第 12 卷
第2期 王康,等:二阶邻居协议下多智能体系统能控能观性保持 ·219 lu‖≤uw,i=1,2,…,n (19) 16 能量函数对时间的导数可以写为以下形式: 14 E()=VE()x=】 E)' ox. 10 由式(13)和式(18)可得,能量函数的导数也可 写为 =26'(-Eu+d) 2 ox. 0.51.01.52.02.53.03.54.04.55.0 根据式(19),并由 特征值2, E()=E(),() 图7能量函数E的图像 ac:a入2()ax: Fig.7 Image of energy function E 可得下列不等式: 由能量函数的图像可知,如果在初始时刻给具有结 E)≤-1aA,) 2N 2()2 构能控性的系统赋予一组权重不为1的权值,那么 2+ i=1 ox: 不仅说明入,恒大于零,系统结构能控性得到保持, a入,c)∥uw∑ aE() aA2(·) 还说明拓扑图恒连通,任意节点都会与其他至少一 ax, 个节点相连接。即‖x:-x‖≤R,存在权值0 因此,如果不等式 又因为权值0:=1时,由式(14)和式(15)得, M,()2 1含 A2() 川x:-x‖=0,显然无意义。因此权值e≠1,所 ox: 以结构能控性得到保持的系统必定存在一组边的权 (20) 值,且权值不为1。因此多智能体系统(1)具有能控 性和能观测性。 成立,则E(·)≤0。假设式(21)条件成立: A2().2 综上,通过在初始时刻赋予多智能体系统一组 立1 ≠0 (21) 权值且引入控制策略,具有时变拓扑结构的多智 能体系统的能控性和能观测性得到保持。 那么,式(20)所描述的不等式就可以写为 A2(·) 4结束语 =1 M,()2 ≤‖ 得1s 由于二阶邻居协议式(3)在到达一致性的速度 上比一阶邻居协议式(2)更有优势,所以本文对二 ox. 阶邻居协议式(3)下的多智能体方面进行了研究, (22) 并对相关定理通过算例进行验证。而对于智能体与 根据能量函数的性质,3入>0,使得 二阶邻居通信过程中可能会出现时滞的情况,这将 H入2()≤入,不等式(22)成立。这也表明 是未来的一个重点研究的问题。本文对具有时变拓 入2(·)的值大于零。假设 扑结构的多智能体系统的一致性协议的选取和能控 2 性保持方面的研究提供了一个方向和基础。 立 aA,( -1=0 (23) i= 参考文献: 式(23)成立,那么入2()=0,即入2()是一个恒大 [1]GODSIL C,ROYLE G.Algebraie graph theory M].New 于0的常数,说明系统结构能控性不发生变化。 York:Springer,2001. 因此由上述结论可知:如果在初始时刻拓扑图 [2]TANNER H G.On the controllability of nearest neighbor in- 连通,那么随着时间的变化,即使拓扑图的结构发生 terconnections[C]//Proceedings of the 43rd IEEE Confer- 变化,其所对应的拉普拉斯矩阵的第2个特征值入? ence on decision and Control.Nassau,2004,3:2467- 也会永远大于零。那么多智能体系统的结构能控性 2472. 得到了保持。证毕。 [3]JI Zhijian,LIN Hai,YU Haisheng.Protocols design and uncontrollable topologies construction for multi-agent net- 根据能量函数的图像可以进一步理解上述结 works[J].IEEE transactions on automatic control,2015, 论。能量函数的图像如图7所示。 60(3):781-786
‖u ε i ‖ ≤ uM ,∀i = 1,2,…,n (19) 能量函数对时间的导数可以写为以下形式: E · (·) = ÑxE (·) T x · = ∑ N i = 1 ∂Ε (·) T ∂xi x · i 由式(13)和式(18)可得,能量函数的导数也可 写为 E · (·) = ∑ N i = 1 ∂E (·) T ∂xi ( - ∂E(·) ∂xi + u ε i ) 根据式(19),并由 ∂E(·) ∂xi = ∂E(·) ∂λ2 (·) ∂λ2 (·) ∂xi 可得下列不等式: E · (·) ≤- ‖ ∂E(·) ∂λ2 (·) ‖ 2 ∑ N i = 1 ‖ ∂λ2 (·) ∂xi ‖ 2 + ‖ ∂E(·) ∂λ2 (·) ‖uM∑ N i = 1 ‖ ∂λ2 (·) ∂xi ‖ 因此,如果不等式 ‖ ∂E(·) ∂λ2 (·) ‖ ∑ N i = 1 ‖ ∂λ2 (·) ∂xi ‖ 2 ≥ uM∑ N i = 1 ‖ ∂λ2 (·) ∂xi ‖ (20) 成立,则 E · (·) ≤ 0。 假设式(21)条件成立: ∑ N i = 1 ‖ ∂λ2 (·) ∂xi ‖ 2 ≠ 0 (21) 那么,式(20)所描述的不等式就可以写为 uM ∑ N i = 1 ‖ ∂λ2 (·) ∂xi ‖ ∑ N i = 1 ‖ ∂λ2 (·) ∂xi ‖ 2 ≤ ‖ ∂E(·) ∂λ2 (·) ‖ < ¥ (22) 根 据 能 量 函 数 的 性 质, ∃λ - > 0, 使 得 ∀λ2 (·) ≤ λ - , 不 等 式 ( 22 ) 成 立。 这 也 表 明 λ2 (·) 的值大于零。 假设 ∑ N i = 1 ‖ ∂λ2 (·) ∂xi ‖ 2 = 0 (23) 式(23)成立,那么 λ · 2 (·) = 0,即 λ2 (·) 是一个恒大 于 0 的常数,说明系统结构能控性不发生变化。 因此由上述结论可知:如果在初始时刻拓扑图 连通,那么随着时间的变化,即使拓扑图的结构发生 变化,其所对应的拉普拉斯矩阵的第 2 个特征值 λ2 也会永远大于零。 那么多智能体系统的结构能控性 得到了保持。 证毕。 根据能量函数的图像可以进一步理解上述结 论。 能量函数的图像如图 7 所示。 图 7 能量函数 Ε 的图像 Fig.7 Image of energy function E 由能量函数的图像可知,如果在初始时刻给具有结 构能控性的系统赋予一组权重不为 1 的权值,那么 不仅说明 λ2 恒大于零,系统结构能控性得到保持, 还说明拓扑图恒连通,任意节点都会与其他至少一 个节点相连接。 即 ‖xi - xj‖ ≤ R ,存在权值 wij。 又因为权值 wij = 1 时, 由式 ( 14) 和式 ( 15) 得, ‖xi - xj‖ =0,显然无意义。 因此权值 wij ≠ 1,所 以结构能控性得到保持的系统必定存在一组边的权 值,且权值不为 1。 因此多智能体系统(1)具有能控 性和能观测性。 综上,通过在初始时刻赋予多智能体系统一组 权值且引入控制策略 u c i ,具有时变拓扑结构的多智 能体系统的能控性和能观测性得到保持。 4 结束语 由于二阶邻居协议式(3)在到达一致性的速度 上比一阶邻居协议式(2)更有优势,所以本文对二 阶邻居协议式(3)下的多智能体方面进行了研究, 并对相关定理通过算例进行验证。 而对于智能体与 二阶邻居通信过程中可能会出现时滞的情况,这将 是未来的一个重点研究的问题。 本文对具有时变拓 扑结构的多智能体系统的一致性协议的选取和能控 性保持方面的研究提供了一个方向和基础。 参考文献: [1]GODSIL C, ROYLE G. Algebraic graph theory[ M]. New York: Springer, 2001. [2]TANNER H G. On the controllability of nearest neighbor in⁃ terconnections[C] / / Proceedings of the 43rd IEEE Confer⁃ ence on decision and Control. Nassau, 2004, 3: 2467 - 2472. [3] JI Zhijian, LIN Hai, YU Haisheng. Protocols design and uncontrollable topologies construction for multi⁃agent net⁃ works[ J]. IEEE transactions on automatic control, 2015, 60(3): 781-786. 第 2 期 王康,等: 二阶邻居协议下多智能体系统能控能观性保持 ·219·
·220 智能系统学报 第12卷 [4]JI Zhijian,LIN Hai,YU Haisheng.Leaders in multi-agent [13]DEGROOT M H.Reaching a Consensus[J].Journal of the controllability under consensus algorithm and tree topology American statistical association,1974,69 (345):118- [J].Systems control letters,2012,61(9):918-925. 121. [5]JI Zhijian,WANG Zidong,LIN Hai,et al.Interconnection [14]CHATTERJEE S,SENETA E.Towards consensus:some topologies for multi-agent coordination under leader-follower convergence theorems on repeated averaging[].Journal of framework[J].Automatica,2009,45(12):2857-2863. applied probability,1977,14(1):89-97. [6]晁永翠,纪志坚,王耀威,等.复杂网络在路形拓扑结 [15]VICSEK T,CZIR6K A,BEN-JACOB E,et al.Novel type 构下可控的充要条件[J].智能系统学报,2015,10(4): of phase transition in a system of self-driven particles[J]. 577-582. Physical review letters,1995,75(6):1226-1229 CHAO Yongcui,JI Zhijian,WANG Yaowei,et al.Necessa- [16]OLFATI-SABER R,MURRAY R M.Consensus problems ry and sufficient conditions for the controllability of complex in networks of agents with switching topology and time-de- networks with path topology[].CAAI transactions on intel- lays[J].IEEE transactions on automatic control,2004,49 1 igent systems,2015,10(4):577-582. (9):1520-1533. [7]董洁,纪志坚,王晓晓.多智能体网络系统的能控性代 [17]REN Wei,BEARD R W,MCLAIN T W.Coordination 数条件[J].智能系统学报,2015,10(5):747-754. variables and consensus building in multiple vehicle sys- DONG Jie,JI Zhijian,WANG Xiaoxiao.Algebraic conditions tems[M]//KUMAR V,LEONARD N,MORSE A S.Co- for the controllability of multi-agent systems[J].CAAI trans- operative Control.Berlin Heidelberg:Springer,2005:171 actions on intelligent systems,2015,10(5):747-754. -188. [8]王晓晓,纪志坚.广播信号下非一致多智能体系统的能 [18]FIEDLER M.Algebraic connectivity of graphs[J].Czecho- 控性[J].智能系统学报,2014,9(4):401-406. slovak mathematical journal,1973,23(2):298-305. WANG Xiaoxiao,JI Zhijian.Controllability of non-identical [19]ZAMANI M,LIN Hai.Structural controllability of multi-a- multi-agent systems under a broadcasting control signal[]. gent systems[C]//Proceedings of 2009 American Control CAAI transactions on intelligent systems,2014,9(4):401- Conference.St.Louis.USA,2009:5743-5748. 406. [20]LIN C T.Structural controllability [J].IEEE transactions [9]SABATTINI L,SECCHI C,FANTUZZI C.Controllability on automatic control,1974,19(3):201-208. and observability preservation for networked systems with [21]EGERSTEDT M,MARTINI S,CAO Ming,et al.Interac- time varying topologies[C]//Proceedings of the 19th World ting with networks:how does structure relate to controlla- Congress on the International Federation of Automatic Con- bility in single-leader,consensus networks[J].IEEE con- trol.Cape Town,South Africa,2004:1837-1842. trol systems,2012,32(4):66-73. [10]SABATTINI L,CHOPRA N,SECCHI C.On decentralized 作者简介: connectivity maintenance for mobile robotic systems[C]// 王康,男,1992年生,硕士研究 Proceedings of the 2011 50th IEEE Conference on Decision 生,主要研究方向为多智能体系统的 and Control and European Control Conference.Orlando, 能控性。 USA.2011:988-993. [11]SABATTINI L,CHOPRA N,SECCHI C.Distributed con- trol of multi-robot systems with global connectivity mainte- 纪志坚,男,1973年生,教授,博士生 nance[C]//Proceedings of 2011 IEEE/RSJ International 导师,博士,主要研究方向为群体系统动 Conference on Intelligent Robots and Systems.San Francis- 力学与协调控制、复杂网络、切换动力系 c0,CA,2011:2321-2326. 统的分析与控制、系统生物以及基于网 [12]SABATTINI L,SECCHI C.COCETTI M,et al.Imple- 络的控制系统。主持国家自然科学基金 mentation of coordinated complex dynamic behaviors in multirobot systems[J].IEEE transactions on robotics, 项目3项先后参与多项国家自然科学基 2015,31(4):1018-1032. 金及“973”和“863”项目的研究。发表学术论文70余篇,其 中被SCI检索23篇,EI检索50余篇
项目 3 项先后参与多项国家自然科学基 [4]JI Zhijian, LIN Hai, YU Haisheng. Leaders in multi⁃agent controllability under consensus algorithm and tree topology [J]. Systems & control letters, 2012, 61(9): 918-925. [5]JI Zhijian, WANG Zidong, LIN Hai, et al. Interconnection topologies for multi⁃agent coordination under leader⁃follower framework[J]. Automatica, 2009, 45(12): 2857-2863. [6]晁永翠, 纪志坚, 王耀威, 等. 复杂网络在路形拓扑结 构下可控的充要条件[J]. 智能系统学报, 2015, 10(4): 577-582. CHAO Yongcui, JI Zhijian, WANG Yaowei, et al. Necessa⁃ ry and sufficient conditions for the controllability of complex networks with path topology[J]. CAAI transactions on intel⁃ ligent systems, 2015, 10(4): 577-582. [7]董洁, 纪志坚, 王晓晓. 多智能体网络系统的能控性代 数条件[J]. 智能系统学报, 2015, 10(5): 747-754. DONG Jie, JI Zhijian, WANG Xiaoxiao. Algebraic conditions for the controllability of multi⁃agent systems[J]. CAAI trans⁃ actions on intelligent systems, 2015, 10(5): 747-754. [8]王晓晓, 纪志坚. 广播信号下非一致多智能体系统的能 控性[J]. 智能系统学报, 2014, 9(4): 401-406. WANG Xiaoxiao, JI Zhijian. Controllability of non⁃identical multi⁃agent systems under a broadcasting control signal [ J]. CAAI transactions on intelligent systems, 2014, 9(4): 401- 406. [9] SABATTINI L, SECCHI C, FANTUZZI C. Controllability and observability preservation for networked systems with time varying topologies[C] / / Proceedings of the 19th World Congress on the International Federation of Automatic Con⁃ trol. Cape Town, South Africa, 2004: 1837-1842. [10]SABATTINI L, CHOPRA N, SECCHI C. On decentralized connectivity maintenance for mobile robotic systems[C] / / Proceedings of the 2011 50th IEEE Conference on Decision and Control and European Control Conference. Orlando, USA, 2011: 988-993. [11]SABATTINI L, CHOPRA N, SECCHI C. Distributed con⁃ trol of multi⁃robot systems with global connectivity mainte⁃ nance[ C] / / Proceedings of 2011 IEEE/ RSJ International Conference on Intelligent Robots and Systems. San Francis⁃ co, CA, 2011: 2321-2326. [ 12] SABATTINI L, SECCHI C, COCETTI M, et al. Imple⁃ mentation of coordinated complex dynamic behaviors in 2015, 31(4): 1018-1032. [13]DEGROOT M H. Reaching a Consensus[J]. Journal of the American statistical association, 1974, 69 ( 345): 118 - 121. [14] CHATTERJEE S, SENETA E. Towards consensus: some convergence theorems on repeated averaging[J]. Journal of applied probability, 1977, 14(1): 89-97. [15]VICSEK T, CZIRóK A, BEN⁃JACOB E, et al. Novel type of phase transition in a system of self⁃driven particles[ J]. Physical review letters, 1995, 75(6): 1226-1229. [16]OLFATI⁃SABER R, MURRAY R M. Consensus problems in networks of agents with switching topology and time⁃de⁃ lays[J]. IEEE transactions on automatic control, 2004, 49 (9): 1520-1533. [17] REN Wei, BEARD R W, MCLAIN T W. Coordination variables and consensus building in multiple vehicle sys⁃ tems[M] / / KUMAR V, LEONARD N, MORSE A S. Co⁃ operative Control. Berlin Heidelberg: Springer, 2005: 171 -188. [18]FIEDLER M. Algebraic connectivity of graphs[J]. Czecho⁃ slovak mathematical journal, 1973, 23(2): 298-305. [19]ZAMANI M, LIN Hai. Structural controllability of multi⁃a⁃ gent systems[C] / / Proceedings of 2009 American Control Conference. St. Louis, USA, 2009: 5743-5748. [20] LIN C T. Structural controllability[ J]. IEEE transactions on automatic control, 1974, 19(3): 201-208. [21]EGERSTEDT M, MARTINI S, CAO Ming, et al. Interac⁃ ting with networks: how does structure relate to controlla⁃ bility in single⁃leader, consensus networks[J]. IEEE con⁃ trol systems, 2012, 32(4): 66-73. 作者简介: 王康, 男, 1992 年 生, 硕 士 研 究 生,主要研究方向为多智能体系统的 能控性。 纪志坚,男,1973 年生,教授,博士生 导师,博士,主要研究方向为群体系统动 力学与协调控制、复杂网络、切换动力系 统的分析与控制、系统生物以及基于网 multirobot systems [ J ]. IEEE transactions on robotics 络的控制系统。 主持国家自然科学基金 , 220· 金及“973”和“863”项目的研究。 发表学术论文 70 余篇,其 中被 SCI 检索 23 篇,EI 检索 50 余篇。 · 智 能 系 统 学 报 第 12 卷