第12卷第2期 智能系统学报 Vol.12 No.2 2017年4月 CAAI Transactions on Intelligent Systems Apr.2017 D0I:10.11992/6is.201605013 网络出版地址:http://www.cmki.net/kcms/detail,/23.1538.tp.20170111.1705.020.html 联合连通拓扑下的二阶多自主体系统 有限时间包容控制 庄昊,杨洪勇 (鲁东大学信息与电气工程学院,山东烟台264025) 摘要:针对具有多领航者的二阶网络化系统群集运动问题,提出了一种有限时间收敛的包容控制算法。在此基础 上,运用现代控制理论、代数图论和矩阵论等分析工具对所提出的控制算法进行理论分析,得到了当通信拓扑为动 态联合连通时,二阶网络化系统在有限时间内实现群集运动的收敛条件。通过此包容控制算法,使得系统在静态拓 扑和联合连通条件下均在有限时间内收敛到目标区域内。最后,应用系统仿真验证了所得结论的正确性。 关键词:多领航者:群集运动:有限时间:联合连通:包容控制 中图分类号:TP391文献标志码:A文章编号:1673-4785(2017)02-0188-08 中文引用格式:庄吴,杨洪勇.联合连通拓扑下的二阶多自主体系统有限时间包容控制[J].智能系统学报,2017,12(2):188-195. 英文引用格式:ZHUANG Hao,YANG Hongyong.Finite-time containment control of second-order multi-agent systems with jointly connected topologies[].CAAI transactions on intelligent systems,2017,12(2):188-195. Finite-time containment control of second-order multi-agent systems with jointly connected topologies ZHUANG Hao,YANG Hongyong School of Information and Electrical Engineering,Ludong University,Yantai 264025,China) Abstract:In this paper,we propose a containment control algorithm with finite-time convergence for a second-order networked system flocking with multiple leaders.By applying modern control theory,matrix theory,and algebraic graph theory,we theoretically analyzed our proposed control algorithm;by doing so,we identified the convergence conditions required for a second-order networked system to realize flocking within finite time when the communica- tion topology applies a dynamic joint connection.Through our containment control algorithm,the networked systems converge to object regions in finite time given the circumstances of static and jointly connected topologies.Finally, we verified the effectiveness of our proposed system via simulation examples. Keywords:multiple leaders;flocking;finite time;jointly-connected;containment control 多智能体系统协调控制是近几年迅速发展起来的 信息交流达到各个智能体特定状态的一致。包容控 复杂系统控制科学研究领域的热点问题,它在无线传 制是一种具有多领航者的类一致性问题,通过设计跟 感器网络、移动机器人编队控制、集群航天器深空探测 随者的控制协议使得跟随者最终收敛到领航者组成 等领域有广泛的应用,受到许多研究学者的关注。 的目标区域内(领航者围成的凸包)完成群体运 致性问题是分布式协同控制的一个重要研究 动4)。文献[4]研究了一阶系统的包容控制问题, 方向-),多智能体系统通过系统中各智能体之间的 并证明了当网络拓扑连通时系统可以实现包容控制, 但并未讨论网络拓扑在联合联通条件下的包容控制 收稿日期:2016-05-16.网络出版日期:2017-01-11. 问题。文献[5]研究了有向网络中固定拓扑和切换拓 基金项目:国家自然科学基金项目(61273152):国家自然科学基金项目 (61673200) 扑两种情况下一阶系统的包容控制问题,并给出了系 通信作者:杨洪勇.E-mail:yang@ycah.net 统收敛的充要条件,但未对二阶系统进行说明。文献
第 12 卷第 2 期 智 能 系 统 学 报 Vol.12 №.2 2017 年 4 月 CAAI Transactions on Intelligent Systems Apr. 2017 DOI:10.11992 / tis.201605013 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.tp.20170111.1705.020.html 联合连通拓扑下的二阶多自主体系统 有限时间包容控制 庄昊,杨洪勇 (鲁东大学 信息与电气工程学院,山东 烟台 264025) 摘 要:针对具有多领航者的二阶网络化系统群集运动问题,提出了一种有限时间收敛的包容控制算法。 在此基础 上,运用现代控制理论、代数图论和矩阵论等分析工具对所提出的控制算法进行理论分析,得到了当通信拓扑为动 态联合连通时,二阶网络化系统在有限时间内实现群集运动的收敛条件。 通过此包容控制算法,使得系统在静态拓 扑和联合连通条件下均在有限时间内收敛到目标区域内。 最后,应用系统仿真验证了所得结论的正确性。 关键词:多领航者;群集运动;有限时间;联合连通;包容控制 中图分类号: TP391 文献标志码:A 文章编号:1673-4785(2017)02-0188-08 中文引用格式:庄昊,杨洪勇. 联合连通拓扑下的二阶多自主体系统有限时间包容控制[J]. 智能系统学报, 2017, 12(2): 188-195. 英文引用格式:ZHUANG Hao,YANG Hongyong. Finite⁃time containment control of second⁃order multi⁃agent systems with jointly connected topologies[J]. CAAI transactions on intelligent systems, 2017, 12(2): 188-195. Finite⁃time containment control of second⁃order multi⁃agent systems with jointly connected topologies ZHUANG Hao, YANG Hongyong (School of Information and Electrical Engineering, Ludong University, Yantai 264025, China) Abstract:In this paper, we propose a containment control algorithm with finite⁃time convergence for a second⁃order networked system flocking with multiple leaders. By applying modern control theory, matrix theory, and algebraic graph theory, we theoretically analyzed our proposed control algorithm; by doing so, we identified the convergence conditions required for a second⁃order networked system to realize flocking within finite time when the communica⁃ tion topology applies a dynamic joint connection. Through our containment control algorithm, the networked systems converge to object regions in finite time given the circumstances of static and jointly connected topologies. Finally, we verified the effectiveness of our proposed system via simulation examples. Keywords: multiple leaders; flocking; finite time; jointly⁃connected; containment control 收稿日期:2016-05-16. 网络出版日期:2017-01-11. 基金项目:国家自然科学基金项目(61273152);国家自然科学基金项目 (61673200). 通信作者:杨洪勇. E⁃mail: hyyang@ yeah.net. 多智能体系统协调控制是近几年迅速发展起来的 复杂系统控制科学研究领域的热点问题,它在无线传 感器网络、移动机器人编队控制、集群航天器深空探测 等领域有广泛的应用,受到许多研究学者的关注。 一致性问题是分布式协同控制的一个重要研究 方向[1-3] ,多智能体系统通过系统中各智能体之间的 信息交流达到各个智能体特定状态的一致。 包容控 制是一种具有多领航者的类一致性问题,通过设计跟 随者的控制协议使得跟随者最终收敛到领航者组成 的目标区域内(领航者围成的凸包) 完成群体运 动[4-9] 。 文献[4]研究了一阶系统的包容控制问题, 并证明了当网络拓扑连通时系统可以实现包容控制, 但并未讨论网络拓扑在联合联通条件下的包容控制 问题。 文献[5]研究了有向网络中固定拓扑和切换拓 扑两种情况下一阶系统的包容控制问题,并给出了系 统收敛的充要条件,但未对二阶系统进行说明。 文献
第2期 庄吴,等:联合连通拓扑下的二阶多自主体系统有限时间包容控制 ·189. [6]对动态领航者的二阶系统进行研究,分别提出了 f(x),x(0)=x。∈R”。其中连续向量流f(x)= 连续渐近包容控制算法和离散渐近包容控制算法。 [f(x)(x)…f(x)]T与带有扩张r=(m, 文献[7]研究了随机切换拓扑下二阶系统的包容控制 2,…,「n),:>0的度k∈R是齐次的,如果对于任 问题,提出一种基于不可约马尔可夫链信息拓扑的包 意的E>0,x∈R”都有f(E”x1,E2x2,…,Exn)= 容控制算法。文献[8]研究了二阶系统的分布式包容 e+"f(x),i=1,2,…,n。 控制问题,并给出了系统收敛的充分必要条件。从以 上文献研究可知,虽然均能实现系统的包容控制要 引理1)设系统x=f(x),x(0)=x。∈ 求,但是实现时间是不确定的。 R”与带有扩张(r1,r2,…,Tn)的度k∈R是齐次 在工业应用中,仅实现各个智能体特定状态的 的,函数f(x)是连续的,且x=0是它的一个渐 渐近一致还不足以满足工业生产需要,还需要系统 近稳定平衡点,如果齐次度k0,否则,a=0。节点i的 的奇函数满足x:P(x:)>0(Hx:≠0)。假设 邻居集合定义为N,={行∈VI(i,j)∈E}。定义 sgn(x)"[sgn (x)a sgn (x2)a..sgn D=diag(d,d2,…,dn)∈R*a为图x,(t)的度矩 (xn)],sgn(x:)“=|x:sign(x),sigm(·)表示符 库,其中4=公i=12,…。权重图G的 号函数。并且&1,a2为常值,0<1<1,a2= Laplacian矩阵定义为:L=D-A∈Rmxm 21 定义11设集合X={x1,x2,…,xn}为实向 a,+1o 量空间VCR的子集,X的凸包定义为:CO(X)= 设跟随者之间通信拓扑图为G。,由于跟随者 x1x.sx.o.wo. 之间是双向交流信息,所以G为无向图。具有领航 者的多自主体系统的通信拓扑图为G,系统的 定义21s)设拓扑图G,G2,…,Gn具有相同的 Laplacian矩阵如下: 顶点集V,其并集记为G,-m,它的节点集是V,边集 是所有图G,G2,…,Gm的边的并集,它的第i个节点 L= (3) 0m×m 和第j个节点间的链接权重是图第i个节点和第j个 式中:Le为n阶方阵,是跟随者的Laplacian矩阵; 节点间所有的链接权重之和。如果它们的联合图 L为n×m阶矩阵。 G1-m是连通的,称G1,G2,…,Gm为联合连通。 假设1对任意一个跟随者i,至少存在一个领 定义3)考虑如下连续非线性系统:x= 航者j,使得从j到i存在一条通信路径
[6]对动态领航者的二阶系统进行研究,分别提出了 连续渐近包容控制算法和离散渐近包容控制算法。 文献[7]研究了随机切换拓扑下二阶系统的包容控制 问题,提出一种基于不可约马尔可夫链信息拓扑的包 容控制算法。 文献[8]研究了二阶系统的分布式包容 控制问题,并给出了系统收敛的充分必要条件。 从以 上文献研究可知,虽然均能实现系统的包容控制要 求,但是实现时间是不确定的。 在工业应用中,仅实现各个智能体特定状态的 渐近一致还不足以满足工业生产需要,还需要系统 在有限时间内达到收敛。 在航天器编队控制和机器 人编队对抗中,有限时间定理得到广泛应用,由于连 续有限时间控制的优点明显,有限时间控制问题受 到越来越多的关注。 文献[10] 对有限时间控制问 题进行了综述,介绍了有限时间稳定性的常用判据 和几类典型系统的有限时间控制。 文献[9]研究了 有限时间收敛和参数不确定性有向系统的姿态包容 控制问题。 文献[11-14]指出,连续有限时间控制 系统的验证方法主要包括:齐次性方法和有限时间 李雅普诺夫稳定性定理。 本文研究了静态拓扑和动态拓扑下的二阶多智 能体系统能在有限时间内实现包容控制的问题,本文 的创新点在于提出了动态联合连通条件下具有多领 航者的有限时间的包容控制算法,应用现代控制理论 及矩阵论等理论工具研究了算法的有限时间收敛,在 静态拓扑和动态拓扑下均能达到有限时间收敛。 1 代数图论 设 G = (V,E,A) 是 n 个节点的权重无向图, V ={1,2,…,n} 为一个顶点(或节点) 集合, E ⊆ V ×V 为一个边的集合, A = [aij] ∈ R n×n 为权重邻 接矩阵。 对于 ∀i∈V , aii = 0;对于 ∀i,j∈V , i≠ j ,若 (i,j) ∈ ω ,则 aij > 0,否则, aij = 0。 节点 i 的 邻居集合定义为 Ni = {j ∈ V | (i,j) ∈ E} 。 定义 D =diag(d1 ,d2 ,…,dn ) ∈ R n×n 为图 xL(t) 的度矩 阵,其中 di = ∑ j∈Ni aij , i = 1,2,…,n 。 权重图 G 的 Laplacian 矩阵定义为: L = D - A ∈ R n×n 。 定义 1 [5] 设集合 X = {x1 ,x2 ,…,xm } 为实向 量空间 V ⊆ R p 的子集, X 的凸包定义为: CO(X) = {∑ m i = 1 αi xi | xi ∈ X,αi ≥ 0,∑ m i = 1 αi = 1} 。 定义 2 [15] 设拓扑图 G1 ,G2 ,…,Gm 具有相同的 顶点集 V ,其并集记为 G1-m ,它的节点集是 V ,边集 是所有图 G1 ,G2 ,…,Gm 的边的并集,它的第 i 个节点 和第 j 个节点间的链接权重是图第 i 个节点和第 j 个 节点间所有的链接权重之和。 如果它们的联合图 G1-m 是连通的,称 G1 ,G2 ,…,Gm 为联合连通。 定义 3 [13] 考虑如下连续非线性系统: x · = f(x) , x(0) = x0 ∈ R n 。 其中连续向量流 f(x) = [f 1(x) f 2(x) … f n(x)] T 与带有扩张 r = (r1 , r2 ,…,rn ) , ri > 0 的度 k ∈ R 是齐次的,如果对于任 意的 ε > 0, x ∈ R n 都有 f i(ε r1 x1 ,ε r2 x2 ,…,ε rn xn ) = ε k+r i f i(x) , i = 1,2,…,n 。 引理 1 [14] 设系统 x · = f( x) , x( 0) = x0 ∈ R n 与带有扩张 ( r1 ,r2 ,…,rn ) 的度 k ∈ R 是齐次 的,函数 f( x) 是连续的,且 x = 0 是它的一个渐 近稳定平衡点,如果齐次度 k < 0,则该系统就是 有限时间收敛的。 2 二阶多自主体系统的包容控制 假设二阶多自主体系统由 n 个跟随者和 m 个 领航者组成,其动力学模型描述为 x · i(t) = vi(t), v ·{ i(t) = ui(t), i = 1,2,…,n,n + 1,…,n + m ( 1 ) 式中: xi(t) ∈ R 表示第 i 个智能体在 t 时刻的位置, vi(t) ∈ R 表示速度, ui(t) ∈ R 表示控制输入。 跟 随者集合与领航者集合分别记为 F = {1,2,…,n} 和 L = {n + 1,n + 2,…,n + m} ,本文考虑静态领航 者的情况,即 vi(t) = 0, i ∈ L 。 本文的研究目标是设计一种控制器,使得系统 能在有限时间内实现包容控制。 考虑如下控制器: ui(t) = sgn{φ1 [∑ j∈Ni aij(xj(t) - xi(t))]} α1 + sgn{φ2 [∑ j∈Ni aij(vj(t) - vi(t))]} α2 ,i ∈ F( 2 ) 式中: aij(t) 表示智能体 i 与 j 在 t 时刻的连接权值, Ni 表 示 智 能 体 i 的 邻 域, 假 设 φl(x) = [φl(x1 ) φl(x2 ) … φl(xn )] ,且 φl 是一个连续 的奇 函 数 满 足 xiφl(xi) > 0(∀xi ≠ 0) 。 假 设 sgn (x) α = [sgn (x1 ) α sgn (x2 ) α … sgn (xn ) α ], sgn (xi) α = xi α sign(xi) , sign(·) 表示符 号函数。 并且 α1 , α2 为常值, 0 < α1 < 1, α2 = 2α1 α1 + 1 。 设跟随者之间通信拓扑图为 GF ,由于跟随者 之间是双向交流信息,所以 GF 为无向图。 具有领航 者的多自主体系统的通信拓扑图为 G , 系统的 Laplacian 矩阵如下: L = LF LFL 0m×n 0m×m é ë ê ê ù û ú ú ( 3 ) 式中: LF 为 n 阶方阵,是跟随者的 Laplacian 矩阵; LFL 为 n × m 阶矩阵。 假设 1 对任意一个跟随者 i ,至少存在一个领 航者 j ,使得从 j 到 i 存在一条通信路径。 第 2 期 庄昊,等: 联合连通拓扑下的二阶多自主体系统有限时间包容控制 ·189·
·190· 智能系统学报 第12卷 引理2[]若假设1成立且跟随者之间构成无 (∑ay[)-,()])] 向连通图,则Lp为正定阵,-LL为非负矩阵且 jeNt 每行元素和为1。 afw)-0] ( 令领航者的位置集合为x(t)= [xa+(t)…xntm(t)]T,领航者的速度集合为 T={1,2,…,N},由定义1和引理2,t位于领航者 A,0-] 围成的凸包内。下面给出包容控制的定义。 定理1令跟随者的位置集合为x(t)= ,(∑a[x()-x(t)]) [x(t)…x(t)],跟随者的速度集合为 r(t)=[,(t)…v(t)]T,控制器满足李雅普诺 sgn (Aa,0-1) 夫第二定理,并且若在控制器的作用下有x(t)一→ -LLx(t),(t)→0,表示跟随者位于领航者 围成的凸包内,则控制器可以实现包容控制。 p(∑a[x(t)-x.(t)]) 证明由系统动力学模型和控制器得: ve(t)=sgn([-Lx(t)-LELXL(t)]a+ 「a0-]》' sgn(2[-Lgv(t)-LFLVL(t)]a2 (4) (Aa0-o] 令跟踪方程: (x(t)=x(1)+LF LELX(t) (5) v(t)=v(t)+LF'LELVL(t) g,④-] 根据跟踪方程得: 「p(∑alx()-x(t)]) ve(t)=sgn(i[-Lxe(t)])a+ sgn(2[-Lv(t)]a2 (6) p(∑a[x()-x,()]) sgn jeNz 令 y=-Lx(t) (∑a[x()-x.()]) w=-Lpvp(t) (7) 所以方程(6)可表示为 wsgn [(y)]m 'r(t)=sgm[f(y)]a1+sgn[5(w)]a2,且y=0 得到: (8) V(t)=V(t)+V2(t)= 构造李雅普诺夫函数V(t)=V,(t)+V(t), -w'sgn [o2(w)]42= 式中: (w)sign[(w)] 0=200 -[w1 02…0n] |p2(w2)|2sign[p2(02)] V(t)= ( 2()sign[z(w) 式中:(0)=40-0 sg[p,(s)]ds。考 -(01lp2(01)2+…+|wn川p2(wn)2)≤0 注意到V(t)=0,当且仅当0=0,由 虑李雅普诺夫函数n。,沿着式(6)的导数: xP(x:)>0(Hx:≠0)和式(8),得到y=0,由 V (t)=v(t)Lgv(t)= 引理2和式(7)得"(t)=0、x(t)=0,所以有 -w'sgn [(y)]"-w"sgn [:(w)] 且只有在平衡点时才有V(t)=0,根据李雅普诺 V()=(∑a,[()-()])× 夫第二定理,此多智能体系统在平衡点是渐近稳 jcN 定的。进一步根据式(5)得到v(t)→-L sgn(a[x(t)-x(]))"V(t)= L(t)、xr(t)→-LFLx(t),再由定理1 含600=豆6w 得出此多智能体系统能够实现包容控制。 由定义3和引理1推出,设扩张系数
引理 2 [9] 若假设 1 成立且跟随者之间构成无 向连通图,则 LF 为正定阵, - L -1 F LFL 为非负矩阵且 每行元素和为 1。 令 领 航 者 的 位 置 集 合 为 xL(t) = [xn+1(t) … xn+m(t)] T ,领 航 者 的 速 度 集 合 为 Γ ={1,2,…,N} ,由定义 1 和引理 2, t 位于领航者 围成的凸包内。 下面给出包容控制的定义。 定理 1 令 跟 随 者 的 位 置 集 合 为 xF(t) = [x1(t) … xn(t)] T , 跟 随 者 的 速 度 集 合 为 vF(t) = [v1(t) … vn(t)] T ,控制器满足李雅普诺 夫第二定理,并且若在控制器的作用下有 xF(t) → - L -1 F LFL xL(t) , vF(t) → 0,表示跟随者位于领航者 围成的凸包内,则控制器可以实现包容控制。 证明 由系统动力学模型和控制器得: v · F(t) = sgn( φ 1 [ - LF xF(t) - LFL xL(t)]) α1 + sgn( φ 2 [ - LF vF(t) - LFL vL(t)]) α2 ( 4 ) 令跟踪方程: x - F(t) = xF(t) + L -1 F LFL xL(t) v - F(t) = vF(t) + L -1 F LFL vL(t) { ( 5 ) 根据跟踪方程得: v · F(t) = sgn( φ 1 [ - LF x - F(t)]) α1 + sgn( φ 2 [ - LF v - F(t)]) α2 ( 6 ) 令 y = - LF x - F(t) w = - LF v - F(t) ( 7 ) 所以方程(6)可表示为 v · F(t) = sgn[ φ 1 (y)] α1 + sgn[ φ 2 (w)] α2 ,且 y · = w ( 8 ) 构造李雅普诺夫函数 V(t) = V1(t) + V2(t) , 式中: V1(t) = 1 2 v - T F(t) LF v - F(t) V2(t) = ∑ n i = 1 V2i(t) 式中: V2i(t) = ∫ ( ∑ j∈Ni aij [xj (t) -xi (t)]) T 0 sgn [φ1(s)] α1 ds 。 考 虑李雅普诺夫函数 nσ ,沿着式(6)的导数: V · 1(t) = v - T F(t) LF v - · F(t) = - w T sgn [φ1(y)] α1 - w T sgn [φ2(w)] α2 V · 2i(t) = (∑ j∈Ni aij[vj(t) - vi(t)]) T × sgn(φ1(∑ j∈Ni aij[xj(t) - xi(t)])) α1V · 2(t) = ∑ n i = 1 V · 2i(t)V · 2(t) = ∑ n i = 1 V · 2i(t) = (∑ j∈N1 a1j[vj(t) - v1(t)]) T (∑ j∈N2 a2j[vj(t) - v2(t)]) T ︙ (∑ j∈Nn anj[vj(t) - vn(t)]) T é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú α1 × sgn φ1(∑ j∈N1 a1j[xj(t) - x1(t)]) φ1(∑ j∈N2 a2j[xj(t) - x2(t)]) ︙ φ1(∑ j∈Nn anj[xj(t) - xn(t)]) é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú α1 = (∑ j∈N1 a1j[vj(t) - v1(t)]) T (∑ j∈N2 a2j[vj(t) - v2(t)]) T ︙ (∑ j∈Nn anj[vj(t) - vn(t)]) T é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú α1 × sgn φ1(∑ j∈N1 a1j[xj(t) - x1(t)]) φ1(∑ j∈N2 a2j[xj(t) - x2(t)]) ︙ φ1(∑ j∈Nn anj[xj(t) - xn(t)]) é ë ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú α1 = w T sgn [φ1(y)] α1 得到: V · (t) = V · 1(t) + V · 2(t) = - w T sgn [φ2(w)] α2 = - [w1 w2 … wn ] φ2(w1 ) α2 sign[φ2(w1 )] φ2(w2 ) α2 sign[φ2(w2 )] ︙ φ2(wn ) α2 sign[φ2(wn )] é ë ê ê ê ê êê ù û ú ú ú ú úú = - ( w1 φ2(w1 ) φ2 + … + wn φ2(wn ) φ2 ) ≤ 0 注 意 到 V · ( t) = 0, 当 且 仅 当 w = 0, 由 xiφl( xi) > 0(∀xi ≠ 0) 和式( 8) ,得到 y = 0,由 引理 2 和式( 7)得 v - F( t) = 0、 x - F( t) = 0,所以有 且只有在平衡点时才有 V · ( t) = 0,根据李雅普诺 夫第二定理,此多智能体系统在平衡点是渐近稳 定的。 进 一 步 根 据 式 ( 5 ) 得 到 vF( t) → - L - 1 F LFL vL( t) 、 xF( t) → - L - 1 F LFL xL( t) , 再由定理 1 得出此多智能体系统能够实现包容控制。 由定 义 3 和 引 理 1 推 出, 设 扩 张 系 数 ·190· 智 能 系 统 学 报 第 12 卷
第2期 庄吴,等:联合连通拓扑下的二阶多自主体系统有限时间包容控制 ·191. (2,2,…,2,a1+1,a1+1,…a1+1),并且11=2, 领航者d。个,跟随者d。个,满足d。=d。+d.。 矩阵块L。为拓扑图G相对应的Laplacian矩阵。 r2=a1+1,k=a1-10。 在每个时间段[,w,41)内此多智能体系统可 假设每个时间段[(,‘+1)中存在一组非重叠的有限 以被分成n。个子系统,在每个时间段内的 子序列[4*1),广=1,2,…,m,,且系统拓扑在 Laplacian矩阵为 [l,l41)内保持不变,其中1=4,,tm,+1=t+1, Lirue rw*1-tw≥T,T2>0。令o(t):[0,+o)→T, 。= (16) 0doxd0oxdo」 T={1,2,…,N}为一个分段切换常函数,N为总拓 扑数。系统在t时刻的信息拓扑图记为Go,相应 由系统动力学模型和控制器得,在时间段[, 的Laplacian矩阵记为Lw。其中,由n个跟随者 wt1)内: 构成的信息拓扑图记为Gr.o,相应的Laplacian矩 (t)=sgn(p[-LFex(t)-Loxi(t)])▣+ 阵记为Lpa(0o sgn(2[-Lre vro(t)-Lr vin(t)] 假设2由n个跟随者和m个领航者构成的网 (17) 络化系统拓扑在非重叠时间区间[t,t,+1),T=1, 令跟踪方程: 2,…内为联合连通的。 ((t)=x(t)+(Lr)Lxi(t) 假设3非重叠时间区间[tw,t+1)C[t, t+1),j=1,2,…,m,内,网络化系统存在一连通子 vre(t)=vre(t)+(LFe)LgLovin(t) 集。连通子集中任意一个跟随者i,至少与一个领 (18) 航者j之间存在一条路径。 根据跟踪方程得出: 假设系统通信拓扑图G。在时间段[t,t,+1)内 vio(t)=sgn([-Lee xro(t)])" 有。≥1个连通部分,且连通成分的子拓扑图记为 sgn(2[-Lre vre(t)])2 (19) G。,i=1,2,…,n。。图G内有d≥1个节点,其中 根据假设3、引理2、定理1得出,此二阶多智能
(2þ ,2ï ,ý…ï ,ü2 n ,α1 + 1,α1 + 1,…α1 + 1 þ ï ï ï ï ý ï ï ï ï ü n ) ,并且 r1 = 2, r2 = α1 + 1, k = α1 - 1 < 0。 假设原动力学方程可写为 f 1(xi,vi) = vi f 2(xi,vi) = ui { ( 9 ) 则有 f 1(ε r1 xi,ε r2 vi) = ε r2 vi = ε k+r1 f 1(xi,vi) f 2(ε r1 xi,ε r2 vi) = sgn( φ 1 [∑ j∈Ni aij(ε r1 xj - ε r1 xi)]) α1 + sgn( φ 2 [∑ j∈Ni aij(ε r2 vj - ε r2 vi)]) α2 = ε r1α1 sgn( φ 1 [∑ j∈Ni aij(xj - xi)]) α1 + ε r2α2 sgn( φ 2 [∑ j∈Ni aij(vj - vi)]) α2 由已知得: ε r1α1 = ε r2α2 = ε k+r2 ,所以上式可写为 f 2(ε r1 xi,ε r2 vi) = ε k+r2 f 2(xi,vi) 此 多 智 能 体 系 统 与 带 有 扩 张 ( 2þ ,2ï ,ý…ï ,ü2 n , α1 + 1,α1 + 1,…α1 + 1 þ ï ï ï ï ý ï ï ï ï ü n ) 的度 k = α1 - 1 < 0 是同 次的。 因此,由引理 1 得到此系统可以达到有限时 间收敛。 3 联合连通下的控制算法分析 本节讨论多自主体系统在运动过程,出现通信 拓扑不连通的情况。 系统动力学模型和控制器不 变,动力学模型为式 (1) ,控制器为式 (2) 。 在联 合连通条件下分析此系统。 考虑一组无穷有序的有界连续时间段 [t r, t r+1 ) , r = 1,2,… ,且 t 1 = 0, t r+1 - t r ≤ T1 , T1 > 0。 假设每个时间段 [t r,t r+1 ) 中存在一组非重叠的有限 子序列 [t r,j,t r,j+1 ) , j = 1,2,…,mr ,且系统拓扑在 [t r,j,t r,j+1 ) 内保持不变,其中 t r,1 = t r , t r,mr +1 = t r+1 , t r,j+1 - t r,j ≥ T2 , T2 > 0。 令 σ(t):[0, + ¥) → Γ , Γ = {1,2,…,N} 为一个分段切换常函数, N 为总拓 扑数。 系统在 t 时刻的信息拓扑图记为 Gσ(t) ,相应 的 Laplacian 矩阵记为 Lσ(t) 。 其中,由 n 个跟随者 构成的信息拓扑图记为 GFσ(t) ,相应的 Laplacian 矩 阵记为 LFσ(t) 。 假设 2 由 n 个跟随者和 m 个领航者构成的网 络化系统拓扑在非重叠时间区间 [t r,t r+1 ) , r = 1, 2,… 内为联合连通的。 假设 3 非重叠时间区间 [t r,j,t r,j+1 ) ⊂ [t r, t r+1 ) , j = 1,2,…,mr 内,网络化系统存在一连通子 集。 连通子集中任意一个跟随者 i ,至少与一个领 航者 j 之间存在一条路径。 假设系统通信拓扑图 Gσ 在时间段 [t r,j,t r,j+1 ) 内 有 nσ ≥ 1 个连通部分,且连通成分的子拓扑图记为 G i σ , i = 1,2,…,nσ 。 图 G i σ 内有 d i σ ≥1 个节点,其中 领航者 d i Lσ 个,跟随者 d i Fσ 个,满足 d i σ = d i Lσ + d i Fσ 。 矩阵块 L i σ 为拓扑图 G i σ 相对应的 Laplacian 矩阵。 根据Lσ 的定义,存在一个正交矩阵Eσ ∈R n×n ,使: E T σ Lσ Eσ = diag(L 1 σ ,L 2 σ ,…,L nσ σ ) ( 10 ) x T (t) Eσ = [x 1T σ (t) x 2T σ (t) … x nσT σ (t)] ( 11 ) v T (t) Eσ = [v 1T σ (t) v 2T σ (t) … v nσT σ (t)] ( 12 ) 式中: x iT σ (t) = [x i σ1(t) … x i σd i Fσ (t) x i σd i Fσ +1(t) … x i σd i σ (t)] i = 1,2,…,nσ ( 13 ) v iT σ (t) = [v i σ1(t) … v i σd i Fσ (t) v i σd i Fσ +1(t) … v i σd i σ (t)] i = 1,2,…,nσ ( 14 ) 在动态切换拓扑下网络化系统的 Laplacian 矩 阵为 Lσ = LFσ LFLσ 0m×n 0m×m é ë ê ê ù û ú ú ( 15 ) 令 x(t) = [x T F(t) x T L(t)] T , v(t) = [v T F(t) v T L(t)] T 。 xF(t) 表示跟随者的位置, xL(t) 表示领航者的位 置, vF(t) 表 示 跟 随 者 的 速 度, vL(t) 表示领航者的速度。 其中: xF(t) = [x1(t) x2(t) … xn(t)] T xL(t) = [xn+1(t) xn+2(t) … xn+m(t)] T vF(t) = [v1(t) v2(t) … vn(t)] T vL(t) = [vn+1(t) vn+2(t) … vn+m(t)] T 在每个时间段 [t r,j,t r,j+1 ) 内此多智能体系统可 以被 分 成 nσ 个 子 系 统, 在 每 个 时 间 段 内 的 Laplacian 矩阵为 L i σ = L i Fσ 0d i Lσ ×d i Fσ é ë ê ê L i FLσ 0d i Lσ ×d i Lσ ù û ú ú ( 16 ) 由系统动力学模型和控制器得,在时间段 [t r,j, t r,j+1 ) 内: v ·i Fσ(t) = sgn(φ1 [ - L i Fσ x i Fσ(t) - L i FLσ x i Lσ(t)]) α1 + sgn(φ2 [ - L i Fσ v i Fσ(t) - L i FLσ v i Lσ(t)]) α2 ( 17 ) 令跟踪方程: x - i Fσ(t) = x i Fσ(t) + (L i Fσ ) -1 L i FLσ x i Lσ(t) v - i Fσ(t) = v i Fσ(t) + (L i Fσ ) -1 L i FLσ v i Lσ(t) { ( 18 ) 根据跟踪方程得出: v ·i Fσ(t) = sgn(φ1 [ - L i Fσ x - i Fσ(t)]) α1 + sgn(φ2 [ - L i Fσ v - i Fσ(t)]) α2 ( 19 ) 根据假设 3、引理 2、定理 1 得出,此二阶多智能 第 2 期 庄昊,等: 联合连通拓扑下的二阶多自主体系统有限时间包容控制 ·191·
.192 智能系统学报 第12卷 体系统在联合连通条件下可以实现包容控制。 0 下面证明多智能体系统在联合连通条件下可以 实现有限时间收敛。令: 0 yi=-Lixe(t),wi=-Lrovre(t)20) 所以 vr(t)=sgn[(yi)a+sgn[(w)a2 且y=w (21) 构造李雅普诺夫函数V(t)=(t)+(t),其中: n0)=20L(0 图1跟随者与领航者静态拓扑图 r()=立()()= o Fig.1 The static topological graph of followers and leaders 令拓扑图每个边的权重均相等,假设为1。选 个a0-ao 取a1=0.8,a2=2a1/(a1+1),P(x)=3x, 式中:V(t)= sgm[p(s)]ds。 P,(x)=3x。目标区域的3个顶点位置为:专6= 上述李雅普诺夫函数沿着方程(19)的导数: [810],,=[108],专8=[1010]',各跟随 (t)=(t)+(t)= 者的初始位置为:专,(0)=[20]T,专,(0)= -(|wIp2(wi)|2+…+w6|p2(wd))≤0 [40]r,5(0)=[02]T,(0)=[04]r, 注意到V(t)=0当且仅当w=0,由x:P,(x:)> 专(0)=[31]”。各跟随者的初速度为:,(0)= 0(Hx,≠0)和式(21),得到y=0,由引理2和式 [26],2(0)=[38]',(0)=[46], (20)得m(t)=0、x(t)=0,所以有且只有在平衡 ,(0)=[55]r,,(0)=[63]T。 基于图1的拓扑图以及上述初始条件,分别应 点时才有V(t)=0,根据李雅普诺夫第二定理,得到 联合连通条件下此多智能体系统在[1,,4,+)时间 用本文设计的控制器u,(t)=sgn(,(∑a,[x(t)- ie v 段内在平衡点是渐近稳定的。进一步根据式(18) 得到n(t)→(Lm)Lm(t)、xn(t)→ x()])+sg(92(∑a[()-()]),称 (L,)-1Lx(t),再由定理1得出此多智能体系 为控制器(1);和一种传统控制策略u(t)= 统在联合连通条件下能够实现包容控制。 sgn(∑a,[x,()-x,()])+sgm(∑a,[y,()- 由于在每个时间段[1,,,+1)内此多智能体系 jeN 统被分为n。个子系统,由定义3和引理1分析知此 ,(t)]),称为控制器2:进行仿真实验。 多智能体系统与带有扩张(2,2,…,2 应用控制器1与控制器2的各个智能体的位 置、速度与时间的关系如图2~5。 1+1,a1+1,…,&1+1)的度k=a1-1<0是同 d 跟随者1跟随者2跟随者3 次的。因此,由引理1得到此多智能体系统可以达 到有限时间收敛。 4仿真验证 跟随者4跟随者5 4.1静态拓扑仿真 设系统中有5个跟随者,跟随者集合为F={1, 2,3,4,5},要将这5个跟随者控制到三角形区域内, 假设系统信息拓扑图如图1所示,取如下系统矩阵: 2-10001 101520 -12-100 s Le= 0 -13-10 图2控制器1跟随者位置横坐标与时间关系 0 0 -12 -1 Fig.2 The relationship between the abscissa of followers 00 0-12 position under the action of controllerl and time
体系统在联合连通条件下可以实现包容控制。 下面证明多智能体系统在联合连通条件下可以 实现有限时间收敛。 令: y i = - L i Fσ x - i Fσ(t),w i = - L i Fσ v - i Fσ(t) ( 20 ) 所以 v · i Fσ(t) = sgn[ φ 1 (y i )] α1 + sgn[ φ 2 (w i )] α2 且 y · i = w i ( 21 ) 构造李雅普诺夫函数 V i (t) = V i 1(t) + V i 2(t) ,其中: V i 1(t) = 1 2 v - iT Fσ(t) L i Fσ v - i Fσ(t) V i 2(t) = ∑ n z = 1 V i 2z(t)V i 2(t) = ∑ n z = 1 V i 2z(t) 式中: V i 2z(t) = ∫ (∑ d i σ j = 1 azj [xσj (t) -xσz (t)]) T 0 sgn [φ1(s i )] α1 ds i 。 上述李雅普诺夫函数沿着方程(19)的导数: V · i (t) = V · i 1(t) + V · i 2(t) = - ( w i 1 φ2(w i 1 ) φ2 + … + w i d i σ φ2(w i d i σ ) φ2 ) ≤ 0 注意到 V · i (t) = 0 当且仅当 w i = 0,由 xiφl(xi) > 0(∀xi ≠ 0) 和式(21),得到 y i = 0,由引理 2 和式 (20)得 v - i Fσ(t) = 0、 x - i Fσ(t) = 0,所以有且只有在平衡 点时才有 V · i (t) = 0,根据李雅普诺夫第二定理,得到 联合连通条件下此多智能体系统在 [t r,j,t r,j+1 ) 时间 段内在平衡点是渐近稳定的。 进一步根据式(18) 得 到 v i Fσ(t) → (L i Fσ ) -1 L i FLσ v i Lσ(t) 、 x i Fσ(t) → (L i Fσ ) -1 L i FLσ x i Lσ(t) ,再由定理 1 得出此多智能体系 统在联合连通条件下能够实现包容控制。 由于在每个时间段 [t r,j,t r,j+1 ) 内此多智能体系 统被分为 nσ 个子系统,由定义 3 和引理 1 分析知此 多 智 能 体 系 统 与 带 有 扩 张 ( 2þ ,2ï ,ý…ï ,ü2 d i σ , α1 + 1,α1 + 1,…,α1 + 1 þ ï ï ï ï ý ï ï ï ï ï ü d i σ ) 的度 k = α1 - 1 < 0 是同 次的。 因此,由引理 1 得到此多智能体系统可以达 到有限时间收敛。 4 仿真验证 4.1 静态拓扑仿真 设系统中有 5 个跟随者,跟随者集合为 F = {1, 2,3,4,5} ,要将这 5 个跟随者控制到三角形区域内, 假设系统信息拓扑图如图 1 所示,取如下系统矩阵: LF = 2 - 1 0 0 0 - 1 2 - 1 0 0 0 - 1 3 - 1 0 0 0 - 1 2 - 1 0 0 0 - 1 2 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú LFL = - 1 0 0 0 0 0 0 - 1 0 0 0 0 0 0 - 1 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 图 1 跟随者与领航者静态拓扑图 Fig.1 The static topological graph of followers and leaders 令拓扑图每个边的权重均相等,假设为 1。 选 取 α1 = 0.8, α2 = 2α1 / (α1 + 1) , φ1(x) = 3x , φ2(x) =3x 。 目标 区 域 的 3 个 顶 点 位 置 为: ξ6 = [8 10] T , ξ7 = [10 8] T , ξ8 = [10 10] T ,各跟随 者的 初 始 位 置 为: ξ1(0) = [2 0] T , ξ2(0) = [4 0] T , ξ3(0) = [0 2] T , ξ4(0) = [0 4] T , ξ5(0) = [3 1] T 。 各跟随者的初速度为: v1(0) = [2 6] T , v2(0) = [3 8] T , v3(0) = [4 6] T , v4(0) = [5 5] T , v5(0) = [6 3] T 。 基于图 1 的拓扑图以及上述初始条件,分别应 用本文设计的控制器 ui(t) = sgn(φ1(∑ j∈Ni aij[xj(t) - xi(t)])) α1 + sgn(φ2(∑ j∈Ni aij[vj(t) - vi(t)])) α2 ,称 为控 制 器 ( 1 ); 和 一 种 传 统 控 制 策 略 ui(t) = sgn(∑ j∈Ni aij[xj(t) - xi(t)]) + sgn(∑ j∈Ni aij[vj(t) - vi(t)]) ,称为控制器 2;进行仿真实验。 应用控制器 1 与控制器 2 的各个智能体的位 置、速度与时间的关系如图 2~5。 图 2 控制器 1 跟随者位置横坐标与时间关系 Fig.2 The relationship between the abscissa of followers’ position under the action of controller1 and time ·192· 智 能 系 统 学 报 第 12 卷
第2期 庄吴,等:联合连通拓扑下的二阶多自主体系统有限时间包容控制 .193, 14 在控制器1和控制器2的作用下,均在有限的时间 内均收敛到领航者所围成的区域内,但是可以明显 跟随者 跟随者3 跟随者2 看出在控制器(1)的控制下,系统更快地实现了包 10 容控制。 分析图4和图5,在控制器(1)的作用下跟随者 跟随者4跟随者5 的速度在时间到达7s的时候速度全趋于0,表示智 能体已经达到稳定状态,表示跟随者均收敛到领航 者所围成的区域内:在控制器2的作用下跟随者的 速度在时间到达17s的时候速度全趋于0:明显地 101520 看出控制器1比控制器2更优。 於 由图6可直观地看出跟随者的运动轨迹,5个 图3控制器2跟随者位置横坐标与时间关系 跟随者在控制器1的作用下,最终全都在有限时间 Fig.3 The relationship between the abscissa of follow- 内收敛到目标区域内。 ers'position under the action of controller2 and 12 time 10 领航者) 分领航者3 5 领航者2 6 跟随者4 4 踉随者5 跟随者3 3 跟随者2 跟随者1跟随者3 跟随者1跟随者2 跟随者4跟随者5 5 10 15 x/m 0 5 1520 图6控制器1跟随者与领航者位置关系 图4控制器1跟随者速度横坐标与时间关系 Fig.6 The positional relationship between followers Fig.4 The relationship between the abscissa of follow- and leaders under the action of controllerl ers'speed under the action of controllerl and 传统的控制策略虽然可以达到有限时间收敛,但 time 是用时要比本文设计的控制器更长,综上,本文设计 的控制器能使系统更快地达到收敛,所以更有优势。 跟随者1 4.2动态拓扑仿真 跟随者2 设系统中有5个跟随者,跟随者集合为F={1, 4 跟随者3 2,3,4,5},要将这5个跟随者控制到三角形区域 3 内,假定系统互连拓扑图在时刻,k=0,1,…,在拓 跟随者4 2 扑图G~G3中随机切换,取0.5s,令拓扑图每个边 的权重均相等,假设为1。 0 目标区域的3个顶点位置为:P6=[810]r, P,=[108]T,P=[1010]T。各跟随者的初始 -跟随者5 15 20 位置为:P(0)=[20]T,P2(0)=[40]T, 10 P(0)=[02]T,p4(0)=[04]T,P(0)= 图5控制器2跟随者速度横坐标与时间关系 [31]。各跟随者的初速度为:9(0)= Fig.5 The relationship between the abscissa of follow- [26]T,92(0)=[38],93(0)=[46]T, ers'speed under the action of controller2 and 9.(0)=[55]T,95(0)=[63]。选取a1=0.8, time a2=2a1/(a1+1),9(x)=2.1x,p2(x)=2.1x。 分析图2和图3,跟随者由最初的分散的状态, 基于图7的拓扑图以及上述初始条件,分别应 用本文设计的控制器1
图 3 控制器 2 跟随者位置横坐标与时间关系 Fig.3 The relationship between the abscissa of follow⁃ ers’ position under the action of controller2 and time 图 4 控制器 1 跟随者速度横坐标与时间关系 Fig.4 The relationship between the abscissa of follow⁃ ers’ speed under the action of controller1 and time 图 5 控制器 2 跟随者速度横坐标与时间关系 Fig.5 The relationship between the abscissa of follow⁃ ers’ speed under the action of controller2 and time 分析图 2 和图 3,跟随者由最初的分散的状态, 在控制器 1 和控制器 2 的作用下,均在有限的时间 内均收敛到领航者所围成的区域内,但是可以明显 看出在控制器(1)的控制下,系统更快地实现了包 容控制。 分析图 4 和图 5,在控制器(1)的作用下跟随者 的速度在时间到达 7 s 的时候速度全趋于 0,表示智 能体已经达到稳定状态,表示跟随者均收敛到领航 者所围成的区域内;在控制器 2 的作用下跟随者的 速度在时间到达 17 s 的时候速度全趋于 0;明显地 看出控制器 1 比控制器 2 更优。 由图 6 可直观地看出跟随者的运动轨迹,5 个 跟随者在控制器 1 的作用下,最终全都在有限时间 内收敛到目标区域内。 图 6 控制器 1 跟随者与领航者位置关系 Fig. 6 The positional relationship between followers and leaders under the action of controller1 传统的控制策略虽然可以达到有限时间收敛,但 是用时要比本文设计的控制器更长,综上,本文设计 的控制器能使系统更快地达到收敛,所以更有优势。 4.2 动态拓扑仿真 设系统中有 5 个跟随者,跟随者集合为 F = {1, 2,3,4,5} ,要将这 5 个跟随者控制到三角形区域 内,假定系统互连拓扑图在时刻, k = 0,1,… ,在拓 扑图 G1 ~ G3 中随机切换,取 0.5 s ,令拓扑图每个边 的权重均相等,假设为 1。 目标区域的 3 个顶点位置为: p6 = [8 10] T , p7 = [10 8] T , p8 = [10 10] T 。 各跟随者的初始 位 置 为: p1(0) = [2 0] T , p2(0) = [4 0] T , p3(0) = [0 2] T , p4(0) = [0 4] T , p5(0) = [3 1] T 。 各 跟 随 者 的 初 速 度 为: q1(0) = [2 6] T , q2(0) = [3 8] T , q3(0) = [4 6] T , q4(0) = [5 5] T , q5(0) = [6 3] T 。 选取 α1 = 0.8, α2 = 2α1 / (α1 + 1) , φ1(x) = 2.1x , φ2(x) = 2.1x 。 基于图 7 的拓扑图以及上述初始条件,分别应 用本文设计的控制器 1, 第 2 期 庄昊,等: 联合连通拓扑下的二阶多自主体系统有限时间包容控制 ·193·
·194 智能系统学报 第12卷 u,()=sgm(p,(∑a[xy()-x,(t)])+ jeN sgn(2( ∑a,[,()-()]) jeNI 和一种控制器2 6 跟随者3 u.(t)=sgn(a[z(t)-x(t)])" 跟随者4 跟随者5 sg(∑a,[()-(t)]) jeN 进行仿真实验。 ⑥ ⑦ ⑧ 6 ⑦ ⑧ ① ②③④⑤ ① ② ③ ④ ⑤ 50 100 150 (a)G (b)G. s 6 ⑦ ⑧ 6 ⑦ ⑧ 图10控制器1跟随者速度纵坐标与时间关系 Fig.10 The relationship between the ordinate of follow- ① ② ③ ④⑤ ① ②-③④ ⑤ ers'speed under the action of controllerl and (c)G, (d)联合图G time 图7跟随者与领航者拓扑图 10 Fig.7 The topological graph of followers and leaders 跟随者1 应用控制器1和控制器2的各个智能体的位 跟随者2 置、速度与时间的关系图见图8~12。 跟随者3 14 -跟随者4 跟随者5 12 10 跟随者5 -41 0 50 100 150 s 图11控制器2跟随者速度纵坐标与时间关系 Fig.11 The relationship between the ordinate of follow- 50. 100 T50 ers'speed under the action of controller2 and time 图8控制器1跟随者位置横坐标与时间关系 Fig.8 The relationship between the abscissa of followers' 14r position under the action of controllerl and time 14 跟随者1 领航者1 领航者3 12 跟随者2 b 跟随者3 10 一跟随者4 8 领航者2 6 跟随者5 5 10 15 x/m 50 s100 150 图12。控制器1跟随者与领航者位置关系 图9控制器2跟随者位置横坐标与时间关系 Fig.12 The positional relationship between followers and leaders under the action of controllerl Fig.9 The relationship between the abscissa of followers position under the action of controller2 and time
ui(t) = sgn(φ1(∑ j∈Ni aij[xj(t) - xi(t)])) α1 + sgn(φ2(∑ j∈Ni aij[vj(t) - vi(t)])) α2 和一种控制器 2 ui(t) = sgn(∑ j∈Ni aij[xj(t) - xi(t)]) α1 + sgn(∑ j∈Ni aij[vj(t) - vi(t)]) α2 进行仿真实验。 图 7 跟随者与领航者拓扑图 Fig.7 The topological graph of followers and leaders 应用控制器 1 和控制器 2 的各个智能体的位 置、速度与时间的关系图见图 8~12。 图 8 控制器 1 跟随者位置横坐标与时间关系 Fig.8 The relationship between the abscissa of followers’ position under the action of controller1 and time 图 9 控制器 2 跟随者位置横坐标与时间关系 Fig.9 The relationship between the abscissa of followers’ position under the action of controller2 and time 图 10 控制器 1 跟随者速度纵坐标与时间关系 Fig.10 The relationship between the ordinate of follow⁃ ers’ speed under the action of controller1 and time 图 11 控制器 2 跟随者速度纵坐标与时间关系 Fig.11 The relationship between the ordinate of follow⁃ ers’ speed under the action of controller2 and time 图 12 控制器 1 跟随者与领航者位置关系 Fig. 12 The positional relationship between followers and leaders under the action of controller1 ·194· 智 能 系 统 学 报 第 12 卷
第2期 庄吴,等:联合连通拓扑下的二阶多自主体系统有限时间包容控制 .195. 由此可知,传统的控制策略虽然可以达到有 of multi-agent systems with random switching interconnection 限时间收敛,但是用时要比本文设计的控制器更 topologies[J].Automatica,2012,48(5):879-885. 长,并且运动轨迹和速度曲线不如本文设计的控 [8]张安慧,陈健,孔宪仁,等.二阶系统包容控制算法及 制器的曲线平稳,综上,本文设计的控制器比传 其收敛速度分析[J].哈尔滨工业大学学报,2014,46 (9):1-8. 统策略更有优势。 ZHANG Anhui,CHEN Jian,KONG Xianren,et al.Con- 5结论 tainment control protocol and its convergence speed analysis for double-integrator dynamics systems[J].Journal of Har- 1)本文分别针对静态拓扑和动态拓扑的二 bin institute of technology,2014,46(9):1-8. 阶多自主体系统提出一般性的包容控制算法,并 [9]MENG Ziyang,REN Wei,YOU Zheng.Distributed finite- 运用现代控制理论及矩阵论等理论工具分析了 time attitude containment control for multiple rigid bodies 该算法的有限时间收敛问题,给出了二阶系统在 [J].Automatica,2010,46(12):2092-2099. 动态联合连通拓扑条件下的有限时间收敛条件, [10]丁世宏,李世华.有限时间控制问题综述[J].控制与 并给予仿真验证。 决策,2011,26(2):161-169 2)本文研究的是连续条件下的有限时间收敛 DING Shihong,LI Shihua.A survey for finite-time control problems[J].Control and decision,2011,26(2):161- 问题,为了贴近实际应用,下一步将继续研究离散条 169. 件下的有限时间收敛问题。 [11]王付永,杨洪勇,韩辅君.多领航者网络化系统的动态 3)通过本文设计的包容控制算法,可以使网络 群集运动[J].电子学报,2016,44(7):1751-1756. 化系统快速达到收敛,大大减少收敛时间,提高了系 WANG Fuyong,YANG Hongyong,HAN Fujun.Flocking 统收敛效率。 motion of dynamic networked systems with multiple leaders [J].Acta electronica sinica,2016,44(7):1751-1756. 参考文献: [12]XIAO Feng,WANG Long,CHEN Jie,et al.Finite-time 「1]杨洪勇,郭雷,张玉玲,等.复杂分数阶多自主体系统 formation control for multi-agent systems[].Automatica, 的运动一致性「J1.自动化学报,2014,40(3):489- 2009,45(11):2605-2611. 496. [13]肖秋云.多智能体系统有限时间一致性若干问题研究 YANG Hongyong,GUO Lei,ZHANG Yuling,et al.Move- [D].无锡:江南大学,2015. ment consensus of complex fractional-order multi-agent sys- XIAO Qiuyun.Finite-time consensus problems of multi-a- tems[J].Acta automatica sinica,2014,40(3):489-496. gent systems[D].Wuxi:Jiangnan University,2015. [2]王祥科,李迅,郑志强.多智能体系统编队控制相关问 核对英文标题) 题研究综述[J].控制与决策,2013,28(11):1601- [14]王付永,杨洪勇,翁灿.复杂多智能体系统的最大一致 1613. 性[J].计算机仿真,2015,32(6):403-406, WANG Xiangke,LI Xun,ZHENG Zhiqiang.Survey of de- WANG Fuyong,YANG Hongyong,WENG Can.Maximum velopments on multi-agent formation control related problems consistence of complex multi-agent systems[J].Computer [J].Control and decision,2013,28(11)1601-1613. simulation,2015,32(6):403-406. [3]朱旭,月建国,屈耀红.高阶多智能体系统的一致性分 [15]LIN Peng,JIA Yingmin.Consensus of a class of second- 析[J刀.电子学报,2012,40(12):2466-2471. order multi-agent systems with time-delay and jointly-con- ZHU Xu,YAN Jianguo,QU Yaohong.Consensus analysis nected topologies[J].IEEE transactions on automatic con- for high-order multi-agent systems[J].Acta electronica sini- tol,2010,55(3):778-784. ca,2012,40(12):2466-2471. 作者简介: [4]夏红.多智能体系统群一致性与编队控制研究[D].成 庄吴,男,1992年生,硕士研究生, 都:电子科技大学,2014. 主要研究方向为多智能体编队控制、通 XIA Hong.Research on group consensus and formation con- 信技术。 trol of multi-agent systems[D].Chengdu:University of E. lectronic Science and Technology of China,2014. [5]CAO Yongcan,REN Wei.Containment control with multiple stationary or dynamic leaders under a directed interaction graph[C]//Proceedings of the 48th IEEE Conference on 杨洪勇.男,1967年生,教授,主要 Decision and Control.Shanghai:IEEE,2009:3014-3019. 研究方向为网络应用技术、多智能体编 [6]LIU Huiyang,XIE Guangming,WANG Long.Necessary 队控制、复杂网络控制、非线性系统控 and sufficient conditions for containment control of net- 制。发表学术论文80余篇,曾获山东 worked multi-agent systems[J].Automatica,2012,48 省软科学优秀科研成果三等奖1项,烟 (7):1415-1422. 台市青年科技奖1项。 [7]LOU Youcheng,HONG Yiguang.Target containment control
由此可知,传统的控制策略虽然可以达到有 限时间收敛,但是用时要比本文设计的控制器更 长,并且运动轨迹和速度曲线不如本文设计的控 制器的曲线平稳,综上,本文设计的控制器比传 统策略更有优势。 5 结论 1)本文分别针对静态拓扑和动态拓扑的二 阶多自主体系统提出一般性的包容控制算法,并 运用现代控制理论及矩阵论等理论工具分析了 该算法的有限时间收敛问题,给出了二阶系统在 动态联合连通拓扑条件下的有限时间收敛条件, 并给予仿真验证。 2)本文研究的是连续条件下的有限时间收敛 问题,为了贴近实际应用,下一步将继续研究离散条 件下的有限时间收敛问题。 3)通过本文设计的包容控制算法,可以使网络 化系统快速达到收敛,大大减少收敛时间,提高了系 统收敛效率。 参考文献: [1]杨洪勇, 郭雷, 张玉玲, 等. 复杂分数阶多自主体系统 的运动一致性[ J]. 自动化学报, 2014, 40 ( 3): 489 - 496. YANG Hongyong, GUO Lei, ZHANG Yuling, et al. Move⁃ ment consensus of complex fractional⁃order multi⁃agent sys⁃ tems[J]. Acta automatica sinica, 2014, 40(3): 489-496. [2]王祥科, 李迅, 郑志强. 多智能体系统编队控制相关问 题研究综述[ J]. 控制与决策, 2013, 28 ( 11): 1601 - 1613. WANG Xiangke, LI Xun, ZHENG Zhiqiang. Survey of de⁃ velopments on multi⁃agent formation control related problems [J]. Control and decision, 2013, 28(11): 1601-1613. [3]朱旭, 闫建国, 屈耀红. 高阶多智能体系统的一致性分 析[J]. 电子学报, 2012, 40(12): 2466-2471. ZHU Xu, YAN Jianguo, QU Yaohong. Consensus analysis for high⁃order multi⁃agent systems[J]. Acta electronica sini⁃ ca, 2012, 40(12): 2466-2471. [4]夏红. 多智能体系统群一致性与编队控制研究[D]. 成 都:电子科技大学, 2014. XIA Hong. Research on group consensus and formation con⁃ trol of multi⁃agent systems[D]. Chengdu: University of E⁃ lectronic Science and Technology of China, 2014. [5]CAO Yongcan, REN Wei. Containment control with multiple stationary or dynamic leaders under a directed interaction graph[ C] / / Proceedings of the 48th IEEE Conference on Decision and Control. Shanghai: IEEE, 2009: 3014-3019. [6] LIU Huiyang, XIE Guangming, WANG Long. Necessary and sufficient conditions for containment control of net⁃ worked multi⁃agent systems [ J ]. Automatica, 2012, 48 (7): 1415-1422. [7]LOU Youcheng, HONG Yiguang. Target containment control of multi⁃agent systems with random switching interconnection topologies[J]. Automatica, 2012, 48(5): 879-885. [8]张安慧, 陈健, 孔宪仁, 等. 二阶系统包容控制算法及 其收敛速度分析[ J]. 哈尔滨工业大学学报, 2014, 46 (9): 1-8. ZHANG Anhui, CHEN Jian, KONG Xianren, et al. Con⁃ tainment control protocol and its convergence speed analysis for double⁃integrator dynamics systems[ J]. Journal of Har⁃ bin institute of technology, 2014, 46(9): 1-8. [9]MENG Ziyang, REN Wei, YOU Zheng. Distributed finite⁃ time attitude containment control for multiple rigid bodies [J]. Automatica, 2010, 46(12): 2092-2099. [10]丁世宏, 李世华. 有限时间控制问题综述[ J]. 控制与 决策, 2011, 26(2): 161-169. DING Shihong, LI Shihua. A survey for finite⁃time control problems[J]. Control and decision, 2011, 26(2): 161- 169. [11]王付永, 杨洪勇, 韩辅君. 多领航者网络化系统的动态 群集运动[J]. 电子学报, 2016, 44(7): 1751-1756. WANG Fuyong, YANG Hongyong, HAN Fujun. Flocking motion of dynamic networked systems with multiple leaders [J]. Acta electronica sinica, 2016, 44(7): 1751-1756. [12]XIAO Feng, WANG Long, CHEN Jie, et al. Finite⁃time formation control for multi⁃agent systems[ J]. Automatica, 2009, 45(11): 2605-2611. [13]肖秋云. 多智能体系统有限时间一致性若干问题研究 [D]. 无锡: 江南大学, 2015. XIAO Qiuyun. Finite⁃time consensus problems of multi⁃a⁃ gent systems[D]. Wuxi: Jiangnan University, 2015. (请 核对英文标题) [14]王付永, 杨洪勇, 翁灿. 复杂多智能体系统的最大一致 性[J]. 计算机仿真, 2015, 32(6): 403-406. WANG Fuyong, YANG Hongyong, WENG Can. Maximum consistence of complex multi⁃agent systems[ J]. Computer simulation, 2015, 32(6): 403-406. [15]LIN Peng, JIA Yingmin. Consensus of a class of second⁃ order multi⁃agent systems with time⁃delay and jointly⁃con⁃ nected topologies[J]. IEEE transactions on automatic con⁃ trol, 2010, 55(3): 778-784. 作者简介: 庄昊,男,1992 年生,硕士研究生, 主要研究方向为多智能体编队控制、通 信技术。 杨洪勇,男,1967 年生,教授,主要 研究方向为网络应用技术、多智能体编 队控制、复杂网络控制、非线性系统控 制。 发表学术论文 80 余篇,曾获山东 省软科学优秀科研成果三等奖 1 项,烟 台市青年科技奖 1 项。 第 2 期 庄昊,等: 联合连通拓扑下的二阶多自主体系统有限时间包容控制 ·195·