第7卷第3期 智能系统学报 Vol.7 No.3 2012年6月 CAAI Transactions on Intelligent Systems Jun.2012 D0I:10.3969/i.issn.16734785.201201001 多智能体网络系统的自适应协调控制 马连增2,陈雪波2,张化光 (1.东北大学信息科学与工程学院,过宁沈阳110004;2.过宁科技大学电子与信息工程学院,过宁鞍山114051) 摘要:为实现多智能体网络系统的协调控制,设计了一种新型的带有自适应协调器的控制器.基于动态图建立了 多智能体网络系统的模型,并考虑了系统的非线性互联和不可避免存在的时变时滞.应用分布式控制策略,设计了 自适应参数估计的协调器,用于调节智能体之间的互联强度,使网络达到稳定的预设水平.并基于Lyapunov-Km s0vsk茹泛函和自适应动态偏差反馈控制技术,根据拉萨尔不变集原理证明了偏差控制系统的渐近收敛性.这种控制 方法,可在系统参数不确定的情况下,同时完成参数估计和协调控制.所设计的控制律和自适应律简单,易于实现, 仿真示例验证了所提方法的有效性. 关键词:多智能体网络系统:协调控制:自适应控制:网络控制 中图分类号:TP18文献标志码:A文章编号:16734785(2012)03022005 Adaptive coordination control for networked multi-agent systems MA Lianzeng'2,CHEN Xuebo2,ZHANG Huaguang' (1.School of Information Science and Engineering,Northeast University,Shenyang 110004,China;2.School of Electronics and In- formation Engineering,Liaoning University of Science and Technology,Anshan 114051,China) Abstract:In this paper,a novel controller with an adaptive coordinator was designed in order to realize coordination control of multi-agent networked systems.First,multi-agent networked systems were modeled based on dynamic graphs while taking into consideration nonlinear interconnection and non-avoidable time-varying delays.Then,ap- plying distribution control policy,a coordinator with adaptive parameter estimation was designed to obtain the de- sired stable state by adjusting the interconnection level.Asymptotic convergence of the error control system was proved by the Lyapunov-Krasovskii function,adaptive deflection feedback control technology,and La Salle's invar- iant set theory.This method can complement parameter estimation and coordination control simultaneously under uncertainty and has the advantages of being simple and easy to complement.A simulation example was given to ver- ify the effectiveness of the proposed method. Keywords:multi-agent networked systems;coordination control;adaptive control;network control 多智能体网络系统动力学行为中的控制问题已 着诸如智能体动态交互情况下稳定性和性能的定量 成为控制理论界的重要研究课题).最近,由于多 分析、分布式条件下的任务分解和分配、互联拓扑和 智能体系统在卫星编队飞行、合作无人驾驶飞行器、 信息交换不确定等问题的挑战,因而需要控制、计 智能交通系统、空中交通控制等领域的广泛应用,多 算、通信等交叉领域新的工具和技术.很明显,控制 智能体的协调问题引起了不同学科领域学者的关 理论的发展得益于图论、分布式计算、信息理论、网 注.多智能体的协调控制问题有着广泛的研究 络分析等学科.文献[12]提出动态图建模的思想, 方向,比如编队控制、群集智能、一致性理论等[81 基于流形的双时标分析方法设计了多智能体系统的 在这些应用中,协调控制器的设计至关重要,仍面临 协调器.本文拓展了文献[12]的多智能体系统模 型,考虑了信息交换中不可避免存在的传输时滞.在 收稿日期:2012-0103. 多智能体之间固定拓扑的条件下,应用分布式控制 基金项目:国家自然科学基金资助项目(60874017,61034005) 通信作者:马连增.E-mail:mlzhxm@ina.com 策略,设计了一种新型的带有自适应协调器的控制
第3期 马连增,等:多智能体网络系统的自适应协调控制 ·221· 器,可在系统参数不确定的情况下,同时完成参数估 计和协调控制,以调节智能体之间的互联强度,使网 2自适应控制器设计与稳定性分析 络达到稳定的预设水平的目的。 考虑带有未知参数的多智能体网络系统的自适 应协调控制问题.自适应控制器设计包括3个步骤: 1系统描述 1)选择带有参数估计的自适应规律;2)选择带有更 考虑如下n个同质智能体组成的具有时变时滞 新律的控制律;3)分析所得偏差系统的收敛特性. 的多智能体网络系统,每个智能体的动力系统可描 系统模型考虑了智能体之间状态信息传输过程中的 述为: 时变时滞,它体现在互联项中,影响系统的互联强度 和动态本节的目标是设计K的更新律和A、E和 花:(t)=ax,(t)+山+ 三(0)+ E的参数自适应估计,使得当t→∞时,A→A,E→ Σ断((t-r() E,E2+E2. = 定理1当控制律K=diag(K1,k2,…,K.)由下 y:(t)=f(x(t)),i=1,2,…,n. 述更新律更新: 或整个网络系统可描述为 K=-a:[△:(t)]2,i=1,2,…,n, (t)=Ax(t)+U+E'f(x(t))+ 并且参数自适应律选择如式(3): Ef(x(t-7(t))), a=-B:△(t)(t), y(t)=f(x(t)). 号=-nA,()((t), (3) 式中:(t)=((t),x2(t),…,xn(t))为智能体的 状态向量,n为智能体的个数;A=dig(a,a2,…, 号=-6A:(t)f((t-r(t)), 式中:aB、门、6g(i,j=1,2,…,n)是任意的正常 an);E=(e)nxn和E2=(e)nxn表示内联矩阵和带 数.则im((a:-a:)=0,lim(eg-eg)=0, 有时滞项的内联矩阵,代表互联强度;(()是 0 第j个智能体的输出函数;(t)是一个随时间变化 lim()=0. 的函数,表示系统的传输时滞,它满足0≤r(t)≤ 证明令△(t)=x(t)-x(t)是期望系统和响 Tm,0≤()≤u0,Tm和4是常 应系统的状态误差,则能够得到如式(4)的误差动 量;U=(u1,山2,…,4n)T表示控制输入 态系统: A(t)=A△(t)+Ef△(t)+Ef△(t-r(t))- 假设A、E和E2是期望网络的参数,它们是未 (A -A)(t)+(E-E')f((t))+ 知的,需要估计.x(t)=(x1(t),x2(t),…,n(t) (E2-E2)fx(t-r(t)))+k(t)△(t).(4) 是期望网络的状态预设值,若取控制输人U(t)= 对于误差系统(4),选择下面的Lyapunov泛函: k(t)(x(t)-x(t)),设x(t)为控制响应系统的状 态,K(t)为控制增益,则响应系统由方程(1)或(2) V=2A()]'A(d)+∑(K+0)2+ a心: 给出 元=A(t)+Ef())+ 2ap.aa1a4o· Efx(t-r(t))+k(t)(x(t)-x(t)),(1) 层a-+月4-+ 台7 (0)=a(+新(()+ 含好- (5) 月新u-)》+((属-o》 式中:0是一个待定的常数. (2) 沿着误差系统(4)的任意轨迹,计算式(5)的导 式中:k(t)=[K1(t),k2(t),…,Kn(t)]和K(t)· 数,可以得到 (x(t)-x(t))=[K(t)(x(t)-x1(t),k2(t)· e)=[A(e)]rA()-∑(K:+)[△,()]2+ (2(t)-2(t),…,kn(t)(xn(t)-xn(t))]是反 1 馈控制项;A、E和E是完全未知的.定义期望系统 21-[△0)]7△()- 和响应系统之间的状态误差为 A(t)=x()-x(t). 29a-0)]a-(0)+
·222· 智能系统学报 第7卷 哈aa+宫民-+ [a(0][-i(a,)+a(2E(E'))+ 含高-》-a-a+ a(E(E)r+宁+2dn-ao. E(△(t)+E(△(t-r(t))- 常数0若能够合理选择,如式(10): (A-A)(t)+(E'-E')f((t))+ 0=-i(a)+A(2E'(E')r)+ (E2-E2)fx(t-r(t))+k(t)△(t)}- 含&+9[Aor+2n40Ja0)- (2E(E)月+21+2a- (10) 则可以得到 29a4-74:-e) (t)≤-[△(t)]T△(t). 很明显,当且仅当△(t)=0时,(t)=0.根据熟知 [(a,-aA(0(0+ 的拉萨尔不变集原理,从任意的初始值出发,误差系 统(4)的轨迹渐近收敛到最大不变集E.这里集合E A-A(()+ 如式(11): E={e=01A=A,E=E, (-G)Ao-01 E2=E2,k=K0∈Rmx.(11) -[△(t)]TA△(t)+[△(t)]TE△(t)+ 因此带有任意初值的未知参数A、E和E渐近 [A(t)]Ef(△(t-r(t))-[△(t)]T△(t)+ 收敛于期望系统的待辨识系数矩阵A、E和E2,证 20a0140)-茹8 明完毕 [(△(t-x()]A(t-x()).(6) 3仿真实验 由于 考虑如式(12)的多智能体网络模型: 2[A()]EA(t)≤[A(t)]E(E)T△(t)+ (t)=Ax(t)+E'f(x(t))+ [(△(t))]A(t), (7) E"f(x(t-7(t)))+U. (12) 2[A(t)]'E(△(t-r(t))≤ 式中: [A(t)]E2(E2)TA(t)+ [(△(t-(t))](△(t-(t)),(8) =81s=821 [(△(t))](A(t))≤[△(t)]TA(t).(9) 式中:l=max{1i=1,2,…,n. 图-d20e4 将式(7)~(9)代入式(6),可得 f(x)=[tanh(),tanh(2)] 假设有4个参数需要被辨识: ≤-[a)]'A)+2[a)]'E(E)'a()+ e1=2.1,e2=3.2 2a)]7ae)+2[a()]'E(E)'a()+ e品=-1.6,2=-2.4 响应系统设计如式(13): 2A:-rJ4e-》-Aa]'A0+ (t)=Ar(t)+E副f((t))+ Ef((t-7(t)))+K(t)((t)-x(t)). 2daoja)- (13) 式中: 2a(t-r()]7△(:-()≤ -[A()]AA()+2[A()]E(E)'a()+ 3ae)]7ae)+2A]'E(E)ra)- la0]r40+2d'7ao》≤ 根据定理1,设计控制更新律和参数自适应律 如式(14):
第3期 马连增,等:多智能体网络系统的自适应协调控制 ·223 K=-2.5(-x)2,i=1,2, e=-4.01(x-x)anh(x(c)), 2 e2=-5.0(2-x)tanh((t), e品:=-2.8(-x)tanh(x,(t-e/(e+l)), e2=-3.0(x2-x2)tanh((t-e/(e+1)). MMA (14) 若取各个初值为: [x(s),x2(s)]=(0.1,0.1), [x(s),x2(s)]=(0.2,0.2),s∈[-1,0], 0 100 200300 400 500 [k1(0),k2(0)]=(0.1,0.1), [e(0),e22(0),e(0),e2(0)]= (b)偏差e2 (-2,5,-1,0.8). 图2给定和响应系统的状态误差轨迹曲线 根据定理1,可以得到im(a-a:)=0, Fig.2 State error trajectories of set-point and response systems lim(e-e)=0,im(e-e)=0,i,j=1,2.由仿真 曲线(图1~2所示)可见,系统的误差快速趋近于 4结束语 零,而且系统中那些未知的参数被准确地辨识出来 自适应协调控制是控制多智能体网络系统最吸 数值仿真实验验证了本文所提出的定理的有效性, 引人的方法.一般来说,系统可以有动态结构不确定 性或参数不确定性.本文提出的方法只能处理具有 固定结构的参数不确定系统,并且设计相对比较简 0-e 单.不同于以前相关研究考虑的系统模型,本文同时 考虑非线性互联项和包含在互联项中的时变传输时 滞,因而更贴近于实际,但基于Lyapunov-Krasovskii 泛函选择得到的定理难免有一定的特殊性和保守 性.进一步的研究可以考虑结构不确定性和采用复 合自适应控制的方法. 参考文献: 100 200300 400 500 t/s [1]JADBABAIE A,LIN J,MORSE A S.Coordination of 图1参数辨识曲线 groups of mobile autonomous agents using nearest neighbor Fig.1 Parametric identification curves rules[J].IEEE Transactions on Automatic Control,2003, 48(6):988-1001. [2]REN W,BEARD R W.Consensus seeking in multi-agent systems under dynamically changing interaction topologies [J].IEEE Transactions on Automatic Control,2005,50 (5):655661. [3]MOREAU L.Stability of multi-agent systems with time-de- pendent communication links[J].IEEE Transactions on Automatic Control,2005,50(2):169-181. [4]OLFATI-SABER R.Flocking for multi-agent dynamic sys- tems:algorithms and theory[J].IEEE Transactions on Au- tomatic Control,2006,51(3):401-420. 100 200300400500 [5]SAVKIN A V.Coordinated collective motion of groups of autonomous mobile robots:analysis of Vicsek's model[J]. (a)偏差e IEEE Transactions on Automatic Control,2004,39(6): 981-983
·224· 智能系统学报 第7卷 [6]|LI Zhongkui,DUAN Zhisheng,CHEN Guanrong,et al. 作者简介: Consensus of multiagent systems and synchronization of 马连增,男,1970年生,副教授,博士 complex networks:a unified viewpoint[IEEE Transac- 研究生,主要研究方向为非线性系统、组 tions on Circuits and Systems,2010,57(1)):213-224. 群系统分散控制,参与国家自然科学基金 ⑦]洪奕光,翟超.多智能体系统动态协调与分布式控制设 项目2项,发表学术论文8篇 计切1.控制理论与应用,2011,28(10)':1506-1512. HONG Yiguang,ZHAI Chao.Dynamic coordination and distributed control design of multi-agent systems[J].Con trol Theory and Applications,2011,28(10)):1506-1512. 陈雪波,男,1960年生,教授,博士 图梅杰,张海博,马广富.有向图中网络Euler-Lagrange系 生导师,中国自动化学会过程控制专 统的自适应协调跟踪[J].自动化学报,2011,37(5): 业委员会委员.主要研究方向为复杂系 596-603. 统、多智能体系统等.主持多项国家及 MEI Jie,ZHANG Haibo,MA Guangfu.Adaptive coordina- 省部级科研基金项目。 ted tracking for networked Euler-Lagrange systems under a directed graph[J].Acta Automatica Sinica,2011,37(5)): 596-603. 张化光,男,1959年生,教授,博士 []CORTES J.Distributed algorithms for reaching consensus on 生导师,流程工业综合自动化国家教 general functions[J].Automatica,2008,44(3),:726- 育部重点实验室副主任,中国人工智 737. 能学会智能系统专业委员会副主任委 [0]]ARCAK M.Passivity as a design tool for group coordina- 员.主要研究方向为复杂系统的模糊自 tion[J].IEEE Transactions on Automatic Control,2007, 适应控制、非线性控制等.作为课题负 52(⑧)):1380-1390. 责人曾获得国家自然科学基金重点或面上项目(4项)、国 [1]]HONG Yiguang,HU Jiangping,GAO Linxin.Tracking 家“863“计划重大项目(4项)、归国商学人员基金、国家教 control for multi-agent consensus with an active leader and 委博士点金、辽宁省重点科技攻关课题、国家教育部国 variable topology[J].Automatica,2006,42(7):1177- 际合作专项基金等资助,以及承担了20余项企业的重大自 1182. 动化工程项目.曾作为第一获奖人获国家、省部级科技进 [1]SILJAK DD.Dynamic graphs[J]].Nonlinear Analysis: 步奖和自然科学奖6项,申请国家技术发明专利20余项.发 Hybrid Systems,2008,2(2):544-567. 表学术论文300余篇,被SCI、旦、STP检索200余篇
马连增,男,1970年生,副教授,博士 研究生,主要研究方向为非线性系统、组 群系统分散控制,参与国家自然科学基金 项目2项,发表学术论文8篇. [6] LI Zhongkui,DUAN Zhisheng,CHEN Guanrong,et al. Consensus of multiagent systems and synchronization of complex networks: a unified viewpoint[ J] . IEEE Transactions on Circuits and Systems,2010,57(1) :213-224. ·224· 第7卷 张化光,男,1959年生,教授,博士 生导师,流程工业综合自动化国家教 育部重点实验室副主任,中国人工智 能学会智能系统专业委员会副主任委 员.主要研究方向为复杂系统的模糊自 [1] HONG Yiguang,HU Jiangping,GAO Linxin. Tracking control for multi-agent consensus with an active leader and variable topology[J]. Automatica,2006,42(7) :1177- 1182. [8] 梅杰,张海博,马广富.有向图中网络 Euler-Lagrange系 统的自适应协调跟踪[J] .自动化学报,2011,37(5) : 596-603. [7] 适应控制、非线性控制等.作为课题负 责人曾获得国家自然科学基金重点或面上项目(4项) 、 国 家"863"计划重大项目(4项) 、归国留学人员基金、国家教 委博士点基金、辽宁省重点科技攻关课题、国家教育部国 际合作专项基金等资助,以及承担了20余项企业的重大自 动化工程项目.曾作为第一获奖人获国家、省部级科技进 步奖和自然科学奖6项,申请国家技术发明专利20余项.发 表学术论文300余篇,被SCI、EI、ISTP检索200余篇. 洪奕光,翟超.多智能体系统动态协调与分布式控制设 计[J] .控制理论与应用,2011,28(10) :1506-1512. HONG Yiguang,ZHAI Chao. Dynamic coordination and distributed control design of multi-agent systems[J]. Control Theory and Applications,2011,28(10) : 1506-1512. [9] CORTES J. Distributed algorithms for reaching consensus on general functions[J] . Automatica,2008,44(3) : 726- 737. [12] SILJAK D D. Dynamic graphs[J] . Nonlinear Analysis: Hybrid Systems,2008,2(2) :544-567. MEI Jie,ZHANG Haibo,MA Guangfu. Adaptive coordinated tracking for networked Euler-Lagrange systems under a directed graph[J] . Acta Automatica Sinica,2011,37(5) : 596-603. 作者简介: 陈雪波,男,1960年生,教授,博士 生导师,中国自动化学会过程控制专 业委员会委员.主要研究方向为复杂系 统、多智能体系统等.主持多项国家及 省部级科研基金项目. [10] ARCAK M. Passivity as a design tool for group coordination[J]. IEEE Transactions on Automatic Control,2007, 52(8) : 1380-1390. 智 能 系 统 学 报