【学术论文】多智能体系统及其协同控制研究进展

团购合买资源类别：文库，文档格式：PDF，文档页数：9，文件大小：1.02MB

第5卷第1期智能系统学报 Vol.5 No.1 2010年2月 CAAI Transactions on Intelligent Systems Feh.2010 doi:10.3969/j.issn.16734785.2010.01.001 多智能体系统及其协同控制研究进展刘佳，陈增强，刘忠信 (南开大学信息技术科学学院，天津300071) 摘要：对多智能体系统及其协同控制理论研究和应用方面的发展现状进行了简要概述.首先给出Aget及多Aget 系统的概念和特性等，介绍了研究多Agent系统协同控制时通常用到的代数图论；然后综述了近年来多Aget系统群集运动和协同控制一致性方面的研究状况，并讨论了其在军事、交通运输、智能机器人等方面的成功应用：最后，对多Agent系统未来的发展方向进行了探讨和分析，提出几个具有理论和实践意义的研究方向，以促使多Aget系统及其协同控制理论和应用的深入研究. 关键词：多Aget系统(MAS);协同控制；代数图论；群集运动；一致性协议中图分类号：TP18文献标识码：A文章编号：16734785(2010)01000109 Advances in multi-Agent systems and cooperative control LIU Jia,CHEN Zeng-qiang,LIU Zhong-xin (College of Information Technology Science,Nankai University,Tianjin 300071,China) Abstract:Progress in multi-Agent systems with cooperative control was reviewed in terms of theoretical research and its applications.First,concepts and features used to define Agents and multi-Agents were analyzed.Then graph theory was introduced,since it is often used in research on cooperative control of multi-Agent systems.Then ad- vances in swarming/flocking as well as the means used to derive a consensus among multi-Agents under cooperative control were summarized.The application of these abilities was discussed for the military,transportation systems, and robotics.Finally,future developments for multi-Agent systems were considered and significant research prob- lems proposed to help focus research on key questions for multi-Agent systems with cooperative control. Keywords:multi-Agent system (MAS);cooperative control;graph theory;swarming/flocking;consensus protocol 分布式人工智能是人工智能领域中一个重要的控制的角度对MA$进行分析与研究已经成为国内研究方问，而多Agent系统(muli-Agent system, 外众多学术机构的关注热点，人们在MAS协同控制 MAS)则是其一个主要的分支.20世纪90年代，随问题上做了大量的研究工作，特别是在MAS群集运着计算机技术、网络技术、通信技术的飞速发展，A- 动控制和协同控制一致性问题方面取得了很大的进 gent及MAS的相关研究已经成为控制领域的一个展.目前对MAS的研究总体上来说还处于发展的初新兴的研究方向.由于Agent体现了人类的社会智步阶段，离真正的实用化还有一定的距离；但其广泛能，具有很强的自治性和适应性，因此，越来越多的的应用性预示着巨大的发展潜力，这必将吸引更多研究人员开始关注对其理论及应用方面的研究.目专家、学者投人到这一领域的研究工作中，对MAS 前，人们已经将MAS的相关技术应用到交通控制、的理论及应用做进一步探索.根据上述目的，本文主电子商务、多机器人系统、军事等诸多领域.而在要概述了多智能体系统(MAS)在协同控制方面的 MAS中，Agent之间如何在复杂环境中相互协调，共研究现状及其新进展同完成任务则成为这些应用的重要前提.近年来，从 1 Agent与MAS的相关概念收稿日期：2009-1129. 基金项目：国家自然科学基金资助项目(60774088,60904022)：天津市自然科学基金资助项目(09 JCYBJ0(01700). 1.1 Agent的概念通信作者：刘佳.E-mail:liujia._0704@163.com Agent一词最早可见于Minsky于1986年出版

2 智能系统学报第5卷的《Social of Mind》一书中.国内文献中经常将Agent Agent有更多的优点.多个Agent相互合作能够完成超翻译为：智能体、主体、代理等，但最常见的仍是采用出它们各自能力范围的任务，使得MAS的整体能力大英文“Agent'”;因为Agent的概念尚无统一标准，人于个体能力之和.总体上说，MAS具有更广泛的任务领们对于汉语中哪个词能更好地表达其含义还没有达域、更高的效率、改良的系统性能、错误容忍、鲁棒性、到共识. 分布式的感知与作用、内在的并行性、对社会和生命科对于Agent的概念，目前还不存在一个普遍接学的观察等显著特性] 受的精确定义，这主要是由于Agent的各种属性在不同领域中的重要性不同.这里介绍2种被引用较多的定义形式： 1)Maes在文献[1]中将Agent定义为：试图在复杂的动态环境中实现一组目标的计算机系统。作用范围 2)Wooldrige和Jennings在文献[2]中，从Agent 的特性方面给出其弱定义和强定义.弱定义是指A 环境 gent用来最一般地说明一个软硬件系统，它具有以图2环境中的MAS 下几个特性：a)自治性(autonomy):Agent可以在没 Fig.2 Multi-Agent system in environment 有人或其他Agent的干扰下直接运作，而且对自己图2描述了MAS中Agent之间以及Agent与环的行为和内部状态有某种控制能力；b)社会性(s0 境之间的关系.从图中可以看出，MAS中的交互关 cial a山bility):Agent可以与其他Agent(也可以是人) 系是非常复杂的，各个Agent之间的交互可以是双进行通信交流；c)反应性(reactivety):Agent可以感向的，例如：Agent2和Agent3、Agent4和Agent5; 知环境，并可以对环境发生的变化做出相应的反应；这种关系也可以是单向的，例如Agent1和Agent2、 d)预动性(pro-activeness):Agent不仅仅是简单地对 Agent1和Agent4、Agent4和Agent3.系统中的A- 周围环境做出反应，也可以通过接受某些启动信息， gent可以在环境中动作，不同的Agent有不同的“作主动发起可以表现目标引导的行为.强定义是指A- 用范围”，表示它们可以影响环境的不同部分，而A gent除了具备以上弱定义中的所有特性外，还具备 ent也同时受其作用范围内环境的影响.在有些情一些人的特性.比如信念(belief)、知识(knowledge) 况下，不同Agent的作用范围可能会重叠，例如图2 等描述信息状态的行为；意图(intention)、承诺中Agent2和Agent3、Agent3和Agent4的作用范 (commitment)等描述协商状态的行为；期望(de 围存在相互重叠的区域.这种影响范围重叠的事实 sire)、目标(goal)等描述动机状态的行为. 会产生Agent之间的依赖关系.另外，Agent也存在 Agent 不与环境相互影响的情况，例如图2中的Agent1. 传作输出 1.3MAS的组织结构输 MAS的组织结构是指系统中Agent之间的信息环境关系和控制关系，以及问题求解能力的分布模式.组织结构是MAS中很多问题的研究基础，因此，如何图1环境中的Agent 将各个Agent有效地组织起来，以便使Agent之间 Fig.1 The Agent in environment 图1给出了一个环境中Agent的抽象示意图，及Agent与环境之间的各种协作顺利进行，对MAS 从图中可知，Agent接受从环境中感知的输人，并产的研究非常重要，生输出动作作用于环境，这种交互通常是一个连续 MAS的组织结构可以是集中式的或分布式的，不断的过程.Agent不能完全控制它周围的环境，只也可以是这2种形式都存在的混合式组织结构.不能通过动作输出影响环境. 同的组织结构行为方式不同，因此性能也会有所不 1.2MAS的概念同.一般地，MAS的组织结构主要分为以下3种类 MAS是由多个Agent组成的集合，Agent之间以及型4： Agent与环境之间通过通讯、协商与协作来共同完成单 1)行政管理组织结构（集中式）个Agent所不能解决的问题.多个Agent的使用比单个这是一种主从式层次结构，在这种结构中，所有

第1期刘佳，等：多智能体系统及其协同控制研究进展 ·3 Agent组成一个Aget团体.根据Agent的工作范围阵构成的.无向边集合中，结点没有起点和终点之分，和职能，可将其分为也就是说，(：，)就意味着(，：)，因此，无向图是有 a)管理Agent:负责MAS的管理，一般一个系统向图的一种特殊情况.一个结点”：的入度和出度分别中只有一个管理Agent; 用degn（:)和deg(:)来表示，且 b)功能Agent:具有通用的任务执行能力，能够协助管理Agent完成一些系统任务，是一类不受应 dga）=Ao.dg(a）=月o 用领域影响的工具Agent; 图G中的结点：是平衡的(balanced)当且仅当 c)应用Agent:具有特殊领域中的事务处理功该结点的入度和出度相等，即degm（:)= 能，一般一个系统中有多个应用Agent. degom(:).图G是平衡图的充分必要条件是这个图 2)完全自治式组织结构（分布式）中所有结点都是平衡的，即有在这种结构中，Agent之间没有管理与被管理 degin（v:)=degou(:),Vi∈L. 的关系，每个Agent都可以自主地实现自己的目标. 一个有向图G是强连通的(strongly connected) 这种方式最能体现MAS的灵活性、社会性和每个当且仅当图G的任意的2个不同结点之间有一条 Agent的自治性，但这种方式运行的稳定性和可控有向路径.一个有向图包含生成树，当且仅当它有一个根结点，从任意的其余结点出发，都存在路径可以性较差到达这个根结点. 3)问题求解组织结构（混合式）权重图的Laplacian矩阵定义为L=[l;],其这是Agent为了协同完成一项任务而形成的一种动态组织结构，各Agent之间的关系式是动态变中，l=∑4，对于ij,g=-a到 2.2MAS群集运动及控制研究化的.从Agent之间的关系来看，这种结构介于主从 MAS群集(Swarming/Flocking）行为是复杂性式与完全自治式结构之间. 科学的一个焦点问题.Swarming是指一个由大量自 2MAS协同控制研究进展治个体组成的集合，在无集中式控制和全局模型的情况下，一般通过个体的局部感知作用和相应的反经过20多年的发展，MAS的研究已经在理论和应行为，使整体呈现出涌现行为.在一个MAS中，所应用方面取得了很大的进展.MAS一个显著特征是：有的Agent最终能够达到速度矢量相等，相互间的系统中每个Agent的能力有限，而大量这样的个体聚距离稳定，则被称为Flocking问题.自然界中存在很集到一起，通过相互作用会产生有意义的社会活动或多群集行为，例如：鸟群迁徙时会整齐编队，在遇到完成单个Agent所不能完成的任务.因此，MAS研究障碍时，这种队形还可以自动调整：野生动物群和鱼领域中一个重要的问题就是设计正确的控制策略，使群在遇到攻击时会形成一个合理的编队逃跑，而不 MAS完成给定任务，即MAS的协同控制问题.近年是一哄而散；蚁群在觅食时能够在食物与居住地之来，MAS的协同控制已经成为国内外诸多研究人员间选取一条最优路径，并且，当环境变化时，它们会关注的热点问题，本节先简要介绍研究协同控制问题对路径进行重新选择.这些是群集行为极具代表性通常使用的代数图论，然后从MAS群集运动和协同的例子控制一致性问题2个方面，论述近年来国内外在多 1987年，Reynolds提出一个模仿动物聚集的计 Agent协同控制方面的研究发展状况算机模型，这个基本的群集模型包括3条规则： 2.1代数图论 1)聚集(cohesion):所有Agent改变当前位置并向其有向图G=(V,E,A)由一个有限顶点（或结点）邻近成员的平均位置运动；2)分离(separation):运集合V={,2,…,vn}、一个有向边的集合ECV×V 动过程中，相邻的Agent避免发生碰撞；3)调整(a- 和权重矩阵A所构成.eg=(:,)∈E叫做边，第1 lignment):所有Agent速度大小和方向改变基于其个元素：称为边的起点，第2个元素巴称为边的终邻近成员的平均值。点，边的方向从：指向v连接权值矩阵为A=[a], 1995年，Vicsek等人提出了多自主移动Agent 且对于i∈I(1=1,2,…,n)有：i≠j,ag>0,对于模型[61： Vi∈I:a=0.类似地可以定义无向图，无向图是由一 x(t+1)=x:(t)+:(t)△t,i=1,2,…,n 个有限顶点（或结点）集合、一个无向边集合和权重矩式中：x:(t)为第i个Agent在t时刻的位置向量，在

智能系统学报第5卷每个时间段根据上式更新，y:(t)为速度向量，由一的势能场函数梯度有界时，给出群体聚集的收敛条件个定常的绝对速度v和一个方向角0，(t)决定，0：(t) 和一个表示群体大小的上界.Yu和Wang等在文献按下式更新： [15]中基于动态时变有领航者的网络拓扑，用图论模 0:(t+1)=,+△0，i=1,2,…,n. 型表示Agent之间的相互作用及通信关系，运用推广的式中,是以Agent i为中心，以r为半径的 Lyapunov理论及非平滑分析进行了稳定性分析，并得圆盘内所有Agent(包Agent i)的平均方向，△0是服到所有Agent速度方向收敛到同一方向并与leader保从均匀分布的随机数，表示干扰.实质上，Vicsek模持一致；所有Agent速度大小收敛并与leader相同；相型是Reynolds模型的一种特殊情况，他只考虑了邻Agent之间没有碰撞发生；所有Agent的人工势场函 Reynolds提出的3条规则中的调整.Vicsek等还通数被最小化等重要结论.他们还在文献[16]中对具有过一系列有趣的仿真结果说明，尽管没有集中的协二次积分动态的Agent群体，在有向网络取得群集运动调，并且每个Agent的最邻近的集合在系统演变的进行了研究，提出了一个分散控制方法对Agent群体进过程中随时间而改变，模型所采取的“最邻近规则” 行分散控制.另外，XF.Wang和L.Wang等还利用却能够使所有Agent的运动方向最终趋于一致，一种虚拟leader对多Agent群集运动进行稳定性分 Tanner等在文献[7-8]中从理论方面解释了析n-o Reynolds提出的计算机模型，他们分别针对固定拓 2.3MAS一致性问题研究扑和切换拓扑2种情形，对多Agent群集行为建立目前，对于多Agent群集行为的研究，通常将位了数学模型，并运用代数图论、非平滑分析及非平滑置聚合和速度匹配问题单独拿出来研究，即不考虑多系统理论等数学工具、经典控制理论及人工势场法， Agent之间是否发生碰撞，这就是所说的一致性问题. 设计了局部分散控制策略，使得Agent群体达到运一致性(consensus)是指在一个MAS中，所有的Agent 动方向全局收敛到同一方向、速度大小收敛到同一最终状态能够趋于一致.一致性协议（算法）则是值、相邻的Agent之间没有碰撞发生及人工势场函 MAS中，使个体状态最终趋于一致的Agent之间的信数被最小化的理想状态.在文献[9]中，他们又提出息传递规则.近年来，国内外专家、学者们在MAS一一种非平滑控制策略，使得一组Agent做群集运动致性问题的研究中取得很多成果，提出多种不同情况时避免相互碰撞，且避开环境中的静态障碍.在文献下MAS协同控制一致性协议，下面将对已有的一致 [l0]中，Olfati-Saber则设计了一个局部控制策略，性控制算法进行简单的总结，使得Agent群体取得群集运动的同时避免与环境中设系统中有n个多Agent.,用x:表示第i个A 的多个凸型障碍发生碰撞，并说明控制规则中隐含 get的状态，这个状态可以是位置、速度、振幅等等. 了Reynolds模型中的3条规则.Liu等人给出了连续时间线性一致性协议通常可以写成如下形在固定通信拓扑下m维多移动Agent的群集行为稳式2025 定性分析.Gaai等2]还在Agent群体模型中加入了 :(t)=∑ag(x(t)-(). (1) jeRe) 环境模型，指出决定每个个体运动的3个因素：1) 式中：J:(t)表示在t时刻传送信息给第i个Agent的与距离较远的个体相互吸引；2)与距离较近的个体邻居集，α；是一个非负权值因子.也就是说，每一时相互排斥；3)被感兴趣的区域吸引或排斥不感兴趣刻每个Agent的状态都取决于在那一时刻它所有邻的区域，说明Agent群体聚集行为是Agent之间相近Agent的状态.特别地，如果每个Agent的邻居集互作用，Agent与环境相互作用平衡的结果.他们还和权值因子从初始时刻开始一直保持不变，那么这针对不同环境，对系统的稳定性进行了分析，给出系个MAS就具有固定拓扑结构.此时，连续时间线性统收敛到更有利区域的条件.Wang等在文献[13] 一致性协议为中讨论了n维空间内MAS群集行为，根据动态A x=-x. (2) gent之间的局部作用和信息交换，设计了一组控制式中：L为权重图的Laplacian矩阵，x= 策略使得MAS按所期望的形式做群集运动 [2…xn]T 上述文献在无向网络中考虑了同类MAS的群体离散时间线性一致性协议为27 聚集运动.针对一类由领航者(leader)和跟随者(follo- x[k+1]=-∑B[k]x[h]. (3) wer)2种个体组成的MAS聚集模型，文献[14]在环境 je]ui

第1期刘佳，等：多智能体系统及其协同控制研究进展 ·5 式中：∑uP,[]=1,B,[]>0.也就是说，的充要条件是0≤o≤π/2入m(L)[s1.在文献[28] 每个Agent的下一步状态是根据它及与其相邻的所中，作者还进一步讨论了时变时滞拓扑结构下MAS 有Agent的当前状态更新的.可以将离散时间线性的平均一致性收敛条件.需要指出的是，目前对于有一致性协议式(3)写成矩阵形式：向网络拓扑结构下时变时滞一致性协议的研究还比 x[k+1]=D[k]x[k]. (4) 较少；另外，在某些Agent之间传输信息出现错误的式中：D[k]为所有行和为1的随机矩阵情况下，怎样确保整个MAS也能达到协同控制的要在一个MAS中，如果对于任意的i≠j,当t→∞ 求是一个对实际应用非常有意义的课题，时，有‖x:()-x,(t)‖0，则系统的最终状态可以一阶积分一致性协议式(1)也可以推广到二阶趋于一致.0 lfati-Saber等在文献[21,23]中指出，如积分动态系统，此时，一致性协议为90 果MAS的拓扑结构是强连通的有向图，那么对于任 =-∑ag()[(-)+y(-)].(8) 意初始状态，系统的状态渐近收敛，并且在强连通的式中，y为一个正的增益.文献[31]还在已有的二有向拓扑结构下，系统平均一致收敛的充分必要条次积分系统的一致性协议中引入旋转矩阵，讨论了件是信息交换图是平衡图.Ren等人在文献[25-26] 三维空间中一组多Agent的一致性问题，说明了网中给出时不变信息交换拓扑结构下，连续或离散时络拓扑、阻尼增益、欧拉角的值均能影响到多智能体间协议达到渐近一致的充分必要条件，即信息交换一致性运动结果.针对动态有向作用下二次积分动图中包含生成树.这个条件比文献[21,23]中提出力学系统，文献[32]研究了2种采样离散时间编队的强连通条件弱，适用范围更广. 控制的一致性协议.在文献[33]中，Wang等还进一在实际应用中，由于网络节点或边的故障、重步考虑了具有二次积分动态系统的有限时间一致性连、丢包等；又或者在某些特定场合，如蜂拥问题、编问题队控制问题、次同步问题等，网络拓扑结构经常是变在许多实际应用场合，对MAS的协同控制是在化的，通常把这种动态拓扑结构称为网络切换拓扑某些约束条件下进行的.例如，控制输入是有界的，期结构.文献[23]给出MAS在切换拓扑结构下的一望所有的Aget最终都收敛到一个特定值或是特定致性协议：区域.Ren等在文献[30]中分析了有界控制输入约束 x(t)=-Lx(t),k =s(t). (5) 条件下二阶积分系统的渐近收敛问题.文献[34]则是式中：Lk=L(G)是图集T中权重图G的Laplacian 在切换拓扑结构下，研究了具有有界时变通信时间延矩阵，s()为定义切换拓扑结构的切换信号.文献迟的离散MAS系统一致性问题.Bauso还在固定拓扑 [21,23]给出切换拓扑结构中系统在任意切换信号下结构下讨论了非线性一致性协议的收敛问题，使得所平均一致收敛的充分条件.在文献[22]中，0fati-Sa 有Agent最终收敛到一个特定值]， ber等基于Lyapunov泛函方法，分析了动态系统在无另外，许多文献还在MAS中包含leader和follo- 向拓扑网络机构下连续时间非线性一致性协议： wer2种类型Agent的情况下，讨论了系统的一致性 (t)=∑中g(()-x() (6) 问题.文献[36]分别在固定拓扑和切换拓扑2种结 jej(t) 式中：中(z)=中：(z),且满足：1)中(z)是局部构下，研究了带有多个leader的MAS的一致性问 Lipschitz连续的；2)中g(z)=0z=0:3)zφ财(z)> 题，指出其他Agent最终能收敛到以多个leader为 0,Hz≠0. 顶点的多面体中，文献[37]则研究了具有时变时滞在MAS中，当Agent之间的信息交换存在时间及动态leader的MAS在固定拓扑和切换拓扑结构延迟时，连续时间线性一致性协议式(1)将写成如下的一致性问题.Ren还在文献[38]中分析了具有下形式23,8 有界控制输入的一致性跟踪协议，并在leader动态变化和切换信息交换网络拓扑结构下，给出一致性 ,(t)=-∑ag(x,(t-0g)- 跟踪协议的收敛条件；他们还利用多机器人实验平 x(t-o)). (7) 台，将一致性跟踪协议结果应用于编队控制，式中，σ；>0表示系统中Agent之间信息交换时的时以上这些研究工作都是假设Agent信息交换渠间延迟.对于一种最简单的情形，即σg=σ且信息交道是非常理想化的，即每个Agent能从与它邻近的换拓扑结构是固定无向的连接图，系统平均一致收敛 Agent那里得到准确的信息.而在实际应用中，Agent

.6 智能系统学报第5卷发送、接收信息及信息传输过程中经常会受到干扰，定因素多等特点.MAS理论的出现和发展为交通系例如：热干扰、信道衰减等.因此，在存在随机干扰的统的研究提供了一种新的思路和方法，引起了诸多情形下讨论MAS的一致性问题就显得更有实际意研究学者的关注.目前，MAS在交通控制领域的应义了.Li和Zhang在文献[39]中讨论了具有可测噪用已经成为一个日趋成熟的研究方向.文献[46]采声的固定有向拓扑结构下MAS的均方平均一致性用多Agent协调控制方法来协调相邻交叉口处的控问题.为了降低可测噪声的影响，他们将时变一致性制信号，以消除网络中的交通拥塞.Cheng等则在文增益引入到一致性协议中，利用图论和随机理论，分献[47]中提出了一种基于多智能体的分布式交通析了这种协议的收敛性.Wang和Zhang 401则在一般信号协调控制方法，有向通信拓扑和高斯通信噪声的影响下，给出MAS 另外，空中交通管理系统也是MAS协同控制方的一致性条件，利用马氏链的结果得到一个网络节法在交通运输控制方面应用的另一重要领域.随着点的互通类，通过对噪声影响的细化，给出了不同噪世界经济的快速发展，空中交通拥挤将成为一个世声情形下系统的一致性条件.这里研究的有向图不界范围内的难题.澳大利亚人工智能研究所基于多仅包含平衡图，也包含非平衡图，推广了文献[39] Agent的思路设计实现了一个空中交通管理系统，中的结果.在文献[41]中，作者则讨论了在具有可系统中每个Agent负责一个空中交通系统中的子问测通信噪声影响下有leader的MAS的一致性问题，题，并与其他Agent进行协调与协作，以便实现整个给出了一个使得系统在固定拓扑结构下强均方一致系统的目标任务，的充分条件，并指出在无噪声情况下，此条件是充分 3.3智能机器人方面必要的，近年来，多移动机器人系统的协同控制问题已 3 成为一个新兴的研究热点，而此问题的理论研究已多Agent协同控制的应用经在很多领域中得到应用.日本的机器人足球世界 MAS的理论研究在近些年受到很大关注的一杯锦标赛RoboCup就是一个非常典型的例子.在机个重要原因是，MAS及其协同控制问题在许多领域器人足球赛中，多个机器人之间的关系相当复杂，它具有十分广泛的应用.例如，利用无人驾驶飞行器或们必须通过互助合作才能共同完成任务，这是MAS 自治水下机器人应用于复杂作业、未来的自治性战协同控制应用的一个典型实例.在工业方面，MAS 争体系、智能交通控制系统等等.本节将从军事、交协同控制的应用表现在，人们控制多个智能机器人通运输、智能机器人3个方面介绍MAS协同控制的以特定队形搬运单个物体，利用多个智能机器人替典型应用代人类进行危险作业.在军事方面还可以利用多机 3.1军事方面器人群体进行侦查、巡逻等现代军事系统正日趋先进，而MAS的理论也应用到了军事仿真系统的研究中.Li等2对一种对话 4MAS协同控制的研究展望模式的坦克智能体之间的通讯机制进行了构建，为随着计算机科学以及网络技术的发展，多A 在坦克分队仿真开发中通讯机制有效性、可靠性、透 gent的应用领域将会更加广阔.目前，MAS协同控明性的提高提供了有力的参考.Parker]已经在早制方面的研究已经取得很大进展，但仍存在许多问期的工作中对飞机编队飞行问题进行了研究，他利题，有待进一步研究用局部信息和全局信息相结合的方式设计控制率以 1)在MAS协同控制的研究中，Agent之间在进保持编队.多Agent协同控制在军事中的应用还包行信息交换时一般会存在时间延迟现象.已有的很括允许战斗机按照自己的路线飞行，以避免雷达，达多文献讨论了MAS协同控制的时滞一致性算法，但到局部优化4].文献[45]还利用MAS技术构建火大多是在无向网络（有向网络的特殊情况）拓扑结力分配模型，实现火力模型通用化、智能化，使火力构下考虑的.因此，讨论信息交换时存在时滞（尤其分配更精确、高效是时变时滞)的有向拓扑结构下多Agent协同控制 3.2交通运输控制方面 -致性问题将是非常有意义的.另外，Agent之间的城市交通系统是由人和交通工具等组成的动态信息传递可能会出现错误，对出现信息传递错误的复杂系统，具有影响因素多、开放性强、随机及不确 MAS协同控制问题的研究也具有深刻的实际意义

第1期刘佳，等：多智能体系统及其协同控制研究进展 ·7 2)在实际应用中，MAS中每个Agent发送和接 [4]李英.多Agent系统及其在预测控制与智能交通系统收信息，及信息传输过程中往往会存在着许多干扰，中的应用[M].上海：华东理工大学出版社，2004：15- 而目前关于在有随机噪声的通信环境下研究多A- 25 gent协同控制一致性问题的文章还比较少，因此，研 [5]REYNOLDS G.Flocks,birds and schools:a distributed behavioral model[J].Computer Graphics,1987,21(1): 究MAS在通信环境存在随机干扰情况下的协同控 25-34. 制一致性算法及其稳定性是可待研究的方向.另外 [6]VICSEK T,CZIROK A,BENJACOB E,et al.Novel type 还可在此基础上进一步考虑Agent之间避免发生碰 of phase-transition in a system of self-driven particles[J]. 撞的条件，从而，对存在随机干扰的通信环境下 Physical Review Letters,1995,75(6):1226-1229. MAS的群集运动做一些深刻的研究. [7]TANNER H G,JADBABAIE A,PAPPAS G J.Stable floc- 3)预测控制作为近年来新型计算机控制算法，汲 king of mobile Agents,Part I:fixed topology[C]//Pro- 取了优化控制的思想，但利用滚动的有限时段优化取 ceedings of the IEEE Conference on Decision and Control. 代一成不变的全局优化，这种建立在实际反馈信息基 Maui,HΠ，USA,2003:2010-2015. 础上的反复优化，具有更强的鲁棒性.Zhang等已经 [8]TANNER H G,JADBABAIE A,PAPPAS G J.Stable floc- 在文献[48]中研究了预测机制下MAS的协同控制的 king of mobile Agents,Part II:dynamic topology[C]/ Proceedings of the IEEE Conference on Decision and Con- 一些问题，但此类问题的研究还处于初步阶段；所以， trol.Mai,HⅢ，USA,2003:2016-2021. 对于预测机制下MAS群集行为及协同控制一致性问 [9]TANNER H G.Flocking with obstacle avoidance in swite- 题的研究具有极大的理论及现实意义， hing networks of interconnected vehicles[C]//Proceedings 4)为了能将MAS的相关理论更好地应用于实 of the IEEE International Conference on Robotics and Auto- 践，MAS或者多机器人系统的仿真平台研究也是相 mation.New Orleans,USA,2004:3006-3011. 当重要的.目前，国内外已经建立了一些这样的仿真 [10]OLFATI-SABER R.Flocking for multi-Agent dynamic sys 平台，但很多工作还有待进一步完善 tems:algorithms and theory[J].IEEE Transactions on Automatic Control,2006,51(3):76-95. 5结束语 [11]LIU Yang,PASSINO K N,POLYCARPOU M.Stability a- nalysis of M-dimensional asynchronous swarm with a fixed MAS及其协同控制已经成为当前学术界一个 communication topology[J].IEEE Transactions on Auto- 新的研究热点，吸引了许多不同领域研究人员的极 matic Control,2003,48(4):76-95. 大关注.本文讨论了与MAS有关的一系列问题，简 [12]GAZI V,PASSINO K M.Stability analysis of social fora- 要介绍了MAS协同控制方面的研究状况与应用，展 ging swarms J].IEEE Transactions on Systems,Man, 望了几个有待进一步研究的方向.虽然MAS及其协 and Cybemetics-Part B:Cybernetics,2004,34(1):539- 同控制相关问题的研究会存在很多问题和困难，但 557. 其应用前景是十分广阔的，相信在各领域专家、学者 [13]WANG L,SHI H,CHU T G,et al.Flocking control of 的共同努力下，多智能体系统控制方面的研究定能 groups of mobile autonomous Agents via local feedback 取得新的进展与突破， [C]//Proceedings of the IEEE International Symposium on Intelligent Control.Limassol,Cyprus,2005:441446. 参考文献： [14]李宗刚，贾英民.一类具有群体LEADER的多智能体系统的聚集行为[J].智能系统学报，2006,1(2)：26- [1]MAES P.Modeling adaptive autonomous Agent[J].Artifi- 30. cial Life6,1994,1(1/2):135-162 LI Zonggang,JIA Yingmin.Aggregation of multi-Agent [2]WOOLDRIGE M,JENNINGS N R.Intelligent Agents:the- systems with group leaders[J].CAAI Transactions on In- ory and practice [J].Knowledge Engineering Review, telligent Systems,2006,1(2):26-30. 1995,10(2):112-152. [15]俞辉，王永骥，程磊.基于动态拓扑有领航者的智 [3]俞辉。多智能体机器人协调控制研究及稳定性分析能群体群集运动控制[J].系统工程与电子技术，2006， [D].武汉：华中科技大学，2007 28(11):1721-1724. YU Hui.Research on cooperative control and analysis of YU Hui,WANG Yongji,CHENG Lei.Control of flocking stability for multi-Agent robots[D].Wuhan:Huazhong U- motion of the flock with a leader based on dynamic topology niversity of Science and Technology,2007. [J].Systems Engineering and Electronics,2006,28

8… 智能系统学报第5卷 (11):1721-1724. [27]MOREAU L.Stability of multi-Agent systems with time- [16]俞辉，王永骥，程磊.基于有向网络的智能群体群 dependent communication links[J].IEEE Transactions on 集运动控制[J].控制理论与应用，2007,24(1)：79- Automatic Control,2005,50:169-182. 83. [28]BLIMAN P A,FERRARI-TRECATE G.Average consen- YU Hui,WANG Yongji,CHENG Lei.Flocking motion sus problems in networks of Agents with delayed communi- control of flock in directed networks[J].Control Theory cations[J].Automatica,2008,44(8):1985-1995. Applications,2007,24(1):79-83. [29]REN W,ATKINS E.Second-order consensus protocols in [17]SU Housheng,WANG Xiaofan,LIN Zongli.Flocking of multiple vehicle systems with local interactions C]// multi-Agent with a virtual leader,Part I:with a minority of AIAA Guidance,Navigation,and Control Conference and informed Agents[C]//Proceedings of the 46th IEEE Con- Exhibit.San Francisco,USA,2005:3689-3701. ference Decision and Control.New Orleans,USA,2007: [30]REN W.On consensus algorithms for double-integrator dy- 2937-2942. namics J].IEEE Transactions on Automatic Control, [18]SU Housheng,WANG Xiaofan,LIN Zongli.Flocking of 2008,53(6):2295-2300. multi-Agent with a virtual leader,Part II:with a virtual [31]REN W.Collective motion from consensus with Cartesian leader of varying velocity [C]//Proceedings of the 46th coordinate coupling[J].IEEE Transactions on Automatic IEEE Conference Decision and Control.New Orleans, Control,2009,54(6):1330-1335. USA,2007:1429-1434. [32]CAO Y C,REN W.Sampled-data formation control under [19]SHI H,WANG L,CHU T G.Virtual leader approach to dynamic directed interaction[C]//2009 American Control coordinated control of multiple mobile Agents with asym- Conference.St Louis,USA,2009:5186-5191. metric interactions[J].Physica D,2006,213:51-65. [33]WANG Xiaoli,HONG Yiguang.Finite-time consensus for [20]JAGBABAIE A,LIN J,MORRSE A S.Coordination of multi-Agent networks with second-order Agent dynamics groups of mobile autonomous Agents using nearest neighbor [C]//Proceedings of the 17th Intemational Federation of rules[J].IEEE Transactions on Automatie Control,2003, Automatic Control World Congress.Seoul,Korea,2008: 48:988-1001. 15185-15190. 21]OLFATI-SABER,MURRAY R M.Agreement problems in [34]XIAO F,WANG L.State consensus for multi-Agent sys- networks with directed graphs and switching topology tems with switching topologies and time-varying delays[J]. [C]//Proceedings of the IEEE Conference on Decision Interational Joumal of Control,2006,79 (10):1277- and Control..Maui,HΠ，USA,2003:41264132 1284. [22]OLFATI-SABER R,MURRAY R M.Consensus protocols [35]BAUSO D,GIARRE L,PESENTI R.Non-linear protocols for networks of dynamic Agents C]//Proceedings of the for optimal distributed consensus in networks of dynamic American Control Conference.Denver,USA,2003:951- Agents[J].Systems and Control Letters,2006,55(11): 956. 918-928. [23]OLFATI-SABERR,MURRAY R M.Consensus problems [36]HU Jiangping,HONG Yiguang.Coordination for a group in networks of Agents with switching topology and time-de- of autonomous mobile Agents with multiple leaders[C]/ lays[J].IEEE Transactions on Automatic Control,2004, Proceedings of the 25th Chinese Control Conference.Har 49:1520-1533. bin,China,2006:318-322. 24 MOREAU L.Stability of continuous-time distributed con- [37]HU Jianping,HONG Yiguang.Leader-following coordina- sensus algorithms[C]//Proceedings of the 43rd IEEE tion of multi-Agent systems with coupling time delays[J]. Conference Decision and Control.Atlantis,Paradise Is- Phy9icaA,2007,374:853-863. land,Bahamas,2004:3998-4003. [38]REN W.Consensus tracking under directed interaction to- [25]REN W,BEARD R W,MCLAIN T W.Coordination vari- pologies:algorithms and experiments[C]//2008 American ables and consensus building in multiple vehicle systems Control Conference.Seattle,USA:742-747. [J].Lecture Notes in Control and Information Sciences, [39]LI Tao,ZHANG Jifeng.Mean square average-consensus 2004,309:171-188. under measurement noises and fixed topologies:necessary [26]REN W,BEARD R W.Consensus seeking in multi-Agent and sufficient conditions[J].Automatica,2009,45: systems under dynamically changing interaction topologies 1929-1936. [J].IEEE Transactions on Automatic Control,2005,50 [40]王炳昌，张纪峰.非平衡拓扑和随机干扰情形下多自 (5):655-661. 主体系统的趋同条件[J].系统科学与数学，2009,10：

第1期刘佳等：多智能体系统及其协同控制研究进展 9▣ 1353-1365 [47]承向军，杜鹏，杨肇夏.基于多智能体的分布式交通 WANG Bingchang ZHANG Jifeng.Consensus conditions 信号协调控制方法[J].系统工程理论与实践，2005， of multi-Agent systems with unbalanced topology and sto- &:130-135. chastic disturbances [J].Journal of Systems Science and CHENG Xiangjun,DU Peng,YANG Zhaoxia.A distribu- Mathematical Sciences,2009,10:1353-1365. ted and coordinated traffic signal control approach based on [41]MA Cuiqin,LI Tao,ZHANG Jifeng.Leader-following multi-Agent system [J].Systems Engineering Theory consensus control for multi-Agent systems under measure- Practice,2005,8:130-135. ment noises Cl//Proceedings of the 17th International [48]ZHANG H T.CHEN MZ.STAN G B.et al.Collective Federation of Automatic Control World Congress.Seoul, behavior coordination with predictive mechanisms [J]. Korea,2008::1528-1533, EEE Circuits and Systems Magazine,2008,8(3)1:67- [42]李永强，徐克虎，孙成松.基于Agent的坦克分队CGF 85 中的通讯机制研究[J]1.计算机仿真，2005,22(5))：作者简介 31-34. 刘佳，女，1982年生，博士研究 LI Yongiang,XU Kehu,SUN Chengsong.Communica- 生，主要研究方向为多智能体系统控 tion mechanism of tank unit CGF based on Agent [J]. 制、复杂系统建模与控制.发表学术论 Computer Simulation,2005,22(5):31-34. 文6篇，被SCI、EI收录4篇」 [43]]PARKER L E.Designing control laws for cooperative A- gent teams[C]//Proceedings of IEEE Intemational Confer- ence on Robotics and Automation.Atlanta,USA,1993 582-587. 陈增强，男，1964年生，教授、博士 [44]CHANDLER P R,PACHTER M,RESMUSSEN S.Uav 生导师，中国系统仿真学会理事，中国 cooperative control [C]//Proceedings of the American 自动化学会控制理论专业委员会委员， Control Conference.Arlington,USA,2001::50-55. 中国自动化学会过程控制专业委员会 [4罗旭.基于Agent的防空兵群火力分配模型[J],舰委会，中国优选法统筹法与经济数学研船电子工程，2009,29(4)：47-48,68. 究会复杂系统专业委员会理事.主要研 LUO Xu.A model of firepower distribution for airdefense 究方向为智能预测控制、混沌系统与复杂网络、多智能 group based on Agent[J].Ship Electronic Engineering, 体系统控制等.获省部级科技进步奖4次.发表学术论文 2009,29(4)):47-48,68. 100余篇，被SCI检索70余篇： [4]欧海涛，张卫东，张文渊，等.基于多智能体技术的城市智能交通控制系统[刀：.电子学报，2000,28(12)：刘忠信，男，1975年生，副教授，中 52-55. 国系统仿真协会会员，主要研究方向 OU Haitao.ZHANG Weidong.ZHANG Wenyuan.et al. 为复杂网络、计算机控制、控制理论 Urban intelligent traffic control system based on multi-A- 与控制工程.获省部级科技进步奖1 gent technology[J]].Acta Electronica Sinica,2000,28 次.发表学术论文50余篇，被SCI、E1 (2:52-55. 检索20余篇

陈增强,男,1964年生,教授、博士生导师,中国系统仿真学会理事,中国自动化学会控制理论专业委员会委员, 中国自动化学会过程控制专业委员会 [48] ZHANG H T, CHEN M Z, STAN G B,et al. Collective behavior coordination with predictive mechanisms [J]. EEE Circuits and Systems Magazine,2008,8(3) : 委会,中国优选法统筹法与经济数学研究会复杂系统专业委员会理事.主要研 67- 85. [46] 欧海涛,张卫东,张文渊,等.基于多智能体技术的城市智能交通控制系统[J] .电子学报,2000,28(12) : 52-55. WANG Bingchang,ZHANG Jifeng. Consensus conditions of multi-Agent systems with unbalanced topology and stochastic disturbances [J]. Journal of Systems Science and Mathematical Sciences,2009,10: 1353-1365. OU Haitao,ZHANG Weidong,ZHANG Wenyuan,et al. Urban intelligent traffic control system based on multi-Agent technology[J] . Acta Electronica Sinica,2000,28 (12) : 52-55. 刘佳,等: 多智能体系统及其协同控制研究进展 ·9· 刘佳,女,1982年生,博士研究生,主要研究方向为多智能体系统控制、复杂系统建模与控制.发表学术论文6篇,被SCI、EI收录4篇. 1353-1365. 第1期 [41] MA Cuiqin,LI Tao,ZHANG Jifeng. Leader-following consensus control for multi-Agent systems under measurement noises [ C]//Proceedings of the 17th International Federation of Automatic Control World Congress. Seoul, Korea,2008: 1528-1533. [42] 李永强,徐克虎,孙成松.基于Agent的坦克分队CGF 中的通讯机制研究[J] .计算机仿真,2005,22(5) : 31-34. [43] PARKER L E. Designing control laws for cooperative Agent teams[ C]//Proceedings of IEEE International Conference on Robotics and Automation. Atlanta,USA,1993: 582-587. LI Yongiang,XU Kehu,SUN Chengsong. Communication mechanism of tank unit CGF based on Agent [J]. Computer Simulation,2005,22(5) :31-34. LUO Xu. A model of firepower distribution for airdefense group based on Agent[J]. Ship Electronic Engineering, 2009,29(4) : 47-48,68. [45] 罗旭.基于Agent的防空兵群火力分配模型[J] . 舰船电子工程,2009,29(4) : 47-48,68. 作者简介: [44] 刘忠信,男,1975年生,副教授,中国系统仿真协会会员.主要研究方向为复杂网络、计算机控制、控制理论与控制工程.获省部级科技进步奖1 次.发表学术论文50余篇,被SCI、EI 检索20 余篇. CHANDLER P R,PACHTER M,RESMUSSEN S. Uav cooperative control [C] //Proceedings of the American Control Conference. Arlington,USA,2001: 50-55. [47] 承向军,杜鹏,杨肇夏.基于多智能体的分布式交通信号协调控制方法[J].系统工程理论与实践,2005, 8: 130-135. CHENG Xiangjun,DU Peng,YANG Zhaoxia. A distributed and coordinated traffic signal control approach based on multi-Agent system [J]. Systems Engineering Theory & Practice,2005,8: 130-135. 究方向为智能预测控制、混沌系统与复杂网络、多智能体系统控制等.获省部级科技进步奖4次.发表学术论文 100余篇,被 SCI 检索70余篇

点击进入文档下载页（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录