第5卷第1期 智能系统学报 Vol.5 No.1 2010年2月 CAAI Transactions on Intelligent Systems Feh.2010 doi:10.3969/j.issn.16734785.2010.01.001 多智能体系统及其协同控制研究进展 刘佳,陈增强,刘忠信 (南开大学信息技术科学学院,天津300071) 摘要:对多智能体系统及其协同控制理论研究和应用方面的发展现状进行了简要概述.首先给出Aget及多Aget 系统的概念和特性等,介绍了研究多Agent系统协同控制时通常用到的代数图论;然后综述了近年来多Aget系统 群集运动和协同控制一致性方面的研究状况,并讨论了其在军事、交通运输、智能机器人等方面的成功应用:最后, 对多Agent系统未来的发展方向进行了探讨和分析,提出几个具有理论和实践意义的研究方向,以促使多Aget系 统及其协同控制理论和应用的深入研究. 关键词:多Aget系统(MAS);协同控制;代数图论;群集运动;一致性协议 中图分类号:TP18文献标识码:A文章编号:16734785(2010)01000109 Advances in multi-Agent systems and cooperative control LIU Jia,CHEN Zeng-qiang,LIU Zhong-xin (College of Information Technology Science,Nankai University,Tianjin 300071,China) Abstract:Progress in multi-Agent systems with cooperative control was reviewed in terms of theoretical research and its applications.First,concepts and features used to define Agents and multi-Agents were analyzed.Then graph theory was introduced,since it is often used in research on cooperative control of multi-Agent systems.Then ad- vances in swarming/flocking as well as the means used to derive a consensus among multi-Agents under cooperative control were summarized.The application of these abilities was discussed for the military,transportation systems, and robotics.Finally,future developments for multi-Agent systems were considered and significant research prob- lems proposed to help focus research on key questions for multi-Agent systems with cooperative control. Keywords:multi-Agent system (MAS);cooperative control;graph theory;swarming/flocking;consensus protocol 分布式人工智能是人工智能领域中一个重要的控制的角度对MA$进行分析与研究已经成为国内 研究方问,而多Agent系统(muli-Agent system, 外众多学术机构的关注热点,人们在MAS协同控制 MAS)则是其一个主要的分支.20世纪90年代,随 问题上做了大量的研究工作,特别是在MAS群集运 着计算机技术、网络技术、通信技术的飞速发展,A- 动控制和协同控制一致性问题方面取得了很大的进 gent及MAS的相关研究已经成为控制领域的一个 展.目前对MAS的研究总体上来说还处于发展的初 新兴的研究方向.由于Agent体现了人类的社会智 步阶段,离真正的实用化还有一定的距离;但其广泛 能,具有很强的自治性和适应性,因此,越来越多的 的应用性预示着巨大的发展潜力,这必将吸引更多 研究人员开始关注对其理论及应用方面的研究.目 专家、学者投人到这一领域的研究工作中,对MAS 前,人们已经将MAS的相关技术应用到交通控制、 的理论及应用做进一步探索.根据上述目的,本文主 电子商务、多机器人系统、军事等诸多领域.而在 要概述了多智能体系统(MAS)在协同控制方面的 MAS中,Agent之间如何在复杂环境中相互协调,共 研究现状及其新进展 同完成任务则成为这些应用的重要前提.近年来,从 1 Agent与MAS的相关概念 收稿日期:2009-1129. 基金项目:国家自然科学基金资助项目(60774088,60904022):天津 市自然科学基金资助项目(09 JCYBJ0(01700). 1.1 Agent的概念 通信作者:刘佳.E-mail:liujia._0704@163.com Agent一词最早可见于Minsky于1986年出版
2 智能系统学报 第5卷 的《Social of Mind》一书中.国内文献中经常将Agent Agent有更多的优点.多个Agent相互合作能够完成超 翻译为:智能体、主体、代理等,但最常见的仍是采用 出它们各自能力范围的任务,使得MAS的整体能力大 英文“Agent'”;因为Agent的概念尚无统一标准,人 于个体能力之和.总体上说,MAS具有更广泛的任务领 们对于汉语中哪个词能更好地表达其含义还没有达 域、更高的效率、改良的系统性能、错误容忍、鲁棒性、 到共识. 分布式的感知与作用、内在的并行性、对社会和生命科 对于Agent的概念,目前还不存在一个普遍接 学的观察等显著特性] 受的精确定义,这主要是由于Agent的各种属性在 不同领域中的重要性不同.这里介绍2种被引用较 多的定义形式: 1)Maes在文献[1]中将Agent定义为:试图在 复杂的动态环境中实现一组目标的计算机系统。 作用范围 2)Wooldrige和Jennings在文献[2]中,从Agent 的特性方面给出其弱定义和强定义.弱定义是指A 环境 gent用来最一般地说明一个软硬件系统,它具有以 图2环境中的MAS 下几个特性:a)自治性(autonomy):Agent可以在没 Fig.2 Multi-Agent system in environment 有人或其他Agent的干扰下直接运作,而且对自己 图2描述了MAS中Agent之间以及Agent与环 的行为和内部状态有某种控制能力;b)社会性(s0 境之间的关系.从图中可以看出,MAS中的交互关 cial a山bility):Agent可以与其他Agent(也可以是人) 系是非常复杂的,各个Agent之间的交互可以是双 进行通信交流;c)反应性(reactivety):Agent可以感 向的,例如:Agent2和Agent3、Agent4和Agent5; 知环境,并可以对环境发生的变化做出相应的反应; 这种关系也可以是单向的,例如Agent1和Agent2、 d)预动性(pro-activeness):Agent不仅仅是简单地对 Agent1和Agent4、Agent4和Agent3.系统中的A- 周围环境做出反应,也可以通过接受某些启动信息, gent可以在环境中动作,不同的Agent有不同的“作 主动发起可以表现目标引导的行为.强定义是指A- 用范围”,表示它们可以影响环境的不同部分,而A gent除了具备以上弱定义中的所有特性外,还具备 ent也同时受其作用范围内环境的影响.在有些情 一些人的特性.比如信念(belief)、知识(knowledge) 况下,不同Agent的作用范围可能会重叠,例如图2 等描述信息状态的行为;意图(intention)、承诺 中Agent2和Agent3、Agent3和Agent4的作用范 (commitment)等描述协商状态的行为;期望(de 围存在相互重叠的区域.这种影响范围重叠的事实 sire)、目标(goal)等描述动机状态的行为. 会产生Agent之间的依赖关系.另外,Agent也存在 Agent 不与环境相互影响的情况,例如图2中的Agent1. 传 作输出 1.3MAS的组织结构 输 MAS的组织结构是指系统中Agent之间的信息 环境 关系和控制关系,以及问题求解能力的分布模式.组 织结构是MAS中很多问题的研究基础,因此,如何 图1环境中的Agent 将各个Agent有效地组织起来,以便使Agent之间 Fig.1 The Agent in environment 图1给出了一个环境中Agent的抽象示意图, 及Agent与环境之间的各种协作顺利进行,对MAS 从图中可知,Agent接受从环境中感知的输人,并产 的研究非常重要, 生输出动作作用于环境,这种交互通常是一个连续 MAS的组织结构可以是集中式的或分布式的, 不断的过程.Agent不能完全控制它周围的环境,只 也可以是这2种形式都存在的混合式组织结构.不 能通过动作输出影响环境. 同的组织结构行为方式不同,因此性能也会有所不 1.2MAS的概念 同.一般地,MAS的组织结构主要分为以下3种类 MAS是由多个Agent组成的集合,Agent之间以及 型4: Agent与环境之间通过通讯、协商与协作来共同完成单 1)行政管理组织结构(集中式) 个Agent所不能解决的问题.多个Agent的使用比单个 这是一种主从式层次结构,在这种结构中,所有
第1期 刘佳,等:多智能体系统及其协同控制研究进展 ·3 Agent组成一个Aget团体.根据Agent的工作范围 阵构成的.无向边集合中,结点没有起点和终点之分, 和职能,可将其分为 也就是说,(:,)就意味着(,:),因此,无向图是有 a)管理Agent:负责MAS的管理,一般一个系统 向图的一种特殊情况.一个结点”:的入度和出度分别 中只有一个管理Agent; 用degn(:)和deg(:)来表示,且 b)功能Agent:具有通用的任务执行能力,能够 协助管理Agent完成一些系统任务,是一类不受应 dga)=Ao.dg(a)=月o 用领域影响的工具Agent; 图G中的结点:是平衡的(balanced)当且仅当 c)应用Agent:具有特殊领域中的事务处理功 该结点的入度和出度相等,即degm(:)= 能,一般一个系统中有多个应用Agent. degom(:).图G是平衡图的充分必要条件是这个图 2)完全自治式组织结构(分布式) 中所有结点都是平衡的,即有 在这种结构中,Agent之间没有管理与被管理 degin(v:)=degou(:),Vi∈L. 的关系,每个Agent都可以自主地实现自己的目标. 一个有向图G是强连通的(strongly connected) 这种方式最能体现MAS的灵活性、社会性和每个 当且仅当图G的任意的2个不同结点之间有一条 Agent的自治性,但这种方式运行的稳定性和可控 有向路径.一个有向图包含生成树,当且仅当它有一 个根结点,从任意的其余结点出发,都存在路径可以 性较差 到达这个根结点. 3)问题求解组织结构(混合式) 权重图的Laplacian矩阵定义为L=[l;],其 这是Agent为了协同完成一项任务而形成的一 种动态组织结构,各Agent之间的关系式是动态变 中,l=∑4,对于ij,g=-a到 2.2MAS群集运动及控制研究 化的.从Agent之间的关系来看,这种结构介于主从 MAS群集(Swarming/Flocking)行为是复杂性 式与完全自治式结构之间. 科学的一个焦点问题.Swarming是指一个由大量自 2MAS协同控制研究进展 治个体组成的集合,在无集中式控制和全局模型的 情况下,一般通过个体的局部感知作用和相应的反 经过20多年的发展,MAS的研究已经在理论和 应行为,使整体呈现出涌现行为.在一个MAS中,所 应用方面取得了很大的进展.MAS一个显著特征是: 有的Agent最终能够达到速度矢量相等,相互间的 系统中每个Agent的能力有限,而大量这样的个体聚 距离稳定,则被称为Flocking问题.自然界中存在很 集到一起,通过相互作用会产生有意义的社会活动或 多群集行为,例如:鸟群迁徙时会整齐编队,在遇到 完成单个Agent所不能完成的任务.因此,MAS研究 障碍时,这种队形还可以自动调整:野生动物群和鱼 领域中一个重要的问题就是设计正确的控制策略,使 群在遇到攻击时会形成一个合理的编队逃跑,而不 MAS完成给定任务,即MAS的协同控制问题.近年 是一哄而散;蚁群在觅食时能够在食物与居住地之 来,MAS的协同控制已经成为国内外诸多研究人员 间选取一条最优路径,并且,当环境变化时,它们会 关注的热点问题,本节先简要介绍研究协同控制问题 对路径进行重新选择.这些是群集行为极具代表性 通常使用的代数图论,然后从MAS群集运动和协同 的例子 控制一致性问题2个方面,论述近年来国内外在多 1987年,Reynolds提出一个模仿动物聚集的计 Agent协同控制方面的研究发展状况 算机模型,这个基本的群集模型包括3条规则: 2.1代数图论 1)聚集(cohesion):所有Agent改变当前位置并向其 有向图G=(V,E,A)由一个有限顶点(或结点) 邻近成员的平均位置运动;2)分离(separation):运 集合V={,2,…,vn}、一个有向边的集合ECV×V 动过程中,相邻的Agent避免发生碰撞;3)调整(a- 和权重矩阵A所构成.eg=(:,)∈E叫做边,第1 lignment):所有Agent速度大小和方向改变基于其 个元素:称为边的起点,第2个元素巴称为边的终 邻近成员的平均值。 点,边的方向从:指向v连接权值矩阵为A=[a], 1995年,Vicsek等人提出了多自主移动Agent 且对于i∈I(1=1,2,…,n)有:i≠j,ag>0,对于 模型[61: Vi∈I:a=0.类似地可以定义无向图,无向图是由一 x(t+1)=x:(t)+:(t)△t,i=1,2,…,n 个有限顶点(或结点)集合、一个无向边集合和权重矩 式中:x:(t)为第i个Agent在t时刻的位置向量,在
智能系统学报 第5卷 每个时间段根据上式更新,y:(t)为速度向量,由一 的势能场函数梯度有界时,给出群体聚集的收敛条件 个定常的绝对速度v和一个方向角0,(t)决定,0:(t) 和一个表示群体大小的上界.Yu和Wang等在文献 按下式更新: [15]中基于动态时变有领航者的网络拓扑,用图论模 0:(t+1)=,+△0,i=1,2,…,n. 型表示Agent之间的相互作用及通信关系,运用推广的 式中,是以Agent i为中心,以r为半径的 Lyapunov理论及非平滑分析进行了稳定性分析,并得 圆盘内所有Agent(包Agent i)的平均方向,△0是服 到所有Agent速度方向收敛到同一方向并与leader保 从均匀分布的随机数,表示干扰.实质上,Vicsek模 持一致;所有Agent速度大小收敛并与leader相同;相 型是Reynolds模型的一种特殊情况,他只考虑了 邻Agent之间没有碰撞发生;所有Agent的人工势场函 Reynolds提出的3条规则中的调整.Vicsek等还通 数被最小化等重要结论.他们还在文献[16]中对具有 过一系列有趣的仿真结果说明,尽管没有集中的协 二次积分动态的Agent群体,在有向网络取得群集运动 调,并且每个Agent的最邻近的集合在系统演变的 进行了研究,提出了一个分散控制方法对Agent群体进 过程中随时间而改变,模型所采取的“最邻近规则” 行分散控制.另外,XF.Wang和L.Wang等还利用 却能够使所有Agent的运动方向最终趋于一致, 一种虚拟leader对多Agent群集运动进行稳定性分 Tanner等在文献[7-8]中从理论方面解释了 析n-o Reynolds提出的计算机模型,他们分别针对固定拓 2.3MAS一致性问题研究 扑和切换拓扑2种情形,对多Agent群集行为建立 目前,对于多Agent群集行为的研究,通常将位 了数学模型,并运用代数图论、非平滑分析及非平滑 置聚合和速度匹配问题单独拿出来研究,即不考虑多 系统理论等数学工具、经典控制理论及人工势场法, Agent之间是否发生碰撞,这就是所说的一致性问题. 设计了局部分散控制策略,使得Agent群体达到运 一致性(consensus)是指在一个MAS中,所有的Agent 动方向全局收敛到同一方向、速度大小收敛到同一 最终状态能够趋于一致.一致性协议(算法)则是 值、相邻的Agent之间没有碰撞发生及人工势场函 MAS中,使个体状态最终趋于一致的Agent之间的信 数被最小化的理想状态.在文献[9]中,他们又提出 息传递规则.近年来,国内外专家、学者们在MAS一 一种非平滑控制策略,使得一组Agent做群集运动 致性问题的研究中取得很多成果,提出多种不同情况 时避免相互碰撞,且避开环境中的静态障碍.在文献 下MAS协同控制一致性协议,下面将对已有的一致 [l0]中,Olfati-Saber则设计了一个局部控制策略, 性控制算法进行简单的总结, 使得Agent群体取得群集运动的同时避免与环境中 设系统中有n个多Agent.,用x:表示第i个A 的多个凸型障碍发生碰撞,并说明控制规则中隐含 get的状态,这个状态可以是位置、速度、振幅等等. 了Reynolds模型中的3条规则.Liu等人给出了 连续时间线性一致性协议通常可以写成如下形 在固定通信拓扑下m维多移动Agent的群集行为稳 式2025 定性分析.Gaai等2]还在Agent群体模型中加入了 :(t)=∑ag(x(t)-(). (1) jeRe) 环境模型,指出决定每个个体运动的3个因素:1) 式中:J:(t)表示在t时刻传送信息给第i个Agent的 与距离较远的个体相互吸引;2)与距离较近的个体 邻居集,α;是一个非负权值因子.也就是说,每一时 相互排斥;3)被感兴趣的区域吸引或排斥不感兴趣 刻每个Agent的状态都取决于在那一时刻它所有邻 的区域,说明Agent群体聚集行为是Agent之间相 近Agent的状态.特别地,如果每个Agent的邻居集 互作用,Agent与环境相互作用平衡的结果.他们还 和权值因子从初始时刻开始一直保持不变,那么这 针对不同环境,对系统的稳定性进行了分析,给出系 个MAS就具有固定拓扑结构.此时,连续时间线性 统收敛到更有利区域的条件.Wang等在文献[13] 一致性协议为 中讨论了n维空间内MAS群集行为,根据动态A x=-x. (2) gent之间的局部作用和信息交换,设计了一组控制 式中:L为权重图的Laplacian矩阵,x= 策略使得MAS按所期望的形式做群集运动 [2…xn]T 上述文献在无向网络中考虑了同类MAS的群体 离散时间线性一致性协议为27 聚集运动.针对一类由领航者(leader)和跟随者(follo- x[k+1]=-∑B[k]x[h]. (3) wer)2种个体组成的MAS聚集模型,文献[14]在环境 je]ui
第1期 刘佳,等:多智能体系统及其协同控制研究进展 ·5 式中:∑uP,[]=1,B,[]>0.也就是说, 的充要条件是0≤o≤π/2入m(L)[s1.在文献[28] 每个Agent的下一步状态是根据它及与其相邻的所 中,作者还进一步讨论了时变时滞拓扑结构下MAS 有Agent的当前状态更新的.可以将离散时间线性 的平均一致性收敛条件.需要指出的是,目前对于有 一致性协议式(3)写成矩阵形式: 向网络拓扑结构下时变时滞一致性协议的研究还比 x[k+1]=D[k]x[k]. (4) 较少;另外,在某些Agent之间传输信息出现错误的 式中:D[k]为所有行和为1的随机矩阵 情况下,怎样确保整个MAS也能达到协同控制的要 在一个MAS中,如果对于任意的i≠j,当t→∞ 求是一个对实际应用非常有意义的课题, 时,有‖x:()-x,(t)‖0,则系统的最终状态可以 一阶积分一致性协议式(1)也可以推广到二阶 趋于一致.0 lfati-Saber等在文献[21,23]中指出,如 积分动态系统,此时,一致性协议为90 果MAS的拓扑结构是强连通的有向图,那么对于任 =-∑ag()[(-)+y(-)].(8) 意初始状态,系统的状态渐近收敛,并且在强连通的 式中,y为一个正的增益.文献[31]还在已有的二 有向拓扑结构下,系统平均一致收敛的充分必要条 次积分系统的一致性协议中引入旋转矩阵,讨论了 件是信息交换图是平衡图.Ren等人在文献[25-26] 三维空间中一组多Agent的一致性问题,说明了网 中给出时不变信息交换拓扑结构下,连续或离散时 络拓扑、阻尼增益、欧拉角的值均能影响到多智能体 间协议达到渐近一致的充分必要条件,即信息交换 一致性运动结果.针对动态有向作用下二次积分动 图中包含生成树.这个条件比文献[21,23]中提出 力学系统,文献[32]研究了2种采样离散时间编队 的强连通条件弱,适用范围更广. 控制的一致性协议.在文献[33]中,Wang等还进一 在实际应用中,由于网络节点或边的故障、重 步考虑了具有二次积分动态系统的有限时间一致性 连、丢包等;又或者在某些特定场合,如蜂拥问题、编 问题 队控制问题、次同步问题等,网络拓扑结构经常是变 在许多实际应用场合,对MAS的协同控制是在 化的,通常把这种动态拓扑结构称为网络切换拓扑 某些约束条件下进行的.例如,控制输入是有界的,期 结构.文献[23]给出MAS在切换拓扑结构下的一 望所有的Aget最终都收敛到一个特定值或是特定 致性协议: 区域.Ren等在文献[30]中分析了有界控制输入约束 x(t)=-Lx(t),k =s(t). (5) 条件下二阶积分系统的渐近收敛问题.文献[34]则是 式中:Lk=L(G)是图集T中权重图G的Laplacian 在切换拓扑结构下,研究了具有有界时变通信时间延 矩阵,s()为定义切换拓扑结构的切换信号.文献 迟的离散MAS系统一致性问题.Bauso还在固定拓扑 [21,23]给出切换拓扑结构中系统在任意切换信号下 结构下讨论了非线性一致性协议的收敛问题,使得所 平均一致收敛的充分条件.在文献[22]中,0fati-Sa 有Agent最终收敛到一个特定值], ber等基于Lyapunov泛函方法,分析了动态系统在无 另外,许多文献还在MAS中包含leader和follo- 向拓扑网络机构下连续时间非线性一致性协议: wer2种类型Agent的情况下,讨论了系统的一致性 (t)=∑中g(()-x() (6) 问题.文献[36]分别在固定拓扑和切换拓扑2种结 jej(t) 式中:中(z)=中:(z),且满足:1)中(z)是局部 构下,研究了带有多个leader的MAS的一致性问 Lipschitz连续的;2)中g(z)=0z=0:3)zφ财(z)> 题,指出其他Agent最终能收敛到以多个leader为 0,Hz≠0. 顶点的多面体中,文献[37]则研究了具有时变时滞 在MAS中,当Agent之间的信息交换存在时间 及动态leader的MAS在固定拓扑和切换拓扑结构 延迟时,连续时间线性一致性协议式(1)将写成如 下的一致性问题.Ren还在文献[38]中分析了具有 下形式23,8 有界控制输入的一致性跟踪协议,并在leader动态 变化和切换信息交换网络拓扑结构下,给出一致性 ,(t)=-∑ag(x,(t-0g)- 跟踪协议的收敛条件;他们还利用多机器人实验平 x(t-o)). (7) 台,将一致性跟踪协议结果应用于编队控制, 式中,σ;>0表示系统中Agent之间信息交换时的时 以上这些研究工作都是假设Agent信息交换渠 间延迟.对于一种最简单的情形,即σg=σ且信息交 道是非常理想化的,即每个Agent能从与它邻近的 换拓扑结构是固定无向的连接图,系统平均一致收敛 Agent那里得到准确的信息.而在实际应用中,Agent
.6 智能系统学报 第5卷 发送、接收信息及信息传输过程中经常会受到干扰, 定因素多等特点.MAS理论的出现和发展为交通系 例如:热干扰、信道衰减等.因此,在存在随机干扰的 统的研究提供了一种新的思路和方法,引起了诸多 情形下讨论MAS的一致性问题就显得更有实际意 研究学者的关注.目前,MAS在交通控制领域的应 义了.Li和Zhang在文献[39]中讨论了具有可测噪 用已经成为一个日趋成熟的研究方向.文献[46]采 声的固定有向拓扑结构下MAS的均方平均一致性 用多Agent协调控制方法来协调相邻交叉口处的控 问题.为了降低可测噪声的影响,他们将时变一致性 制信号,以消除网络中的交通拥塞.Cheng等则在文 增益引入到一致性协议中,利用图论和随机理论,分 献[47]中提出了一种基于多智能体的分布式交通 析了这种协议的收敛性.Wang和Zhang 401则在一般 信号协调控制方法, 有向通信拓扑和高斯通信噪声的影响下,给出MAS 另外,空中交通管理系统也是MAS协同控制方 的一致性条件,利用马氏链的结果得到一个网络节 法在交通运输控制方面应用的另一重要领域.随着 点的互通类,通过对噪声影响的细化,给出了不同噪 世界经济的快速发展,空中交通拥挤将成为一个世 声情形下系统的一致性条件.这里研究的有向图不 界范围内的难题.澳大利亚人工智能研究所基于多 仅包含平衡图,也包含非平衡图,推广了文献[39] Agent的思路设计实现了一个空中交通管理系统, 中的结果.在文献[41]中,作者则讨论了在具有可 系统中每个Agent负责一个空中交通系统中的子问 测通信噪声影响下有leader的MAS的一致性问题, 题,并与其他Agent进行协调与协作,以便实现整个 给出了一个使得系统在固定拓扑结构下强均方一致 系统的目标任务, 的充分条件,并指出在无噪声情况下,此条件是充分 3.3智能机器人方面 必要的, 近年来,多移动机器人系统的协同控制问题已 3 成为一个新兴的研究热点,而此问题的理论研究已 多Agent协同控制的应用 经在很多领域中得到应用.日本的机器人足球世界 MAS的理论研究在近些年受到很大关注的一 杯锦标赛RoboCup就是一个非常典型的例子.在机 个重要原因是,MAS及其协同控制问题在许多领域 器人足球赛中,多个机器人之间的关系相当复杂,它 具有十分广泛的应用.例如,利用无人驾驶飞行器或 们必须通过互助合作才能共同完成任务,这是MAS 自治水下机器人应用于复杂作业、未来的自治性战 协同控制应用的一个典型实例.在工业方面,MAS 争体系、智能交通控制系统等等.本节将从军事、交 协同控制的应用表现在,人们控制多个智能机器人 通运输、智能机器人3个方面介绍MAS协同控制的 以特定队形搬运单个物体,利用多个智能机器人替 典型应用 代人类进行危险作业.在军事方面还可以利用多机 3.1军事方面 器人群体进行侦查、巡逻等 现代军事系统正日趋先进,而MAS的理论也应 用到了军事仿真系统的研究中.Li等2对一种对话 4MAS协同控制的研究展望 模式的坦克智能体之间的通讯机制进行了构建,为 随着计算机科学以及网络技术的发展,多A 在坦克分队仿真开发中通讯机制有效性、可靠性、透 gent的应用领域将会更加广阔.目前,MAS协同控 明性的提高提供了有力的参考.Parker]已经在早 制方面的研究已经取得很大进展,但仍存在许多问 期的工作中对飞机编队飞行问题进行了研究,他利 题,有待进一步研究 用局部信息和全局信息相结合的方式设计控制率以 1)在MAS协同控制的研究中,Agent之间在进 保持编队.多Agent协同控制在军事中的应用还包 行信息交换时一般会存在时间延迟现象.已有的很 括允许战斗机按照自己的路线飞行,以避免雷达,达 多文献讨论了MAS协同控制的时滞一致性算法,但 到局部优化4].文献[45]还利用MAS技术构建火 大多是在无向网络(有向网络的特殊情况)拓扑结 力分配模型,实现火力模型通用化、智能化,使火力 构下考虑的.因此,讨论信息交换时存在时滞(尤其 分配更精确、高效 是时变时滞)的有向拓扑结构下多Agent协同控制 3.2交通运输控制方面 -致性问题将是非常有意义的.另外,Agent之间的 城市交通系统是由人和交通工具等组成的动态 信息传递可能会出现错误,对出现信息传递错误的 复杂系统,具有影响因素多、开放性强、随机及不确 MAS协同控制问题的研究也具有深刻的实际意义
第1期 刘佳,等:多智能体系统及其协同控制研究进展 ·7 2)在实际应用中,MAS中每个Agent发送和接 [4]李英.多Agent系统及其在预测控制与智能交通系统 收信息,及信息传输过程中往往会存在着许多干扰, 中的应用[M].上海:华东理工大学出版社,2004:15- 而目前关于在有随机噪声的通信环境下研究多A- 25 gent协同控制一致性问题的文章还比较少,因此,研 [5]REYNOLDS G.Flocks,birds and schools:a distributed behavioral model[J].Computer Graphics,1987,21(1): 究MAS在通信环境存在随机干扰情况下的协同控 25-34. 制一致性算法及其稳定性是可待研究的方向.另外 [6]VICSEK T,CZIROK A,BENJACOB E,et al.Novel type 还可在此基础上进一步考虑Agent之间避免发生碰 of phase-transition in a system of self-driven particles[J]. 撞的条件,从而,对存在随机干扰的通信环境下 Physical Review Letters,1995,75(6):1226-1229. MAS的群集运动做一些深刻的研究. [7]TANNER H G,JADBABAIE A,PAPPAS G J.Stable floc- 3)预测控制作为近年来新型计算机控制算法,汲 king of mobile Agents,Part I:fixed topology[C]//Pro- 取了优化控制的思想,但利用滚动的有限时段优化取 ceedings of the IEEE Conference on Decision and Control. 代一成不变的全局优化,这种建立在实际反馈信息基 Maui,HΠ,USA,2003:2010-2015. 础上的反复优化,具有更强的鲁棒性.Zhang等已经 [8]TANNER H G,JADBABAIE A,PAPPAS G J.Stable floc- 在文献[48]中研究了预测机制下MAS的协同控制的 king of mobile Agents,Part II:dynamic topology[C]/ Proceedings of the IEEE Conference on Decision and Con- 一些问题,但此类问题的研究还处于初步阶段;所以, trol.Mai,HⅢ,USA,2003:2016-2021. 对于预测机制下MAS群集行为及协同控制一致性问 [9]TANNER H G.Flocking with obstacle avoidance in swite- 题的研究具有极大的理论及现实意义, hing networks of interconnected vehicles[C]//Proceedings 4)为了能将MAS的相关理论更好地应用于实 of the IEEE International Conference on Robotics and Auto- 践,MAS或者多机器人系统的仿真平台研究也是相 mation.New Orleans,USA,2004:3006-3011. 当重要的.目前,国内外已经建立了一些这样的仿真 [10]OLFATI-SABER R.Flocking for multi-Agent dynamic sys 平台,但很多工作还有待进一步完善 tems:algorithms and theory[J].IEEE Transactions on Automatic Control,2006,51(3):76-95. 5结束语 [11]LIU Yang,PASSINO K N,POLYCARPOU M.Stability a- nalysis of M-dimensional asynchronous swarm with a fixed MAS及其协同控制已经成为当前学术界一个 communication topology[J].IEEE Transactions on Auto- 新的研究热点,吸引了许多不同领域研究人员的极 matic Control,2003,48(4):76-95. 大关注.本文讨论了与MAS有关的一系列问题,简 [12]GAZI V,PASSINO K M.Stability analysis of social fora- 要介绍了MAS协同控制方面的研究状况与应用,展 ging swarms J].IEEE Transactions on Systems,Man, 望了几个有待进一步研究的方向.虽然MAS及其协 and Cybemetics-Part B:Cybernetics,2004,34(1):539- 同控制相关问题的研究会存在很多问题和困难,但 557. 其应用前景是十分广阔的,相信在各领域专家、学者 [13]WANG L,SHI H,CHU T G,et al.Flocking control of 的共同努力下,多智能体系统控制方面的研究定能 groups of mobile autonomous Agents via local feedback 取得新的进展与突破, [C]//Proceedings of the IEEE International Symposium on Intelligent Control.Limassol,Cyprus,2005:441446. 参考文献: [14]李宗刚,贾英民.一类具有群体LEADER的多智能体 系统的聚集行为[J].智能系统学报,2006,1(2):26- [1]MAES P.Modeling adaptive autonomous Agent[J].Artifi- 30. cial Life6,1994,1(1/2):135-162 LI Zonggang,JIA Yingmin.Aggregation of multi-Agent [2]WOOLDRIGE M,JENNINGS N R.Intelligent Agents:the- systems with group leaders[J].CAAI Transactions on In- ory and practice [J].Knowledge Engineering Review, telligent Systems,2006,1(2):26-30. 1995,10(2):112-152. [15]俞辉,王永骥,程磊.基于动态拓扑有领航者的智 [3]俞辉。多智能体机器人协调控制研究及稳定性分析 能群体群集运动控制[J].系统工程与电子技术,2006, [D].武汉:华中科技大学,2007 28(11):1721-1724. YU Hui.Research on cooperative control and analysis of YU Hui,WANG Yongji,CHENG Lei.Control of flocking stability for multi-Agent robots[D].Wuhan:Huazhong U- motion of the flock with a leader based on dynamic topology niversity of Science and Technology,2007. [J].Systems Engineering and Electronics,2006,28
8… 智能系统学报 第5卷 (11):1721-1724. [27]MOREAU L.Stability of multi-Agent systems with time- [16]俞辉,王永骥,程磊.基于有向网络的智能群体群 dependent communication links[J].IEEE Transactions on 集运动控制[J].控制理论与应用,2007,24(1):79- Automatic Control,2005,50:169-182. 83. [28]BLIMAN P A,FERRARI-TRECATE G.Average consen- YU Hui,WANG Yongji,CHENG Lei.Flocking motion sus problems in networks of Agents with delayed communi- control of flock in directed networks[J].Control Theory cations[J].Automatica,2008,44(8):1985-1995. Applications,2007,24(1):79-83. [29]REN W,ATKINS E.Second-order consensus protocols in [17]SU Housheng,WANG Xiaofan,LIN Zongli.Flocking of multiple vehicle systems with local interactions C]// multi-Agent with a virtual leader,Part I:with a minority of AIAA Guidance,Navigation,and Control Conference and informed Agents[C]//Proceedings of the 46th IEEE Con- Exhibit.San Francisco,USA,2005:3689-3701. ference Decision and Control.New Orleans,USA,2007: [30]REN W.On consensus algorithms for double-integrator dy- 2937-2942. namics J].IEEE Transactions on Automatic Control, [18]SU Housheng,WANG Xiaofan,LIN Zongli.Flocking of 2008,53(6):2295-2300. multi-Agent with a virtual leader,Part II:with a virtual [31]REN W.Collective motion from consensus with Cartesian leader of varying velocity [C]//Proceedings of the 46th coordinate coupling[J].IEEE Transactions on Automatic IEEE Conference Decision and Control.New Orleans, Control,2009,54(6):1330-1335. USA,2007:1429-1434. [32]CAO Y C,REN W.Sampled-data formation control under [19]SHI H,WANG L,CHU T G.Virtual leader approach to dynamic directed interaction[C]//2009 American Control coordinated control of multiple mobile Agents with asym- Conference.St Louis,USA,2009:5186-5191. metric interactions[J].Physica D,2006,213:51-65. [33]WANG Xiaoli,HONG Yiguang.Finite-time consensus for [20]JAGBABAIE A,LIN J,MORRSE A S.Coordination of multi-Agent networks with second-order Agent dynamics groups of mobile autonomous Agents using nearest neighbor [C]//Proceedings of the 17th Intemational Federation of rules[J].IEEE Transactions on Automatie Control,2003, Automatic Control World Congress.Seoul,Korea,2008: 48:988-1001. 15185-15190. 21]OLFATI-SABER,MURRAY R M.Agreement problems in [34]XIAO F,WANG L.State consensus for multi-Agent sys- networks with directed graphs and switching topology tems with switching topologies and time-varying delays[J]. [C]//Proceedings of the IEEE Conference on Decision Interational Joumal of Control,2006,79 (10):1277- and Control..Maui,HΠ,USA,2003:41264132 1284. [22]OLFATI-SABER R,MURRAY R M.Consensus protocols [35]BAUSO D,GIARRE L,PESENTI R.Non-linear protocols for networks of dynamic Agents C]//Proceedings of the for optimal distributed consensus in networks of dynamic American Control Conference.Denver,USA,2003:951- Agents[J].Systems and Control Letters,2006,55(11): 956. 918-928. [23]OLFATI-SABERR,MURRAY R M.Consensus problems [36]HU Jiangping,HONG Yiguang.Coordination for a group in networks of Agents with switching topology and time-de- of autonomous mobile Agents with multiple leaders[C]/ lays[J].IEEE Transactions on Automatic Control,2004, Proceedings of the 25th Chinese Control Conference.Har 49:1520-1533. bin,China,2006:318-322. 24 MOREAU L.Stability of continuous-time distributed con- [37]HU Jianping,HONG Yiguang.Leader-following coordina- sensus algorithms[C]//Proceedings of the 43rd IEEE tion of multi-Agent systems with coupling time delays[J]. Conference Decision and Control.Atlantis,Paradise Is- Phy9icaA,2007,374:853-863. land,Bahamas,2004:3998-4003. [38]REN W.Consensus tracking under directed interaction to- [25]REN W,BEARD R W,MCLAIN T W.Coordination vari- pologies:algorithms and experiments[C]//2008 American ables and consensus building in multiple vehicle systems Control Conference.Seattle,USA:742-747. [J].Lecture Notes in Control and Information Sciences, [39]LI Tao,ZHANG Jifeng.Mean square average-consensus 2004,309:171-188. under measurement noises and fixed topologies:necessary [26]REN W,BEARD R W.Consensus seeking in multi-Agent and sufficient conditions[J].Automatica,2009,45: systems under dynamically changing interaction topologies 1929-1936. [J].IEEE Transactions on Automatic Control,2005,50 [40]王炳昌,张纪峰.非平衡拓扑和随机干扰情形下多自 (5):655-661. 主体系统的趋同条件[J].系统科学与数学,2009,10:
第1期 刘佳等:多智能体系统及其协同控制研究进展 9▣ 1353-1365 [47]承向军,杜鹏,杨肇夏.基于多智能体的分布式交通 WANG Bingchang ZHANG Jifeng.Consensus conditions 信号协调控制方法[J].系统工程理论与实践,2005, of multi-Agent systems with unbalanced topology and sto- &:130-135. chastic disturbances [J].Journal of Systems Science and CHENG Xiangjun,DU Peng,YANG Zhaoxia.A distribu- Mathematical Sciences,2009,10:1353-1365. ted and coordinated traffic signal control approach based on [41]MA Cuiqin,LI Tao,ZHANG Jifeng.Leader-following multi-Agent system [J].Systems Engineering Theory consensus control for multi-Agent systems under measure- Practice,2005,8:130-135. ment noises Cl//Proceedings of the 17th International [48]ZHANG H T.CHEN MZ.STAN G B.et al.Collective Federation of Automatic Control World Congress.Seoul, behavior coordination with predictive mechanisms [J]. Korea,2008::1528-1533, EEE Circuits and Systems Magazine,2008,8(3)1:67- [42]李永强,徐克虎,孙成松.基于Agent的坦克分队CGF 85 中的通讯机制研究[J]1.计算机仿真,2005,22(5)): 作者简介 31-34. 刘佳,女,1982年生,博士研究 LI Yongiang,XU Kehu,SUN Chengsong.Communica- 生,主要研究方向为多智能体系统控 tion mechanism of tank unit CGF based on Agent [J]. 制、复杂系统建模与控制.发表学术论 Computer Simulation,2005,22(5):31-34. 文6篇,被SCI、EI收录4篇」 [43]]PARKER L E.Designing control laws for cooperative A- gent teams[C]//Proceedings of IEEE Intemational Confer- ence on Robotics and Automation.Atlanta,USA,1993 582-587. 陈增强,男,1964年生,教授、博士 [44]CHANDLER P R,PACHTER M,RESMUSSEN S.Uav 生导师,中国系统仿真学会理事,中国 cooperative control [C]//Proceedings of the American 自动化学会控制理论专业委员会委员, Control Conference.Arlington,USA,2001::50-55. 中国自动化学会过程控制专业委员会 [4罗旭.基于Agent的防空兵群火力分配模型[J],舰 委会,中国优选法统筹法与经济数学研 船电子工程,2009,29(4):47-48,68. 究会复杂系统专业委员会理事.主要研 LUO Xu.A model of firepower distribution for airdefense 究方向为智能预测控制、混沌系统与复杂网络、多智能 group based on Agent[J].Ship Electronic Engineering, 体系统控制等.获省部级科技进步奖4次.发表学术论文 2009,29(4)):47-48,68. 100余篇,被SCI检索70余篇: [4]欧海涛,张卫东,张文渊,等.基于多智能体技术的城 市智能交通控制系统[刀:.电子学报,2000,28(12): 刘忠信,男,1975年生,副教授,中 52-55. 国系统仿真协会会员,主要研究方向 OU Haitao.ZHANG Weidong.ZHANG Wenyuan.et al. 为复杂网络、计算机控制、控制理论 Urban intelligent traffic control system based on multi-A- 与控制工程.获省部级科技进步奖1 gent technology[J]].Acta Electronica Sinica,2000,28 次.发表学术论文50余篇,被SCI、E1 (2:52-55. 检索20余篇
陈增强,男,1964年生,教授、博士 生导师,中国系统仿真学会理事,中国 自动化学会控制理论专业委员会委员, 中国自动化学会过程控制专业委员会 [48] ZHANG H T, CHEN M Z, STAN G B,et al. Collective behavior coordination with predictive mechanisms [J]. EEE Circuits and Systems Magazine,2008,8(3) : 委会,中国优选法统筹法与经济数学研 究会复杂系统专业委员会理事.主要研 67- 85. [46] 欧海涛,张卫东,张文渊,等.基于多智能体技术的城 市智能交通控制系统[J] .电子学报,2000,28(12) : 52-55. WANG Bingchang,ZHANG Jifeng. Consensus conditions of multi-Agent systems with unbalanced topology and stochastic disturbances [J]. Journal of Systems Science and Mathematical Sciences,2009,10: 1353-1365. OU Haitao,ZHANG Weidong,ZHANG Wenyuan,et al. Urban intelligent traffic control system based on multi-Agent technology[J] . Acta Electronica Sinica,2000,28 (12) : 52-55. 刘 佳,等: 多智能体系统及其协同控制研究进展 ·9· 刘 佳,女,1982年生,博士研究 生,主要研究方向为多智能体系统控 制、复杂系统建模与控制.发表学术论 文6篇,被SCI、EI收录4篇. 1353-1365. 第1期 [41] MA Cuiqin,LI Tao,ZHANG Jifeng. Leader-following consensus control for multi-Agent systems under measurement noises [ C]//Proceedings of the 17th International Federation of Automatic Control World Congress. Seoul, Korea,2008: 1528-1533. [42] 李永强,徐克虎,孙成松.基于Agent的坦克分队CGF 中的通讯机制研究[J] .计算机仿真,2005,22(5) : 31-34. [43] PARKER L E. Designing control laws for cooperative Agent teams[ C]//Proceedings of IEEE International Conference on Robotics and Automation. Atlanta,USA,1993: 582-587. LI Yongiang,XU Kehu,SUN Chengsong. Communication mechanism of tank unit CGF based on Agent [J]. Computer Simulation,2005,22(5) :31-34. LUO Xu. A model of firepower distribution for airdefense group based on Agent[J]. Ship Electronic Engineering, 2009,29(4) : 47-48,68. [45] 罗 旭.基于Agent的防空兵群火力分配模型[J] . 舰 船电子工程,2009,29(4) : 47-48,68. 作者简介: [44] 刘忠信,男,1975年生,副教授,中 国系统仿真协会会员.主要研究方向 为复杂网络、计算机控制、控制理论 与控制工程.获省部级科技进步奖1 次.发表学术论文50余篇,被SCI、EI 检索20 余篇. CHANDLER P R,PACHTER M,RESMUSSEN S. Uav cooperative control [C] //Proceedings of the American Control Conference. Arlington,USA,2001: 50-55. [47] 承向军,杜 鹏,杨肇夏.基于多智能体的分布式交通 信号协调控制方法[J].系统工程理论与实践,2005, 8: 130-135. CHENG Xiangjun,DU Peng,YANG Zhaoxia. A distributed and coordinated traffic signal control approach based on multi-Agent system [J]. Systems Engineering Theory & Practice,2005,8: 130-135. 究方向为智能预测控制、混沌系统与复杂网络、多智能 体系统控制等.获省部级科技进步奖4次.发表学术论文 100余篇,被 SCI 检索70余篇