第9卷第3期 智能系统学报 Vol.9 No.3 2014年6月 CAAI Transactions on Intelligent Systems Jun.2014 D0l:10.3969/j.issn.1673-4785. 网络出版地址:http:/www.cnki.net/kcms/doi/10.3969/j-issn.1673-4785.201310010.html 一种多智能体领航跟随编队新型控制器的设计 王中林12,刘忠信2,陈增强2,孙青林2,吴垠12,马争光2 (1.南开大学计算机与控制工程学院,天津300071;2.天津市智能机器人技术重点实验室,天津300071) 摘要:研究了基于离散时间模型的多智能体领航跟随编队控制算法。在该算法中,通过引入基于邻居的局部控制 律以及基于邻居的状态估计规则设计了一种新型控制器,在该控制器中通过简单地设定跟随者和领航者之间的相 对坐标即可方便地实现任意形状编队,同时该文引入了坐标旋转公式一用于实现整个队形能够随着领航者的运 动方向的变化做相应旋转,且文中分别给出了固定拓扑和切换拓扑时系统稳定编队的充分条件。最后分别通过 Matlab仿真和在Amigobot机器人平台上做实验来验证该算法的正确性及实际可行性。 关键词:多智能体系统;一致性;编队控制:领航跟随:机器人;坐标旋转公式 中图分类号:TP18文献标志码:A文章编号:1673-4785(2014)03-0298-09 中文引用格式:王中林,刘忠信,陈增强,等.一种多智能体领航跟随编队新型控制器的设计[J].智能系统学报,2014,9(3):298 306. 英文引用格式:WANG Zhonglin,LIU Zhongxin,CHEN Zengqiang,etal.A kind of new type controller for multi-agent leader--fol- lower formation[J].CAAI Transactions on Intelligent Systems,2014,9(3):298-306. A kind of new type controller for multi-agent leader-follower formation WANG Zhonglin'2,IIU Zhongxin'2,CHEN Zengqiang'2,SUN Qinglin'2,WU Yin',MA Zhengguang' (1.College of Computer and Control Engineering,Nankai University,Tianjin 300071,China;2.Key Laboratory of Intelligent Robot- ics of Tianjin,Tianjin 300071,China) Abstract:In this paper,the algorithm of formation control concerning the Leader-Follower Multi-Agent System (MAS)based on the discrete-time model is researched.By introducing the neighbor-based local control law and the neighbor-based state estimation rules,a kind of new type controller for multi-agent leader-follower formation is de- signed.Arbitrary shape formations can be easily achieved by simply setting the follower and leader relative coordi- nates.At the same time,the coordinate rotating formula is introduced to realize the entire formation rotating accord- ingly with changes of the direction of the movement of the leader.This paper gives two sufficient conditions for the system's stable formation of fixed topology and switching topology,respectively.The correctness and the practical feasibility of this algorithm were verified through the MATLAB simulation and experiments were conducted using the Amigobot robot platform,respectively. Keywords:multi-agent system (MAS);consensus;formation control;leader-follower;robots;coordinate rotating formula 近年来,多智能体系统受到了越来越多的关注。 所谓多智能体系统是指由多个可自主计算的智能体 组成的系统,它具有自组织、学习和推理等能力以及 收稿日期:2013-10-08.网络出版日期:2014-06-14. 基金项目:国家白然科学基金资助项目(61174094):天津市自然科学 自主性、分布性和协调性等特点,在系统中每个智能 基金资助项目(13 JCYBJC17400) 体仅需与邻居进行信息交互,便能完成一个整体的 通信作者:刘忠信.lhx@nankai.cdu.cn 期望目标。多智能体技术有着广泛的应用背景,譬
第 9 卷第 3 期 智 能 系 统 学 报 Vol.9 №.3 2014 年 6 月 CAAI Transactions on Intelligent Systems Jun. 2014 DOI:10.3969 / j.issn.1673⁃4785. 网络出版地址:http: / / www.cnki.net / kcms/ doi / 10.3969 / j.issn.1673⁃4785.201310010.html 一种多智能体领航跟随编队新型控制器的设计 王中林1,2 ,刘忠信1,2 ,陈增强1,2 ,孙青林1,2 ,吴垠1,2 ,马争光1,2 (1.南开大学 计算机与控制工程学院, 天津 300071; 2.天津市智能机器人技术重点实验室, 天津 300071) 摘 要:研究了基于离散时间模型的多智能体领航跟随编队控制算法。 在该算法中,通过引入基于邻居的局部控制 律以及基于邻居的状态估计规则设计了一种新型控制器,在该控制器中通过简单地设定跟随者和领航者之间的相 对坐标即可方便地实现任意形状编队,同时该文引入了坐标旋转公式———用于实现整个队形能够随着领航者的运 动方向的变化做相应旋转,且文中分别给出了固定拓扑和切换拓扑时系统稳定编队的充分条件。 最后分别通过 Matlab 仿真和在 Amigobot 机器人平台上做实验来验证该算法的正确性及实际可行性。 关键词:多智能体系统;一致性;编队控制;领航跟随;机器人;坐标旋转公式 中图分类号: TP18 文献标志码:A 文章编号:1673⁃4785(2014)03⁃0298⁃09 中文引用格式:王中林,刘忠信,陈增强,等.一种多智能体领航跟随编队新型控制器的设计[ J]. 智能系统学报, 2014, 9(3): 298⁃ 306. 英文引用格式:WANG Zhonglin, LIU Zhongxin, CHEN Zengqiang, et al. A kind of new type controller for multi⁃agent leader⁃fol⁃ lower formation[J]. CAAI Transactions on Intelligent Systems, 2014, 9(3): 298⁃306. A kind of new type controller for multi⁃agent leader⁃follower formation WANG Zhonglin 1,2 , LIU Zhongxin 1,2 , CHEN Zengqiang 1,2 , SUN Qinglin 1,2 , WU Yin 1,2 , MA Zhengguang 1,2 (1. College of Computer and Control Engineering, Nankai University, Tianjin 300071, China; 2. Key Laboratory of Intelligent Robot⁃ ics of Tianjin, Tianjin 300071, China) Abstract:In this paper, the algorithm of formation control concerning the Leader⁃Follower Multi⁃Agent System (MAS) based on the discrete⁃time model is researched. By introducing the neighbor⁃based local control law and the neighbor⁃based state estimation rules, a kind of new type controller for multi⁃agent leader⁃follower formation is de⁃ signed. Arbitrary shape formations can be easily achieved by simply setting the follower and leader relative coordi⁃ nates. At the same time, the coordinate rotating formula is introduced to realize the entire formation rotating accord⁃ ingly with changes of the direction of the movement of the leader. This paper gives two sufficient conditions for the system's stable formation of fixed topology and switching topology, respectively. The correctness and the practical feasibility of this algorithm were verified through the MATLAB simulation and experiments were conducted using the Amigobot robot platform, respectively. Keywords:multi⁃agent system (MAS); consensus; formation control; leader⁃follower; robots; coordinate rotating formula 收稿日期:2013⁃10⁃08. 网络出版日期:2014⁃06⁃14. 基金项目:国家自然科学基金资助项目(61174094); 近年来,多智能体系统受到了越来越多的关注。 所谓多智能体系统是指由多个可自主计算的智能 通信作者:刘忠信.lzhx@ nankai.edu.cn 体 组成的系统,它具有自组织、学习和推理等能力以及 自主性、分布性和协调性等特点,在系统中每个智能 体仅需与邻居进行信息交互,便能完成一个整体的 期望目标。 多智能体技术有着广泛的应用背景,譬 天津市自然科学 基金资助项目(13JCYBJC17400)
第3期 王中林,等:一种多智能体领航跟随编队新型控制器的设计 ·299· 如可用于编队控制、交通流控制、分布式信息融合以 来验证该算法的正确性及实际可行性。 及生物、经济、工程等领域1 1相关的图论基础 随着无线通信技术以及计算机技术的快速发 展,使多个智能体组成的群体系统通过协调、合作来 为了讨论方便,简单介绍一些文中能够用到的 完成原本由单个智能体无法或难以完成的工作已经 图论中的一些基本的概念和相关的标记符号。更多 成为可能。多智能体系统具有单个智能体难以拥有 图论细节可参阅文献[15]。 的丰富的感知能力、高效率的并行执行能力、优秀稳 图论在连通系统中是非常重要且有效的数学分 定的鲁棒性和卓越的容错能力等优势,因此使得智 析工具。一个无向图G=(V,E)是由非空有限顶点 能体在实际工作环境中的可适应性及实用性均得到 集合和无序的元素偶对ek的集合组成,其中e4= 了大幅提高。而多智能体编队问题是对于多智能体 (:,)∈E称为图的边。文中假设不存在从一个 协调合作问题所开展的研究中的一个典型应用。多 顶点到它自身的边(:,:),而且由于图G是无向 智能体编队控制主要是指多个智能体在群体运动过 图,所以有H(,)∈E,(,)∈E。如果(, 程中,能够在克服环境限制的同时还保持着期望队 )∈E,那么可以说巴是:的邻居顶点,则顶点, 形,最终都能够顺利到达指定目的地的控制技术。 的邻居顶点集合定义为N:={j:(:,y)∈E,j≠ 多智能体的编队控制是目前对多智能体协调合作问 }。图中顶点:到顶点的一条路径是指从起始 题进行研究的重要基础,引起了国内外广大学者的 顶点:到终止顶点:过程中一系列顶点对组成的连 关注,是国内外进行多智能体系统研究的热点课题。 续的边。如果无向图中任何2个顶点至少有一条路 目前,常用的多智能体编队控制方法主要有分布式 径,那么就说这个图是连通的,否则就是非连通的。 控制、基于行为法、虚结构法、人工势场法和领航跟 在无向图中,用A=(a,)。xn来表示系统的权重 随法等)。 邻接矩阵,其中ag满足aa=0且a防=a:≥0。在无 在以上几种编队方法中,领航一跟随法得到了 向图G中,节点:的度定义为d:=Σa,其中j∈ 广泛应用,并且成为最普遍采用的编队方法之 N。则图G的度矩阵为对角阵D=diag(d,d2,…, 一[6。领航跟随法的基本思想是在多个智能体组 d.)。那么图G的拉普拉斯(Laplacian)矩阵L= 成的群体中,某个智能体被指定为领航者,其余作为 D-A,显然L是对称矩阵。从L的定义中,可以知 它的跟随者,跟随者以一定的距离间隔跟踪领航智 道L的每一行元素之和为零,即L·1。=0,这里 能体的位置和方向1。对于领航一跟随法有2种 1。=(1,1,…,1).x1,从而可以很容易得到L的其中 控制器形式[5,):控制器和l-p控制器。【-p控制器 一个特征值为零,其对应的特征向量为1。。 的控制目标是使跟随者和领航者之间的距离和相对 转角达到设定值9町。-l控制器考虑的是3个机器人 2控制算法设计 之间的相对位置问题,当跟随者和2个领航者之间 在介绍算法设计之前,这里先对系统的连接拓 的距离达到设定值时,就可以认为整个队形稳定了。 扑图G做一个简要的说明。文中图G的邻接矩阵 文中通过引入基于邻居的局部控制律以及基于 包括两部分,一部分是所有跟随者之间组成的连通 邻居的状态估计规则[9-3]设计了一种领航跟随编 图G的邻接矩阵用表示,相应图G的度矩阵用D表 队算法的新型控制器,在控制器中通过简单地设定 示,而领航者和每个跟随者之间的连接矩阵用B表 跟随者和领航者之间的相对坐标即可轻松实现任意 示。假设系统中包括领航者共有n+1个智能体,那 形状编队,并为了将所有跟随者相对于领航者的相 么A为n×n的对称矩阵:B为n×n的对角矩阵, 对坐标统一映射到领航者的坐标系中,在控制器中 对角线上的元素为跟随者和领航者之间的连接权重 引入了“坐标旋转公式”),用于实现整个队形的 值,文中假定图G总是连通的,则B对角线上的元 对称轴和领航者的运动方向平行,即所编队形随着 素的值至少有一个不为零,即至少有一个跟随者和 领航者的运动方向的改变做相应旋转。文中设计的 领航者是直接连通的,但这种连通是单向的,就是说 这种新型控制器,既突破了-(控制器中机器人个数 领航者的运动不受跟随者的影响。当系统的拓扑图 的限制又避免了-φ控制器设计偏复杂的缺点。文 在一定时刻变化时,则图G被认为是这n+1个智能 中分别给出了固定拓扑和切换拓扑下的系统稳定编 队的充分条件及相应的证明。文章的最后分别通过 体组成的所有可能的拓扑图集合S={G1,G2,…, MATLAB仿真和在Amigobot机器人平台上做实验 Gw}中的一个,定义P={1,2,…,M}为拓扑图的索
如可用于编队控制、交通流控制、分布式信息融合以 及生物、经济、工程等领域[1 ⁃ 4] 。 随着无线通信技术以及计算机技术的快速发 展,使多个智能体组成的群体系统通过协调、合作来 完成原本由单个智能体无法或难以完成的工作已经 成为可能。 多智能体系统具有单个智能体难以拥有 的丰富的感知能力、高效率的并行执行能力、优秀稳 定的鲁棒性和卓越的容错能力等优势,因此使得智 能体在实际工作环境中的可适应性及实用性均得到 了大幅提高。 而多智能体编队问题是对于多智能体 协调合作问题所开展的研究中的一个典型应用。 多 智能体编队控制主要是指多个智能体在群体运动过 程中,能够在克服环境限制的同时还保持着期望队 形,最终都能够顺利到达指定目的地的控制技术。 多智能体的编队控制是目前对多智能体协调合作问 题进行研究的重要基础,引起了国内外广大学者的 关注,是国内外进行多智能体系统研究的热点课题。 目前,常用的多智能体编队控制方法主要有分布式 控制、基于行为法、虚结构法、人工势场法和领航跟 随法等[5] 。 在以上几种编队方法中,领航—跟随法得到了 广泛应 用, 并 且 成 为 最 普 遍 采 用 的 编 队 方 法 之 一[6] 。 领航跟随法的基本思想是在多个智能体组 成的群体中,某个智能体被指定为领航者,其余作为 它的跟随者,跟随者以一定的距离间隔跟踪领航智 能体的位置和方向[7] 。 对于领航—跟随法有 2 种 控制器形式[5 , 8] :控制器和 l⁃φ 控制器。 l⁃φ 控制器 的控制目标是使跟随者和领航者之间的距离和相对 转角达到设定值[9] 。 l⁃l 控制器考虑的是 3 个机器人 之间的相对位置问题,当跟随者和 2 个领航者之间 的距离达到设定值时,就可以认为整个队形稳定了。 文中通过引入基于邻居的局部控制律以及基于 邻居的状态估计规则[9 - 13 ] 设计了一种领航跟随编 队算法的新型控制器,在控制器中通过简单地设定 跟随者和领航者之间的相对坐标即可轻松实现任意 形状编队,并为了将所有跟随者相对于领航者的相 对坐标统一映射到领航者的坐标系中,在控制器中 引入了“坐标旋转公式” [14] ,用于实现整个队形的 对称轴和领航者的运动方向平行,即所编队形随着 领航者的运动方向的改变做相应旋转。 文中设计的 这种新型控制器,既突破了 l⁃l 控制器中机器人个数 的限制又避免了 l⁃φ 控制器设计偏复杂的缺点。 文 中分别给出了固定拓扑和切换拓扑下的系统稳定编 队的充分条件及相应的证明。 文章的最后分别通过 MATLAB 仿真和在 Amigobot 机器人平台上做实验 来验证该算法的正确性及实际可行性。 1 相关的图论基础 为了讨论方便,简单介绍一些文中能够用到的 图论中的一些基本的概念和相关的标记符号。 更多 图论细节可参阅文献[15]。 图论在连通系统中是非常重要且有效的数学分 析工具。 一个无向图 G = (V,E) 是由非空有限顶点 集合和无序的元素偶对 ek 的集合组成,其中 ek = (vi,vj) ∈ E 称为图的边。 文中假设不存在从一个 顶点到它自身的边 (vi,vi), 而且由于图 G 是无向 图,所以有 ∀(vi,vj) ∈ E, (vj,vi) ∈ E 。 如果 (vi, vj) ∈ E ,那么可以说 vj 是 vi 的邻居顶点,则顶点 vi 的邻居顶点集合定义为 Ni = {j:(vi,vj) ∈ E,∀j ≠ i} 。 图中顶点 vi 到顶点 vj 的一条路径是指从起始 顶点 vi 到终止顶点 vj 过程中一系列顶点对组成的连 续的边。 如果无向图中任何 2 个顶点至少有一条路 径,那么就说这个图是连通的,否则就是非连通的。 在无向图中,用 A = (aij)n×n 来表示系统的权重 邻接矩阵,其中 aij 满足 aii = 0 且 aij = aji ≥ 0。 在无 向图 G 中,节点 vi 的度定义为 di = Σaij ,其中 j ∈ N。 则图 G 的度矩阵为对角阵 D = diag(d1 ,d2 ,…, dn ) 。 那么图 G 的拉普拉斯( Laplacian) 矩阵 L = D -A ,显然 L 是对称矩阵。 从 L 的定义中,可以知 道 L 的每一行元素之和为零,即 L·1 n = 0,这里 1 n = (1,1,…,1)n×1 ,从而可以很容易得到 L 的其中 一个特征值为零,其对应的特征向量为 1 n 。 2 控制算法设计 在介绍算法设计之前,这里先对系统的连接拓 扑图 G 做一个简要的说明。 文中图 G 的邻接矩阵 包括两部分,一部分是所有跟随者之间组成的连通 图 G - 的邻接矩阵用表示,相应图 G - 的度矩阵用 D 表 示,而领航者和每个跟随者之间的连接矩阵用 B 表 示。 假设系统中包括领航者共有 n + 1 个智能体,那 么 A 为 n × n 的对称矩阵; B 为 n × n 的对角矩阵, 对角线上的元素为跟随者和领航者之间的连接权重 值,文中假定图 G 总是连通的,则 B 对角线上的元 素的值至少有一个不为零,即至少有一个跟随者和 领航者是直接连通的,但这种连通是单向的,就是说 领航者的运动不受跟随者的影响。 当系统的拓扑图 在一定时刻变化时,则图 G 被认为是这 n + 1 个智能 体组成的所有可能的拓扑图集合 S = {G1 ,G2 ,…, GM } 中的一个,定义 P ~ = {1,2,…,M} 为拓扑图的索 第 3 期 王中林,等:一种多智能体领航跟随编队新型控制器的设计 ·299·
·300· 智能系统学报 第9卷 引值集合。为了描述切换拓扑情形,在这里定义一 B,第i个跟随者和领导者相连 b.(k)= 个切换拓扑图的触发信号变量2:[0,o)→P,这里 (0,其他 2表示在0到无穷区间的任意分散的随机时刻点都 i,j=1,2,…,n,ag>0,B>0。 这里首先对坐标系问题做一个简要说明:文中 指向P中的一个值,即对应着一种拓扑图,其中2个 假定有2个坐标系,一个是绝对坐标系,另一个是领 相邻的随机触发时刻点可能间隔很小也可能很大。 航者坐标系,但无论是领航者还是跟随者,它们的实 文中在切换拓扑下,所有的矩阵都带有下标2以表 际坐标均是基于绝对坐标系的。这里的领航者坐标 示它们是在2的触发下进行变化,为了书写简便, 系定义为:以领航者的绝对坐标作为它自身坐标系 以下均省略下标2。 的坐标原点,并以它的运动方向作为它自身坐标系 2.1新型控制器设计 在文中的Leader-Follower多智能体系统中,领 的x轴正方向。所以领航者自身的坐标系其实是以 航者的运动不受跟随者的影响,并且假定领航者的 领航者的角速度大小(顺时针时其大小为负值)相 速度无法被跟随者实时获取。这里首先介绍一下领 对于绝对坐标系做顺或逆时针方向的旋转,加上领 航者的运动控制律: 航者同时以一定的线速度在运动,故领航者坐标系 相对于绝对坐标系一边做旋转运动一边沿着领航者 xo(k+1)=x(k)+vo(k) 的运动轨迹做平移运动。譬如当领航者做逆时针方 vo(k +1)=vo(k)+a(k) 向的匀速圆周运动时,领航者坐标系相对于绝对坐 a(k)=ao+8(k) 标系则是一边以恒定的角速度做逆时针方向的旋转 式中:x(k)∈Rm是领航者的位置;(k)∈R"是 运动一边以恒定的线速度沿着领航者的圆周运动轨 领航者的速度;a(k)∈Rm是加速度控制输入, 迹做平移运动。 a。∈R是初始加速度值,为已知的:6(k)∈Rm为 式(2)中的p.(k)=R(k)C:∈Rm为实现编队 环境噪声扰动是未知的,但是它有一个给定的上限 的控制参数。其中C:=[p:P]T为绝对坐标系 值δ,即I6(k)‖≤δ,‖δ(k)‖表示8(k)的2 下系统稳定时第i个跟随者相对于领航者的相对坐 范数。文中出现的形如Ⅱ·‖的表达式均表示2 标位置。为描述方便,这里以3个智能体甲为领航 范数,这里m的值可以取任意自然数,但一般取值2 者、乙丙均为跟随者编队成为等腰三角形为例进行 和3,因为取值为2和3时分别表示2维平面和三维 说明,首先假定“前方”指X轴正方向,“上方”指Y 空间,文中所有的上下标的m取值均为2。 轴正方向,那么假定甲在前方,乙和丙在甲的后方且 跟随者的运动控制律如式(1)所示: 乙在丙的上方,同时乙丙连线是等腰三角形底边,设 x,(k+1)=x:(k)+:(k)+du.(k) (1) 定甲乙丙到底边中点的距离都为M,如图1(a)所 u:(k+1)=:(k)+du:(k) 示,则如果此时甲的坐标为(x,y),乙丙的坐标分 式中:x:(k)∈R"是第i个跟随者的位置;,(k)∈ 别为(x1,y)、(x2,y2),那么有 Rm是第i个跟随者的速度;d和r均为控制常量参 P1=x1-x=-M 数,在后面将给出它们的取值范围。 Pn =y-y=M 由于领航者和其他邻居跟随者的速度无法实时 获取,又因为他们的位置信息可以实时得到,故式 P2=x2-x=-M (1)中的u,(k)∈Rm为第i个跟随者的基于邻居位 P2=y2-y=-M 置信息的控制器输入,其表达式为 故当队形一定时P:和P:为定值。为描述简 u,(k)=-[∑a,(k)(x,(k)- 便,这里不妨假设系统稳定时领航者在绝对坐标系 jeN(k) 中的坐标始终为(0,0),那么C则可看成第i个跟 P:(k))-(x(k)-P(k)))+ 随者在绝对坐标系的坐标,做这样的假设后可以随 b.(k)((x(k)-P,(k))-x(k))] 意设定跟随者坐标以实现任意形状编队。R,(k)表 (2)》 达式为 式中: Tcos(0.(k))-sin(0.(k))1 a,第i个跟随者和第j个跟随者相连 R(k)= sin(0.(k)) cos(0(k)) a,(k)= 0,其他 它为第i个跟随者第k时刻的坐标旋转矩阵
引值集合。 为了描述切换拓扑情形,在这里定义一 个切换拓扑图的触发信号变量 Ω:[0,¥) → P ~ ,这里 Ω 表示在 0 到无穷区间的任意分散的随机时刻点都 指向 P ~ 中的一个值,即对应着一种拓扑图,其中 2 个 相邻的随机触发时刻点可能间隔很小也可能很大。 文中在切换拓扑下,所有的矩阵都带有下标 Ω 以表 示它们是在 Ω 的触发下进行变化,为了书写简便, 以下均省略下标 Ω 。 2.1 新型控制器设计 在文中的 Leader⁃Follower 多智能体系统中,领 航者的运动不受跟随者的影响,并且假定领航者的 速度无法被跟随者实时获取。 这里首先介绍一下领 航者的运动控制律: x0(k + 1) = x0(k) + v0(k) v0(k + 1) = v0(k) + a(k) a(k) = a0 + δ(k) ì î í ï ï ï ï 式中: x0(k) ∈ R m 是领航者的位置; v0(k) ∈ R m 是 领航者的速度; a(k) ∈ R m 是加速度控制输入, a0 ∈R m 是初始加速度值,为已知的; δ(k) ∈ R m 为 环境噪声扰动是未知的,但是它有一个给定的上限 值 δ - ,即 ‖δ(k)‖ ≤ δ - , ‖δ(k)‖ 表示 δ(k) 的 2 范数。 文中出现的形如 ‖·‖ 的表达式均表示 2 范数,这里 m 的值可以取任意自然数,但一般取值 2 和 3,因为取值为 2 和 3 时分别表示 2 维平面和三维 空间,文中所有的上下标的 m 取值均为 2。 跟随者的运动控制律如式(1)所示: xi(k + 1) = xi(k) + vi(k) + dui(k) vi(k + 1) = v { i(k) + drui(k) (1) 式中: xi(k) ∈ R m是第 i 个跟随者的位置; vi(k) ∈ R m是第 i 个跟随者的速度; d 和 r 均为控制常量参 数,在后面将给出它们的取值范围。 由于领航者和其他邻居跟随者的速度无法实时 获取,又因为他们的位置信息可以实时得到,故式 (1)中的 ui(k) ∈ R m 为第 i 个跟随者的基于邻居位 置信息的控制器输入,其表达式为 ui(k) = - [ j∈∑Ni (k) aij(k)((xi(k) - pi(k)) - (xj(k) - pj(k))) + bi(k)((xi(k) - pi(k)) - x0(k))] (2) 式中: aij(k) = αij,第 i 个跟随者和第 j 个跟随者相连 0,其他 { bi(k) = βi,第 i 个跟随者和领导者相连 0, 其他 { i,j = 1,2,…,n , αij > 0, βi > 0。 这里首先对坐标系问题做一个简要说明:文中 假定有 2 个坐标系,一个是绝对坐标系,另一个是领 航者坐标系,但无论是领航者还是跟随者,它们的实 际坐标均是基于绝对坐标系的。 这里的领航者坐标 系定义为:以领航者的绝对坐标作为它自身坐标系 的坐标原点,并以它的运动方向作为它自身坐标系 的 x 轴正方向。 所以领航者自身的坐标系其实是以 领航者的角速度大小(顺时针时其大小为负值) 相 对于绝对坐标系做顺或逆时针方向的旋转,加上领 航者同时以一定的线速度在运动,故领航者坐标系 相对于绝对坐标系一边做旋转运动一边沿着领航者 的运动轨迹做平移运动。 譬如当领航者做逆时针方 向的匀速圆周运动时,领航者坐标系相对于绝对坐 标系则是一边以恒定的角速度做逆时针方向的旋转 运动一边以恒定的线速度沿着领航者的圆周运动轨 迹做平移运动。 式(2)中的 pi(k) = Ri(k) Ci ∈ R m 为实现编队 的控制参数。 其中 Ci = [px i pyi] T 为绝对坐标系 下系统稳定时第 i 个跟随者相对于领航者的相对坐 标位置。 为描述方便,这里以 3 个智能体甲为领航 者、乙丙均为跟随者编队成为等腰三角形为例进行 说明,首先假定“前方”指 X 轴正方向,“上方”指 Y 轴正方向,那么假定甲在前方,乙和丙在甲的后方且 乙在丙的上方,同时乙丙连线是等腰三角形底边,设 定甲乙丙到底边中点的距离都为 M ,如图 1( a)所 示,则如果此时甲的坐标为 (x,y) ,乙丙的坐标分 别为 (x1 ,y1 ) 、 (x2 ,y2 ) ,那么有 px1 = x1 - x = - M py1 = y1 { - y = M px2 = x2 - x = - M py2 = y2 { - y = - M 故当队形一定时 px i 和 pyi 为定值。 为描述简 便,这里不妨假设系统稳定时领航者在绝对坐标系 中的坐标始终为(0,0),那么 Ci 则可看成第 i 个跟 随者在绝对坐标系的坐标,做这样的假设后可以随 意设定跟随者坐标以实现任意形状编队。 Ri(k) 表 达式为 Ri(k) = cos(θi(k)) - sin(θi(k)) sin(θi(k)) cos(θi(k)) é ë ê ê ù û ú ú 它为第 i 个跟随者第 k 时刻的坐标旋转矩阵, ·300· 智 能 系 统 学 报 第 9 卷
第3期 王中林,等:一种多智能体领航跟随编队新型控制器的设计 ·301- 它能将第i个跟随者在绝对坐标系中相对于领航者 x(+1)=((I-dH)I)x(k)+v(k)+ 的相对坐标转换成在领航者坐标系中相对于领航者 的坐标,以实现系统稳定编队时整个队形能够在沿 d(H☒Im)p(k) 着领航者运动轨迹做平移运动的同时,又能以领航 v(k+1)=dr(H☒Im)p(k)-1.☒(a(k)+ 者的角速度大小相对于绝对坐标系做顺或逆时针方 δ(k))-dr(H☒Im)x(k)+(k) 向的旋转,如图1为转换前后示意图。其中的 (5) 日,(k)为第i个跟随者第k时刻的运动方向与绝对 式中:I.为n×n的单位对角矩阵,H=L+B。 坐标系中X轴正方向之间的夹角,当系统稳定编队 令差值变量为 时可近似为领航者的运动方向和绝对坐标系中X ( (k 轴正方向之间的夹角如图1(b)中的8,范围为 (-T,T)。 (k)」 则可将式(5)化简为 (k+1)=(F☒Im)5(k)+g (6) 「In-dHIn 式中:F= drH 8= d(H☒Im)p(k) (a)转换前 (b)转换后 dr(H☒In)p(k)-1n☒(a(k)+6(k)) (7) 图1相对坐标转换对比图 Fig.1 The comparison of Relative coordinate transfor- 在给出重要结论之前,这里先给出几个引理。 mation 引理1如果图G是连通的,那么对称矩阵H 是正定的。 2.2主要结论 引理2(Routh-Hurwitz theorem)假设一个形 这里将给出文中的一些主要结论,同时对式 (1)中的控制参数d和r的范围做一个界定。 如aox”+a1x-1+…+a.-1x+an=0的n阶多项式, 这里a>0, 为了方便后期的公式推导,这里首先将式(1)》 矩阵化处理。定义: △1=a1 a ao △2= a3 a Xn ao 0 0 则由式(1)和(2)化简可得 ar 0 (x(k+1)=x(k)+v(k)+du(k) 03 a2 0 = v(k+1)=v(k)+dru(k) u(k)=-((L+B)I)(x(k)-p(k))+ a2n-1 a2m-2 a2m-3 ...a (B1.)⑧x(k) 则如果i>n,a:=0,当且仅当a1>0,42>0,, 4-1>0,a。>0时多项式的所有根有负实部。 (3) 引理2说明了判定一个给定的系统是否是 式中:1m为m×m的单位对角矩阵,1.为n维全1 Hurwitz稳定的,就要看这个系统所对应的特征多项 列向量,即1。=[11…1]。 式所有的根是否都存在负实部[6] 定义跟随者和领航者之间的位置差x(k)和速 引理3(Schur complement)[] 对于一个形如 度差v(k)如下: 下式的对称矩阵S, 「SS2 x(k)=x(k)-1.☒x(k) S= (4) (k)=v(k)-1.☒'(k) 这里S,和S2是方阵,那么下列条件等价: 则由式(3)和(4)化简得 1)S<0
它能将第 i 个跟随者在绝对坐标系中相对于领航者 的相对坐标转换成在领航者坐标系中相对于领航者 的坐标,以实现系统稳定编队时整个队形能够在沿 着领航者运动轨迹做平移运动的同时,又能以领航 者的角速度大小相对于绝对坐标系做顺或逆时针方 向的旋 转, 如 图 1 为 转 换 前 后 示 意 图。 其 中 的 θi(k) 为第 i 个跟随者第 k 时刻的运动方向与绝对 坐标系中 X 轴正方向之间的夹角,当系统稳定编队 时可近似为领航者的运动方向和绝对坐标系中 X 轴正方向之间的夹角如图 1 ( b) 中的 θ ,范围为 ( - π,π) 。 图 1 相对坐标转换对比图 Fig.1 The comparison of Relative coordinate transfor⁃ mation 2.2 主要结论 这里将给出文中的一些主要结论,同时对式 (1)中的控制参数 d 和 r 的范围做一个界定。 为了方便后期的公式推导,这里首先将式(1) 矩阵化处理。 定义: x = x1 ︙ xn é ë ê ê ê ê ù û ú ú ú ú , v = v1 ︙ vn é ë ê ê ê ê ù û ú ú ú ú , p = p1 ︙ pn é ë ê ê ê ê ù û ú ú ú ú 则由式(1)和(2)化简可得 x(k + 1) = x(k) + v(k) + du(k) v(k + 1) = v(k) + dru(k) u(k) = - ((L + B) Im )(x(k) - p(k)) + (B 1n ) x0(k) ì î í ï ïï ï ïï (3) 式中: Im 为 m × m 的单位对角矩阵, 1 n 为 n 维全 1 列向量,即 1 n = [1 1 … 1] T 。 定义跟随者和领航者之间的位置差 x - (k) 和速 度差 v - (k) 如下: x - (k) = x(k) - 1n x0(k) v - (k) = v(k) - 1n v0(k) { (4) 则由式(3)和(4)化简得 x - (k + 1) = ((In - dH) Im )x - (k) + v - (k) + d(H Im )p(k) v - (k + 1) = dr(H Im )p(k) - 1n (a0(k) + δ(k)) - dr(H Im )x - (k) + v - (k) ì î í ï ï ï ï ï ï (5) 式中: In 为 n × n 的单位对角矩阵, H = L + B 。 令差值变量为 ξ(k) = x - (k) v - (k) é ë ê êê ù û ú úú 则可将式(5)化简为 ξ(k + 1) = (F Im )ξ(k) + g (6) 式中: F = In - dH In - drH In é ë ê ê ù û ú ú g = d(H Im )p(k) dr(H Im )p(k) - 1n (a0(k) + δ(k)) é ë ê ê ù û ú ú (7) 在给出重要结论之前,这里先给出几个引理。 引理 1 如果图 G 是连通的,那么对称矩阵 H 是正定的[11] 。 引理 2(Routh-Hurwitz theorem) 假设一个形 如 a0 x n + a1 x n-1 + … + an-1 x + an = 0 的 n 阶多项式, 这里 a0 > 0, Δ1 = a1 Δ2 = a1 a0 a3 a2 ︙ Δn = a1 a0 0 … 0 a3 a2 a1 … 0 ︙ ︙ ︙ ︙ a2n-1 a2n-2 a2n-3 … an 则如果 i > n,ai = 0,当且仅当 a1 > 0,Δ2 > 0,…, Δn-1 > 0,an > 0 时多项式的所有根有负实部。 引理 2 说明了判定一个给定的系统是否是 Hurwitz 稳定的,就要看这个系统所对应的特征多项 式所有的根是否都存在负实部[16] 。 引理 3(Schur complement) [17] 对于一个形如 下式的对称矩阵 S, S = S11 S12 S T 12 S22 é ë ê ê ù û ú ú 这里 S11 和 S22 是方阵,那么下列条件等价: 1) S < 0 第 3 期 王中林,等:一种多智能体领航跟随编队新型控制器的设计 ·301·
·302· 智能系统学报 第9卷 2)S10,结合式(9),通过引理2可知, 接下来介绍一下文中的2个重要的定理结论。 欲使F是Schur稳定的,可得当且仅当正的常量r和 定理1是关于固定拓扑情况下系统能够达到稳定编 d满足(1-r)d>0、(r-2)d入.(H)+4>0,即00。 件是:对任何给定的0<r<2入ma/八入m+入mx),d 取值满足: 得 (2-r)入in <d< (10) 入 并且存在一个常量C,使得: liml(k)‖≤C 计算|s12n-F=0化简并整理可得式(8): 式中:入m为H的最小特征值,入m表示H的最大特 Π[s2+(dA,(H)-2)s+(r-1)dA,(H)+1]=0 征值。常数C由3组常量δP:P:共同决定,i=1, (8) 2,…,n。特别地,当8=0,Pm=0P=0时,有 对式(8)应用双线性变换s=(t+1)/(t-1),整理 liml(k)‖=0 0 可以得到式(9): 式中:δ表征领航者受到环境扰动。 证明构造一个李雅普诺夫函数 i[dA,()2+21-r)dA,(Hz+ (9) V(E)=ETPe (r-2)dλ(H)+4]=0 其中对称矩阵P为 上面的双线性变换是把S平面上单位圆内部区 2r21n n=q☒1m 域映射到复平面t的左半区域。只有当式(9)的所有 -r1
2) S11 < 0, S22 - S T 12 S -1 11 S12 < 0 3) S22 < 0, S11 - S12 S -1 22 S T 12 < 0 接下来介绍一下文中的 2 个重要的定理结论。 定理 1 是关于固定拓扑情况下系统能够达到稳定编 队的充分条件,而定理 2 是关于切换拓扑情况下系 统能够达到稳定编队的充分条件。 定理 1 已知连接拓扑图 G 是固定的,并且在 任意时刻 k 都是连通的,此时 L 和 B 都是恒定矩阵。 则使得系统(3)稳定编队的充分条件是:对任何给 定的 0 < r < 1, d 取值满足 0 < d < 4 / ((2 - r)λ max) ,并且存在一个常量 C ,使得 lim k→¥ ‖ξ(k)‖ ≤ C 式中: λ max 表示 H 的最大特征值。 常数 C 由 3 组常 量 δ - ,pxi,pyi 共同决定, i = 1,2,…,n ,特别地,当 δ - =0,pxi = 0,pyi = 0 时,有 lim k→¥ ‖ξ(k)‖ = 0 式中: δ - 表征领航者受到环境扰动的。 证明 由已知条件可知,由于图 G 是固定拓扑 且在任意时刻 k 是连通的,则根据引理 1 可知,对称 矩阵 H 是正定的。 令 U 为矩阵 H 的 Schur 转换矩阵(酉矩阵),则 U THU = T: = λ1(H) 0 0 0 0 λ2(H) 0 0 ︙ ︙ ︙ 0 0 0 λn(H) é ë ê ê ê ê ê ù û ú ú ú ú ú 这里 λi(H) 表示矩阵 H 的第 i 个特征值,由于 矩阵 H 是正定的,所以 λi(H) > 0。 令: U - = U 0 0 U é ë ê ê ù û ú ú ,由于 F = In - dH In - drH In é ë ê ê ù û ú ú ,得 F ~ : = U - TFU - = In - dT In - drT In é ë ê ê ù û ú ú 计算 s I2n - F ~ = 0 化简并整理可得式(8): ∏ n i = 1 [s 2 + (dλi(H) - 2)s + (r - 1)dλi(H) + 1] = 0 (8) 对式(8)应用双线性变换 s = (t + 1) / (t - 1) ,整理 可以得到式(9): ∏ n i = 1 [rdλi(H)t 2 + 2(1 - r)dλi(H)t + (r - 2)dλi(H) + 4] = 0 (9) 上面的双线性变换是把 S 平面上单位圆内部区 域映射到复平面 t 的左半区域。 只有当式(9)的所有 根都有负实部时,矩阵 F 才是 Schur 稳定的。 由于 λi(H) > 0,结合式(9),通过引理 2 可知, 欲使 F 是 Schur 稳定的,可得当且仅当正的常量 r 和 d 满足 (1 - r)d > 0、(r - 2)dλi(H) + 4 > 0,即 0 < r < 1,0 < d < 4/ ((2 - r)λ max) 时才能达到要求,这 里的 λ max 表示 H 的特征值 λi(H) 中的最大值, i = 1,2,…,n 。 所以当 0 < r < 1、0 < d < 4/ ((2 - r)λ max) 时, F 是 Schur 稳定的,相应的 F Im 也是 Schur 稳定的。 又由于在队形固定的情况下, pxi 和 pyi 是固定 的,则二者可以看成是常量,所以易知式(7)中的参数 除 δ(k) 外均为常量,由于 ‖δ(k)‖ ≤ δ - ,所以在给 定常量 r 、 d 、 a0(k) 、 δ - 、 pxi 和 pyi 情况下 ‖g‖ ≤ C0 , 这里的 C0 是基于上述这些常量值的大小而定的 有界值。 所以 ‖g‖ 是有界的,因此在给定条件下存 在一个常量 C 使得: lim k→¥ ‖ξ(k)‖ ≤ C 定理 1 证毕。 从定理 1 的证明过程可以看出,系统稳定编队的 充分条件中的 r 的取值范围在连接拓扑图不变的情 况下是固定的,且此时 d 的取值范围随 r 取值的增大 而增大。 接下来的定理 2 是切换连接拓扑图情况下, 系统达到稳定编队时的充分条件,即此时 r 和 d 需满 足的取值范围。 定理 2 已知切换连接拓扑图 G 在任意时刻 k 都是连通的,此时 L 和 B 均随 Ω 的变化做相应的改 变即它们都是可变矩阵,但在 2 次相邻拓扑切换时刻 点之间是恒定的。 则使得系统(3)稳定编队的充分条 件是:对任何给定的 0 < r < 2λ min / (λ min + λ max) , d 取值满足: 2r (2 - r)λmin < d < 2 λmax (10) 并且存在一个常量 C ,使得: lim k→¥ ‖ξ(k)‖ ≤ C 式中: λ min 为 H 的最小特征值, λ max 表示 H 的最大特 征值。 常数 C 由 3 组常量 δ - 、pxi、pyi 共同决定, i = 1, 2,…,n 。 特别地,当 δ - = 0,pxi = 0,pyi = 0 时,有 lim k→¥ ‖ξ(k)‖ = 0 式中: δ - 表征领航者受到环境扰动。 证明 构造一个李雅普诺夫函数 V(ε) = ε TPε 其中对称矩阵 P 为 P = 2r 2 In - r In - r In In é ë ê ê ù û ú ú Im = q Im ·302· 智 能 系 统 学 报 第 9 卷
第3期 王中林,等:一种多智能体领航跟随编队新型控制器的设计 ·303· 则V(e)的差分为 4V(e(k))=V(e(k+1))-V(E(k))= AVe()≤2C,√Aq) Av(E(k))_ e(k+1)'Pe(k+1)-E(k)'PE(k)= 2aV(e(k))+An(q)C。2= ((F☒Im)e(k)+g(k))'P(F☒Im)E(k)+ -2aV(e(k))+Am(g)C。2+ g(k))-E(k)"Pe(k)= 2√aV(e(k)) Co≤ (e(k)(Fr☒Im)+g(k))P((F☒Im)E(k)+ Va入min(q) g(k))-E(k)"Pe(k)= -a(e(k)+(d(g)+ e(k)'((FT☒Im)P(F☒I.)-P)e(k)+ ,ad(g)c。2 这里入表示(Fq)TFq的最大特征值。进而可得 28(k)(FI)Pg(k)+g(k)Pg(k)= V(e(k))≤V(e(0)eat+ E(k)((FqF-q))(k)+ 2E(k)'(Fq)☒Im)g(k)+g(k)'(q☒Im)g(k) gQo+ga6 a入min(q) 化简FqF-q得 则有 FgF-g= 2 limv())(( 2dr2H-dr2H dr'H 2r2 I. &入in(q) dr'H-2r1,2r1 -2r1 (12) 令 由式(11)和式(12),可以得到C的一个限定值为 「2dr2H-d2r2㎡dr2H-2r21. C=- 0= 。V+a入nq)Aq>0 入min(q) dr'H 2r21,2r 1,2r1. 因此有 则有 liml(k)‖≤C AV(E(k))=-E(k)(I)E(k)+ 即在切换拓扑下系统能够达到稳定并实现一致性编 2E(k)'((Fq)☒Im)g(k)+g(k)'(q☒In)g(k) 队。定理2证毕。 由引理3以及式(10)可知,Q是正定矩阵。 从定理1和定理2可知,文中的基于领航跟随 注意到对于V(e)有: 法的编队控制器设计的核心是设定控制参数r和d Ain(q)IEI2≤(e)≤A(q)IeI2 的取值范围。二者可以看作系统收敛过程中的波动 强度因子,顾名思义当它们的值在给定范围内比较 (11) 大时系统在收敛的过程中波动比较大也就使得超调 由式(11)可得 量较大,从而使系统可能需要经过很长时间才达到 e'(Q☒Im)e、入in(Q) =2a 稳定或者一直处于调节状态,并且在这种情况下如 e'(q☒In)eAm(q) 果用实际机器人做实验,由于速度剧烈波动可能对 入min(Q) 式中:“=2以。则有 机器人的机械结构有损害。而当它们取值都比较小 时,虽然在系统收敛的过程中波动较小,但是可能达 △V(ε(k))=2e(k)'((Fq)⑧Im)g(k)+ 到稳定的调节时间会更长。所以只有当二者在给定 g(k)(g☒Im)g(k)-e(k)'(Q☒Im)ε(k)≤ 范围内经过多次仿真实验或者凭经验取到合适值时 -2aV(e(k))+2IeI·I(Fq)☒ 才能使系统收敛并很快稳定从而实现预期编队。 In‖·Ig‖+入mm(q)lg‖2 3实验结果 因为式(7)中的r、d、a(k)、8、p(k)均为已知 本节将分别采用MATLAB软件仿真和在美国 量,又由于‖H‖的值是有界的,不妨设其最大边 MobileRobots公司生产的Amigobot实验平台上做实 界值为Hx,则可知IgI≤Co,这里常量C。的大 验来验证算法的正确性和实际可行性。该实验部分 小决定于r、d、ao(k)、δ、p(k)以及Hm的值。 主要采用将3个智能体的MATLAB仿真效果和在3 结合式(11)可得 个Amigobot机器人上做实验的效果做对比的形式
则 V(ε) 的差分为 ΔV(ε(k)) = V(ε(k + 1)) - V(ε(k)) = ε(k + 1) TPε(k + 1) - ε(k) TPε(k) = ((F Im) ε(k) + g(k)) TP((F Im)ε(k) + g(k)) - ε (k) TPε(k) = (ε(k) T (F T Im) + g(k) T )P((F Im)ε(k) + g(k)) - ε (k) TPε(k) = ε(k) T ((F T Im)P(F Im) - P)ε(k) + 2ε (k) T (F T Im)Pg(k) + g (k) TPg(k) = ε(k) T ((F T qF - q) Im)ε(k) + 2ε (k) T ((F T q) Im)g(k) + g (k) T (q Im)g(k) 化简 F T qF - q 得 F T qF - q = - 2dr 2H - d 2 r 2 H 2 dr 2H - 2r 2 In dr 2H - 2r 2 In 2r In - 2r 2 In é ë ê ê ù û ú ú 令 Q = 2dr 2H - d 2 r 2 H 2 dr 2H - 2r 2 In dr 2H - 2r 2 In 2r In - 2r 2 In é ë ê ê ù û ú ú 则有 ΔV(ε(k)) = - ε(k) T (Q Im )ε(k) + 2ε (k) T ((F T q) Im )g(k) + g(k) T (q Im )g(k) 由引理 3 以及式(10)可知, Q 是正定矩阵。 注意到对于 V(ε) 有: λmin(q) ‖ε‖2 ≤ V(ε) ≤ λmax(q) ‖ε‖2 (11) 由式(11)可得 ε T (Q Im )ε ε T (q Im )ε ≥ λmin(Q) λmax(q) = 2α 式中: α = λ min(Q) 2λ max(q) 。 则有 ΔV(ε(k)) = 2ε(k) T ((F T q) Im )g(k) + g(k) T (q Im)g(k) - ε(k) T (Q Im)ε(k) ≤ - 2αV(ε(k)) + 2‖ ε T‖·‖(F T q) Im‖·‖g‖ + λmax(q) ‖g‖2 因为式(7) 中的 r 、 d 、 a0(k) 、 δ - 、 p(k) 均为已知 量,又由于 ‖H‖ 的值是有界的,不妨设其最大边 界值为 Hmax ,则可知 ‖g‖ ≤ C0 ,这里常量 C0 的大 小决定于 r 、 d 、 a0(k) 、 δ - 、 p(k) 以及 Hmax 的值。 结合式(11)可得 ΔV(ε(k)) ≤ 2C0 λV(ε(k)) λmin(q) - 2αV(ε(k)) + λmax(q)C0 2 = - 2αV(ε(k)) + λmax(q)C0 2 + 2 αV(ε(k)) λ αλmin(q) C0 ≤ - αV(ε(k)) + (λmax(q) + λ αλmin(q) )C0 2 这里 λ 表示 (F T q) T F T q 的最大特征值。 进而可得 V(ε(k)) ≤ V(ε(0))e -αk + Co 2 α (λmax(q) + λ αλmin(q) )(1 - e -αk ) 则有 lim k→¥ V(ε(k)) ≤ Co 2 α (λmax(q) + λ αλmin(q) ) (12) 由式(11)和式(12),可以得到 C 的一个限定值为 C = C0 αλmin(q) λ + α 2 λmin(q)λmax(q) > 0 因此有 lim k→¥ ‖ξ(k)‖ ≤ C 即在切换拓扑下系统能够达到稳定并实现一致性编 队。 定理 2 证毕。 从定理 1 和定理 2 可知,文中的基于领航跟随 法的编队控制器设计的核心是设定控制参数 r 和 d 的取值范围。 二者可以看作系统收敛过程中的波动 强度因子,顾名思义当它们的值在给定范围内比较 大时系统在收敛的过程中波动比较大也就使得超调 量较大,从而使系统可能需要经过很长时间才达到 稳定或者一直处于调节状态,并且在这种情况下如 果用实际机器人做实验,由于速度剧烈波动可能对 机器人的机械结构有损害。 而当它们取值都比较小 时,虽然在系统收敛的过程中波动较小,但是可能达 到稳定的调节时间会更长。 所以只有当二者在给定 范围内经过多次仿真实验或者凭经验取到合适值时 才能使系统收敛并很快稳定从而实现预期编队。 3 实验结果 本节将分别采用 MATLAB 软件仿真和在美国 MobileRobots 公司生产的 Amigobot 实验平台上做实 验来验证算法的正确性和实际可行性。 该实验部分 主要采用将 3 个智能体的 MATLAB 仿真效果和在 3 个 Amigobot 机器人上做实验的效果做对比的形式 第 3 期 王中林,等:一种多智能体领航跟随编队新型控制器的设计 ·303·
·304. 智能系统学报 第9卷 进行展开。3个智能体中一个做领航者,另外两个 长度分别用x和y表示,单位为m,小三角形表示领 做跟随者,目标设定编成等腰三角形的队形。为了 航者甲,其上的最长的箭头表示甲的方向,图中小正 体现文中提出的算法能够比较方便地编出任意队形 方形表示跟随者乙,小圆点则表示跟随者丙,其上2 特意用MATLAB做了几个其他复杂队形的仿真。 个稍短的箭头则分别表示它们各自的方向,图2(b) Matlab仿真及实际机器人的实验所需要的通信拓扑 中由小正方形和黑色小圆点标识的两条曲线分别表 以如下一种固定拓扑为例进行: 示图2(a)中对应的乙和丙2个跟随者与领航者之 间的线速度之差,横坐标表示仿真步数,单位为1, 纵坐标用的范数It‖表示,单位为m.s1。图2 这里取r=0.1,通过简单计算可得这4种拓扑图中 (a)中编号为1的队形是初始时刻的队形为一条直 4/((2-r)入)=0.7018,不妨取d=0.1,所有智能 线,后面经过依次调整最终接近于期望的稳定的等 体的初始坐标和方向以及初始速度的大小均可随机 腰三角形队形。从图(b)可以看出,当系统经过150 产生,为了方便,文中设定它们的初始方向均指向x 步左右后达到稳定。由于领航者在做圆周运动,丙 轴正方向,且其中领航者甲的坐标为(0,-2),跟 在外圈,乙在最内圈,故从图中数据可知跟随者和领 随者乙的坐标为(0,0),丙的坐标为(0,-1),领 航者之间的线速度之差的绝对值曲线属于正常现 航者的速度大小取‖。‖=0.1(m.s),乙和丙初 象,如果领航者做直线运动线速度之差基本相同且 速度大小为0。且乙和丙相对于甲的相对坐标分别 接近于0。为了体现文中提出的算法能够比较方便 设为(p1P1)=(-1,1),(PaP2)=(-1,-1)。 地编出任意队形,这里特意做了几个相关仿真。如 3.1 MATLAB仿真结果 图3~5所示,分别用7、9、10个智能体编出了箭头、 仿真结果如图2所示。 斧子和五角星3种形状的队形,为简便起见,图中只 12 4甲 用黑色箭头标示出领航者的运动方向。 10 ·乙 ·丙 8 6 20 9 6 15 4 10 10, 0 -5 -202 6 x/m -10 -5 05101520 (a)动态编队图 x/m 图3箭头队形 0.14 Fig.3 The arrow formation 0.12 ((5./=a= 0.10 0.08 10 0.06 0.04 0.02 50100150200250300350 仿真步数 (b)跟随者和领航者之间的速率之差 图2 Matlab仿真结果 10 05 101520 Fig.2 The results of Matlab simulation x/m 图2(a)中动态编队部分选取了12个时刻的队 图4斧子队形 形并按时间顺序做了相应的编号,其中横纵坐标指 Fig.4 The axe formation
进行展开。 3 个智能体中一个做领航者,另外两个 做跟随者,目标设定编成等腰三角形的队形。 为了 体现文中提出的算法能够比较方便地编出任意队形 特意用 MATLAB 做了几个其他复杂队形的仿真。 Matlab 仿真及实际机器人的实验所需要的通信拓扑 以如下一种固定拓扑为例进行: L = 1 - 1 - 1 1 é ë ê ê ù û ú ú ,B = 1 0 0 1 é ë ê ê ù û ú ú ,H = 2 - 1 - 1 2 é ë ê ê ù û ú ú 这里取 r = 0.1,通过简单计算可得这 4 种拓扑图中 4 / ((2 - r)λ max) = 0.7018,不妨取 d = 0.1,所有智能 体的初始坐标和方向以及初始速度的大小均可随机 产生,为了方便,文中设定它们的初始方向均指向 x 轴正方向,且其中领航者甲的坐标为 (0, - 2) ,跟 随者乙的坐标为 (0,0) ,丙的坐标为 (0, - 1) ,领 航者的速度大小取 ‖v0‖ = 0.1(m .s -1 ) ,乙和丙初 速度大小为 0。 且乙和丙相对于甲的相对坐标分别 设为 (px1 ,py1 ) = ( - 1,1),(px2 ,py2 ) = ( - 1, - 1) 。 3.1 MATLAB 仿真结果 仿真结果如图 2 所示。 (a) 动态编队图 (b) 跟随者和领航者之间的速率之差 图 2 Matlab 仿真结果 Fig.2 The results of Matlab simulation 图 2(a)中动态编队部分选取了 12 个时刻的队 形并按时间顺序做了相应的编号,其中横纵坐标指 长度分别用 x 和 y 表示,单位为 m,小三角形表示领 航者甲,其上的最长的箭头表示甲的方向,图中小正 方形表示跟随者乙,小圆点则表示跟随者丙,其上 2 个稍短的箭头则分别表示它们各自的方向,图 2(b) 中由小正方形和黑色小圆点标识的两条曲线分别表 示图 2(a)中对应的乙和丙 2 个跟随者与领航者之 间的线速度之差,横坐标表示仿真步数,单位为 1, 纵坐标用 v - 的范数 ‖v -‖ 表示,单位为 m .s -1 。 图 2 (a)中编号为 1 的队形是初始时刻的队形为一条直 线,后面经过依次调整最终接近于期望的稳定的等 腰三角形队形。 从图(b)可以看出,当系统经过 150 步左右后达到稳定。 由于领航者在做圆周运动,丙 在外圈,乙在最内圈,故从图中数据可知跟随者和领 航者之间的线速度之差的绝对值曲线属于正常现 象,如果领航者做直线运动线速度之差基本相同且 接近于 0。 为了体现文中提出的算法能够比较方便 地编出任意队形,这里特意做了几个相关仿真。 如 图 3~5 所示,分别用 7、9、10 个智能体编出了箭头、 斧子和五角星 3 种形状的队形,为简便起见,图中只 用黑色箭头标示出领航者的运动方向。 图 3 箭头队形 Fig.3 The arrow formation 图 4 斧子队形 Fig.4 The axe formation ·304· 智 能 系 统 学 报 第 9 卷
第3期 王中林,等:一种多智能体领航跟随编队新型控制器的设计 ·305· 尔 12f 10 10A 5 女 6 4 0 -10 -15 -5 05n101520 x/m -8-6-4-202468 x/m 图5五角星队形 图7机器人运动轨迹图 Fig.5 The pentagram formation Fig.7 The motion track of robots 3.2 Amigobot机器人实验结果 图6为在Amigobot机器人上做实验,然后 将实验过程中的机器人的位置坐标以及运动速 度大小和方向打印到本地xt文档中,然后通过 MATLAB读取相应文档的数据画出实验效果 图,画该效果图时文中选取了实验开始时的几 个相隔相对比较密集的3组数据加上中间分布 均匀的一些数据。 (a)图6中标号为时刻1的实验图 12i 4甲 10 乙 。丙 8 为 6 4 2 0 E (b)图6中标号为时刻2的实验图 -8-6-4-202468 x/m 图6 Amigobot机器人实验结果 Fig.6 The experimental result of Amigobot robots 从图6可知,3个机器人能快速成功地实现 编队,然后稳定地按预期的队形运动,从而进一 (c)图6中标号为时刻3的实验图 步验证了文中算法的正确性以及实际可行性。 图8多机器人编队的实验图 图7所示是整个实验过程中Amigobot机器人的 Fig.8 The experiment of multi-robot formation 运动轨迹图。从图2中的(a)和图6可以看出 系统都能够快速收敛,实现预期的稳定编队控 4 结束语 制效果,进而从2个方面验证了文中所提出的 文中假定在该多智能体系统中,每个智能体的 算法的正确性。图8中的(a)~(c)分别对应图 速度无法被他们的邻居智能体实时获取,但位置坐 6中的编号为时刻1~3的实验图。从图8的实 标信息是可以被它的邻居获得的,在这种情况下,采 验图可以更加直观地看出文中所设计的新型领 用邻居的局部控制律以及邻居的状态估计规则的思 航跟随控制器的编队算法的实际可行性。 想来设计控制器输入。在算法中,通过设定跟随者
图 5 五角星队形 Fig.5 The pentagram formation 3.2 Amigobot 机器人实验结果 图 6 为 在 Amigobot 机 器 人 上 做 实 验, 然 后 将实验过程中的机器人的位置坐标以及运动速 度大小和方向打印到本地 txt 文档中,然后通过 MATLAB 读 取 相 应 文 档 的 数 据 画 出 实 验 效 果 图,画该效果图时文中选取了实验开始时的几 个相隔相对比较密集的 3 组数据加上中间分布 均匀的一些数据。 图 6 Amigobot 机器人实验结果 Fig.6 The experimental result of Amigobot robots 从图 6 可知,3 个机器人能快速成功地实现 编队,然后稳定地按预期的队形运动,从而进一 步验证了文中算法的正确性以及实际可行性。 图 7 所示是整个实验过程中 Amigobot 机器人的 运动轨迹图。 从图 2 中的( a) 和图 6 可以看出 系统都能够快速收敛,实现预期的稳定编队控 制效果,进而从 2 个方面验证了文中所提出的 算法的正确性。 图 8 中的( a) ~ ( c) 分别对应图 6 中的编号为时刻 1 ~ 3 的实验图。 从图 8 的实 验图可以更加直观地看出文中所设计的新型领 航跟随控制器的编队算法的实际可行性。 图 7 机器人运动轨迹图 Fig.7 The motion track of robots ( a) 图 6 中标号为时刻 1 的实验图 ( b) 图 6 中标号为时刻 2 的实验图 ( c) 图 6 中标号为时刻 3 的实验图 图 8 多机器人编队的实验图 Fig.8 The experiment of multi⁃robot formation 4 结束语 文中假定在该多智能体系统中,每个智能体的 速度无法被他们的邻居智能体实时获取,但位置坐 标信息是可以被它的邻居获得的,在这种情况下,采 用邻居的局部控制律以及邻居的状态估计规则的思 想来设计控制器输入。 在算法中,通过设定跟随者 第 3 期 王中林,等:一种多智能体领航跟随编队新型控制器的设计 ·305·
·306· 智能系统学报 第9卷 和领航者之间的相对坐标,在智能体个数满足的情 [10]LIU Z X,CHEN Z Q.Discarded consensus of network of 况下能够很方便地实现任意形状编队。为了将所有 agents with state constraint[].IEEE Transactions on Au- 跟随者在绝对坐标系中相对于领航者的相对坐标转 tomatie Control,2012,57(11):2869-2874. [11]HONG Y G,HU J P,GAO L X.Tracking control for 换成在领航者坐标系中相对于领航者的坐标,引进 multi-agent consensus with an active leader and variable 坐标旋转公式实现了整个队形能够随着领航者的运 topology[J].Automatica,2006,42(7):1177-1182. 动方向的变化做相应旋转,该公式的引入在一定程 [12]CHEN Z Q,XIANG L Y,LIU Z X,et al.A tracking con- 度上也让领航者表现出了明显的主导性。文中还分 trol scheme for leader based multi-agent consensus for dis- 别给出了固定拓扑和切换拓扑时的重要定理结论, crete-time case[C//27th Chinese Control Conference. 且分别通过理论详细地证明了算法的正确性。 Kunming,China,2008:494-498. [13]WANG F,GAO L,WANG L.Tracking control for multi-a- 参考文献: gent consensus for discrete-time case [C]//Control and Decision Conference(CCDC).Mianyang,China,2011: [1]VICSEK T,CZIROK A,BEN-JACOB E,et al.Novel type 923-928. of phase transition in a system of self-driven particles[J]. [14]张伟,张安堂,肖宇.基于坐标旋转数字计算方法的三 Physical Review Letters,1995,75(6):1226-1229. 维坐标变换[J].探测与控制学报,2011,33(2):73- [2]JADBABAIE A,LIN J,MORSE A S.Coordination of 76. groups of mobile autonomous agents using nearest neighbor ZHANG Wei,ZHANG Antang,XIAO Yu.Cordic based rules[J].IEEE Transactions on Automatic Control,2003, three-dimensional coordinate transform[J].Journal of De- 48(6):988-1001. tection Control,2011,33(2):73-76. [3]刘佳,陈增强,刘忠信.多智能体系统及其协同控制研 [15]GODSIL C D.ROYLE G,GODSIL C D.Algebraie graph 究进展[J].智能系统学报,2010,5(1):1-9. theory[M].New York:Springer,2001:1-420. LIU Jia,CHEN Zengqiang,LIU Zhongxin.Advances in [16]MERRIS R.Laplacian matrices of graphs:a survey J]. multi-Agent systems and cooperative control J].CAAI Linear algebra and its applications,1994,197:143-176. Transactions on Intelligent Systems,2010,5(1):1-9. [17]HORN R A,JOHNSON C R.Matrix analysis[M].Cam- [4]PENG Z,WEN G,RAHMANI A,et al.Leader-follower bridge:Cambridge University Press,2012:1-541. formation control of nonholonomic mobile robots based on a bioinspired neurodynamic based approach[].Robotics and 作者简介: Autonomous Systems,2013,61(9):988-996. 王中林,男,1988年生,硕士研究 [5]杨甜甜,刘志远,陈虹,等.移动机器人编队控制的现 生,主要研究方向为多智能体系统控 状与问题[J].智能系统学报,2007,2(4):21-25. 制、微数字处理系统在通信与控制中的 YANG Tiantian,LIU Zhiyuan,CHEN Hong,et al.Forma- 应用。 tion control of mobile robots:state and open problems[J] CAAI Transactions on Intelligent Systems,2007,2(4): 21-25. 刘忠信,男,1975年生,教授、博士 [6]PENG Z,WEN G,RAHMANI A.Leader-follower formation 生导师,中国人工智能学会智能空天系 control of multiple nonholonomic robots based on backstep- 统专业委员会委员、中国智能物联系统 ping[C]//Proceedings of the 28th Annual ACM Symposium 建模与仿真专业委员会委员,主要研究 on Applied Computing.Coimbra,Portugal,2013:211-216. 方向为多智能体系统、复杂动态网络、 [7]苏治宝,陆际联.多移动机器人队形控制的研究方法 计算机控制与管理。 [J].机器人,2003,25(1):88-91. SU Zhibao,LU Jilian.Research approach to formation con- 陈增强,男,1964年生,教授、博士 trol of multiple mobile robots J].Robot,2003,25(1): 生导师中国系统仿真学会理事、中国自 88-91. 动化学会控制理论与应用专业委员会 [8]CHOI I S,CHOI J S,CHUNG W J.Leader-follower forma- 委员、中国自动化学会过程控制专业委 tion control without information of heading angle [C]// 员会委员、中国优选法统筹法与经济数 IEEE/SICE International Symposium on System Integration (SII).Fukuoka,Japan,2012:842-846. 学研究会复杂系统专业委员会理事、天津市自动化学会理 [9]CHEN X,SERRANI A,OZBAY H.Control of leader-follo- 事、天津市图形图像学会理事,主要研究方向为智能预测 wer formations of terrestrial UAVs C]//Proceedings of 控制、混沌系统与复杂动态网络、多智能体系统控制。 42nd IEEE Conference on Decision and Control.Maui, USA,2003,1:498-503
生导师中国系统仿真学会理事、中国自 和领航者之间的相对坐标,在智能体个数满足的情 况下能够很方便地实现任意形状编队。 为了将所有 跟随者在绝对坐标系中相对于领航者的相对坐标转 换成在领航者坐标系中相对于领航者的坐标,引进 坐标旋转公式实现了整个队形能够随着领航者的运 动方向的变化做相应旋转,该公式的引入在一定程 度上也让领航者表现出了明显的主导性。 文中还分 别给出了固定拓扑和切换拓扑时的重要定理结论, 且分别通过理论详细地证明了算法的正确性。 参考文献: [1]VICSEK T, CZIRÓK A, BEN⁃JACOB E, et al. Novel type of phase transition in a system of self⁃driven particles[ J]. Physical Review Letters, 1995, 75(6): 1226⁃1229. [2 ] JADBABAIE A, LIN J, MORSE A S. Coordination of groups of mobile autonomous agents using nearest neighbor rules[J]. IEEE Transactions on Automatic Control, 2003, 48(6): 988⁃1001. [3]刘佳, 陈增强, 刘忠信. 多智能体系统及其协同控制研 究进展[J]. 智能系统学报, 2010, 5(1): 1⁃9. LIU Jia, CHEN Zengqiang, LIU Zhongxin. Advances in multi⁃Agent systems and cooperative control [ J ]. CAAI Transactions on Intelligent Systems, 2010, 5(1): 1⁃9. [4] PENG Z, WEN G, RAHMANI A, et al. Leader⁃follower formation control of nonholonomic mobile robots based on a bioinspired neurodynamic based approach[J]. Robotics and Autonomous Systems, 2013, 61(9): 988⁃996. [5]杨甜甜, 刘志远, 陈虹, 等. 移动机器人编队控制的现 状与问题[J]. 智能系统学报, 2007, 2(4): 21⁃25. YANG Tiantian, LIU Zhiyuan, CHEN Hong, et al. Forma⁃ tion control of mobile robots: state and open problems[ J]. CAAI Transactions on Intelligent Systems, 2007, 2 ( 4): 21⁃25. [6]PENG Z, WEN G, RAHMANI A. Leader⁃follower formation control of multiple nonholonomic robots based on backstep⁃ ping[C] / / Proceedings of the 28th Annual ACM Symposium on Applied Computing. Coimbra, Portugal, 2013: 211⁃216. [7]苏治宝, 陆际联. 多移动机器人队形控制的研究方法 [J]. 机器人, 2003, 25(1): 88⁃91. SU Zhibao, LU Jilian. Research approach to formation con⁃ trol of multiple mobile robots [ J]. Robot, 2003, 25 ( 1): 88⁃91. [8]CHOI I S, CHOI J S, CHUNG W J. Leader⁃follower forma⁃ tion control without information of heading angle [ C] / / IEEE/ SICE International Symposium on System Integration (SII). Fukuoka, Japan, 2012: 842⁃846. [9]CHEN X, SERRANI A, OZBAY H. Control of leader⁃follo⁃ wer formations of terrestrial UAVs [ C ] / / Proceedings of USA, 2003, 1: 498⁃503. [10]LIU Z X, CHEN Z Q. Discarded consensus of network of agents with state constraint[J]. IEEE Transactions on Au⁃ tomatic Control, 2012, 57(11): 2869⁃2874. [11] HONG Y G, HU J P, GAO L X. Tracking control for multi⁃agent consensus with an active leader and variable topology[J]. Automatica, 2006, 42(7): 1177⁃1182. [12]CHEN Z Q, XIANG L Y, LIU Z X, et al. A tracking con⁃ trol scheme for leader based multi⁃agent consensus for dis⁃ crete⁃time case [ C] / / 27th Chinese Control Conference. Kunming, China, 2008: 494⁃498. [13]WANG F, GAO L, WANG L. Tracking control for multi⁃a⁃ gent consensus for discrete⁃time case [ C] / / Control and Decision Conference ( CCDC). Mianyang, China, 2011: 923⁃928. [14]张伟, 张安堂, 肖宇. 基于坐标旋转数字计算方法的三 维坐标变换[ J]. 探测与控制学报, 2011, 33( 2): 73⁃ 76. ZHANG Wei, ZHANG Antang, XIAO Yu. Cordic based three⁃dimensional coordinate transform[ J]. Journal of De⁃ tection & Control, 2011, 33(2): 73⁃76. [15]GODSIL C D, ROYLE G, GODSIL C D. Algebraic graph theory[M]. New York: Springer, 2001: 1⁃420. [16] MERRIS R. Laplacian matrices of graphs: a survey[ J]. Linear algebra and its applications, 1994, 197: 143⁃176. [17]HORN R A, JOHNSON C R. Matrix analysis[M]. Cam⁃ bridge: Cambridge University Press, 2012: 1⁃541. 作者简介: 王中林,男,1988 年生,硕士研究 生,主要研究方向为多智能体系统控 制、微数字处理系统在通信与控制中的 应用。 刘忠信,男,1975 年生,教授、博士 生导师,中国人工智能学会智能空天系 统专业委员会委员、中国智能物联系统 建模与仿真专业委员会委员,主要研究 方向为多智能体系统、复杂动态网络、 计算机控制与管理。 陈增强,男,1964 年生,教授、博士 42nd IEEE Conference on Decision and Control. Maui, 306· 控制、混沌系统与复杂动 学研究会复杂系统专业委员会理事、天津市自动化学会理 态网络、多智能体系统控制。 · 智 能 系 统 学 报 第 9 卷 动化学会控制理论与应用专业委员会 委员、中国自动化学会过程控制专业委 员会委员、中国优选法统筹法与经济数 事、天津市图形图像学会理事,主要研究方向为智能预测