工程科学学报,第40卷,第2期:241-251,2018年2月 Chinese Joural of Engineering,Vol.40,No.2:241-251,February 2018 DOI:10.13374/j.issn2095-9389.2018.02.015;http://journals.ustb.edu.cn 离散时间多智能体系统的协调最优预见跟踪 卢延荣,廖福成四,任金鸣,付海龙,盛超逸 北京科技大学数理学院,北京100083 ☒通信作者,E-mail:fcliao@usth.edu.cn 摘要在互联拓扑包含一棵有向生成树的条件下,研究了离散时间多智能体系统的协调最优预见跟踪问题.首先利用状态 增广技术把协调跟踪问题转化为一个增广系统的全局最优调节问题.然后应用离散时间线性二次型调节理论的相关结果给 出了使增广系统的闭环系统渐近稳定的控制器,并由此得到原系统实现跟踪一致性的全局最优预见控制器.仿真结果不仅 验证了所设计控制器的有效性,并且表明适当增加预见步长对保证准确跟踪领导者的输出是至关重要的. 关键词多智能体系统:协调跟踪:预见控制:代数Riccati方程 分类号TG142.71 Cooperative optimal preview tracking control of discrete-time multi-agent systems LU Yan-rong,LIAO Fu-cheng,REN Jin-ming,FU Hai-long,SHENG Chao-yi School of Mathematics and Physics,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:fcliao@ustb.edu.cn ABSTRACT This study investigated the cooperative optimal preview tracking problem of discrete-time multi-agent systems under the assumption of the communication topology containing a directed spanning tree.First,a state augmentation technique was used to con- vert the cooperative preview tracking problem into a global optimal regulation problem of an augmented system.Second,by resorting to relative conclusions about the discrete-time linear quadratic regulation theory,an optimal controller was obtained,which can guarantee the asymptotic stability of the closed-loop augmented system.Moreover,a global optimal preview controller was provided in order for the original system to achieve the tracking consensus.Finally,the simulation results not only verified the effectiveness of the designed controller,but also indicated that it is critical for accurately tracking the reference signal to moderately increase the preview length. KEY WORDS multi-agent systems;cooperative tracking;preview control;algebraic Riccati equation 近年来,受复杂系统理论、传感、计算机以及通 言,一致性问题可分为两类,即无领导者的一致性 信技术等快速发展的影响,多智能体系统的协调控 问题和有领导者的同步问题,后者也称为分布式跟 制受到了研究者的广泛关注.协调控制研究的主要 踪问题、领导者跟随者一致性问题或牵引控制问 问题是根据所设计的分布式控制策略来分析智能体 题等. 的动态特性与智能体间的信息交换拓扑对系统整体 在无领导者一致性问题研究方面,文献[2]分 行为的影响. 别在拓扑为固定或切换、通信存在或缺少时滞、以及 一致性问题在计算机科学中有着很长的历 信息流为有向或无向的假设下,较全面地研究了具 史),近期在多智能体系统的背景下已逐渐成为协 有一阶积分器系统的一致性问题,并为每一种情形 调控制研究中的一个重要而基本的问题.一般而 提供了收敛性分析.文献[3]考虑了二阶积分器系 收稿日期:2017-06-01 基金项目:国家自然科学基金资助项目(61174209)
工程科学学报,第 40 卷,第 2 期:241鄄鄄251,2018 年 2 月 Chinese Journal of Engineering, Vol. 40, No. 2: 241鄄鄄251, February 2018 DOI: 10. 13374 / j. issn2095鄄鄄9389. 2018. 02. 015; http: / / journals. ustb. edu. cn 离散时间多智能体系统的协调最优预见跟踪 卢延荣, 廖福成苣 , 任金鸣, 付海龙, 盛超逸 北京科技大学数理学院, 北京 100083 苣 通信作者, E鄄mail: fcliao@ ustb. edu. cn 摘 要 在互联拓扑包含一棵有向生成树的条件下,研究了离散时间多智能体系统的协调最优预见跟踪问题. 首先利用状态 增广技术把协调跟踪问题转化为一个增广系统的全局最优调节问题. 然后应用离散时间线性二次型调节理论的相关结果给 出了使增广系统的闭环系统渐近稳定的控制器, 并由此得到原系统实现跟踪一致性的全局最优预见控制器. 仿真结果不仅 验证了所设计控制器的有效性, 并且表明适当增加预见步长对保证准确跟踪领导者的输出是至关重要的. 关键词 多智能体系统; 协调跟踪; 预见控制; 代数 Riccati 方程 分类号 TG142郾 71 收稿日期: 2017鄄鄄06鄄鄄01 基金项目: 国家自然科学基金资助项目(61174209) Cooperative optimal preview tracking control of discrete鄄time multi鄄agent systems LU Yan鄄rong, LIAO Fu鄄cheng 苣 , REN Jin鄄ming, FU Hai鄄long, SHENG Chao鄄yi School of Mathematics and Physics, University of Science and Technology Beijing, Beijing 100083, China 苣 Corresponding author, E鄄mail: fcliao@ ustb. edu. cn ABSTRACT This study investigated the cooperative optimal preview tracking problem of discrete鄄time multi鄄agent systems under the assumption of the communication topology containing a directed spanning tree. First, a state augmentation technique was used to con鄄 vert the cooperative preview tracking problem into a global optimal regulation problem of an augmented system. Second, by resorting to relative conclusions about the discrete鄄time linear quadratic regulation theory, an optimal controller was obtained, which can guarantee the asymptotic stability of the closed鄄loop augmented system. Moreover, a global optimal preview controller was provided in order for the original system to achieve the tracking consensus. Finally, the simulation results not only verified the effectiveness of the designed controller, but also indicated that it is critical for accurately tracking the reference signal to moderately increase the preview length. KEY WORDS multi鄄agent systems; cooperative tracking; preview control; algebraic Riccati equation 近年来, 受复杂系统理论、传感、计算机以及通 信技术等快速发展的影响, 多智能体系统的协调控 制受到了研究者的广泛关注. 协调控制研究的主要 问题是根据所设计的分布式控制策略来分析智能体 的动态特性与智能体间的信息交换拓扑对系统整体 行为的影响. 一致性问题在计算机科学中有着很长的历 史[1] , 近期在多智能体系统的背景下已逐渐成为协 调控制研究中的一个重要而基本的问题. 一般而 言, 一致性问题可分为两类, 即无领导者的一致性 问题和有领导者的同步问题, 后者也称为分布式跟 踪问题、领导者跟随者一致性问题或牵引控制问 题等. 在无领导者一致性问题研究方面, 文献[2]分 别在拓扑为固定或切换、通信存在或缺少时滞、以及 信息流为有向或无向的假设下, 较全面地研究了具 有一阶积分器系统的一致性问题, 并为每一种情形 提供了收敛性分析. 文献[3]考虑了二阶积分器系
·242· 工程科学学报,第40卷,第2期 统的分布式协议设计问题,并在无向信息交换拓扑 H2最优预见控制问题,其处理问题的核心思想是 的假设下推出了系统实现一致性所需的充要条件. 将H,调节问题看做具有多输入时滞的线性二次型 随后,该问题在文献[4]中得到了进一步深入的研 最优调节问题.文献[27]与文献[26]在处理问题 究.当切换互联拓扑满足频繁连通的假设时,文献 的主要思想上是一致的,不同的是,文献[27]中的 [5]为多智能体系统设计了基于局部信息的分散式 方法不仅给出了预见时间与H,性能之间的解析表 控制器,并证明实现一致性的充分条件为线性系统 达式,而且可以处理参考信号分量的预见步长为相 完全能控.针对互联拓扑中每个智能体的输出信息 异的情形.文献[28]研究了凸多面体不确定离散时 可测的情形,文献[6]采用低增益方法设计了实现 间系统的鲁棒预见控制问题,作者基于混合LQ/ 一致性所需的分布式动态补偿器.近来,该方法得 H判据设计了能抑制外部干扰的鲁棒伺服控制器 到了进一步推广,解决了广义多智能体系统的一致 文献[29]采用上述方法设计了参数相关的静态输 性问题].文献[8]根据每个智能体邻居的输出信 出反馈预见控制器.当模型中存在大的参数不确定 息设计了观测器型一致性协议,使得多智能体系统 性时,文献[30]中的作者基于多模型自适应控制给 能按给定的收敛速度实现一致性.文献[9]考虑了 出了一种新的预见控制器设计方法. 多智能体系统的H,和H,控制器设计问题(H,和 文献[31]中首次研究了连续时间多智能体系 H均为范数),作者引入了H2和H性能区域的概 统的协调预见跟踪问题,在所给的信息交换拓扑 念用以度量协议的鲁棒性.文献[10]研究了离散时 下,全局虚拟调节误差渐近地趋于零蕴含着系统可 间多智能体系统的一致性问题,其中的模型具有传 实现协调预见跟踪.于是建立基于全局虚拟调节误 递非线性和时变时滞.当模型中具有输入饱和限制 差和全局状态向量导数的增广系统,从而将协调跟 时,文献[11]在固定无向拓扑的情形下给出了系统 踪问题转化为最优调节问题,这是文献[31]处理协 实现全局一致性的必要条件.文献[12]运用行随机 调预见跟踪问题的主要思想.本文将文献[31]中的 矩阵的乘积性质解决了一类离散时间线性多智能体 方法扩展至离散时间系统的情形,与文献[31]不同 系统的收敛性分析问题.更多关于一致性问题的研 的是,通过构建关于预见信息差分的恒等式,增广 后的系统可进一步转化为标准的离散时间线性系 究成果可参见文献[13-14]. 统.在用线性二次型最优控制理论获得全局最优预 对于有领导者的同步问题,文献[15]在切换互 见控制器后,可根据系统矩阵的特点对控制器和代 联拓扑的情形下考虑了多智能体系统的领导者-跟 数Riccati方程进行降阶处理,使所得的结果可用 随者一致性问题,通过构建公共Lyapunov函数,作 初次进行系统增广后的相应矩阵表示.这将在一定 者证明所设计的分布式控制策略可实现对动态领导 程度上降低仿真时的计算复杂度 者的跟踪.在模型中存在可测噪声以及互联拓扑为 有向的情形下,文献[16]设计了带有分布式估计器 1记号与有关基础知识 的控制策略,并分析了跟踪误差的均方收敛情况. 本节给出文中用到的一些主要记号和概念. 文献[17]考虑的模型为具有多时变时滞的二阶积 R(C)为实数(复数)集.Rx(C)为n×l 分器系统,并在拓扑为固定和切换的情形下分别给 的实数矩阵(复数矩阵)集合.I,表示n×n的单位 出了实现跟踪一致性的充要条件和充分条件.随 矩阵,后文此形式均表示相应的单位矩阵.1∈R" 后,文献[18]将上述问题推广到了一般线性系统的 表示元素都为1的列向量.0∈Rx表示n×l的零 情形.关于跟踪一致问题的其他重要结果还可参见 矩阵.diag(a1,a2,…,an)表示对角矩阵,其中a 文献[19-20]. (i=1,2,…,n)为主对角元素,其余元素为0.对于 预见控制自提出以来便在实践中得到了成功的 矩阵A∈RaxL,B∈RPx9,A⑧B表示Kronecker 应用[21-2],其主要思想是利用已知的未来信息设 积,其定义为 计带有预见补偿作用的控制器,以提高闭环系统的 「aB …aB 跟踪和(或)抗干扰品性.预见控制的理论研究已经 A⑧B= 取得了长足的进步,尤其是线性二次型最优预见控 LanB…anB」 制,有关结果可参见文献[23-25].近年来,基于 容易验证,Kronecker积满足如下性质:(A⑧B)(C☒ H2和H。的最优预见控制问题也得到了深入的研 D)=(AC)☒(BD),(A⑧B)T=A'⑧B,A☒B+ 究.文献[26]中处理了具有多输入多输出时滞的 A⑧C=A⑧(B+C),其中C和D为具有适当维数
工程科学学报,第 40 卷,第 2 期 统的分布式协议设计问题, 并在无向信息交换拓扑 的假设下推出了系统实现一致性所需的充要条件. 随后, 该问题在文献[4]中得到了进一步深入的研 究. 当切换互联拓扑满足频繁连通的假设时, 文献 [5]为多智能体系统设计了基于局部信息的分散式 控制器, 并证明实现一致性的充分条件为线性系统 完全能控. 针对互联拓扑中每个智能体的输出信息 可测的情形, 文献[6]采用低增益方法设计了实现 一致性所需的分布式动态补偿器. 近来, 该方法得 到了进一步推广, 解决了广义多智能体系统的一致 性问题[7] . 文献[8]根据每个智能体邻居的输出信 息设计了观测器型一致性协议, 使得多智能体系统 能按给定的收敛速度实现一致性. 文献[9]考虑了 多智能体系统的 H2 和 H肄 控制器设计问题(H2 和 H肄 均为范数), 作者引入了 H2 和 H肄 性能区域的概 念用以度量协议的鲁棒性. 文献[10]研究了离散时 间多智能体系统的一致性问题, 其中的模型具有传 递非线性和时变时滞. 当模型中具有输入饱和限制 时, 文献[11]在固定无向拓扑的情形下给出了系统 实现全局一致性的必要条件. 文献[12]运用行随机 矩阵的乘积性质解决了一类离散时间线性多智能体 系统的收敛性分析问题. 更多关于一致性问题的研 究成果可参见文献[13鄄鄄14]. 对于有领导者的同步问题, 文献[15]在切换互 联拓扑的情形下考虑了多智能体系统的领导者鄄鄄 跟 随者一致性问题, 通过构建公共 Lyapunov 函数, 作 者证明所设计的分布式控制策略可实现对动态领导 者的跟踪. 在模型中存在可测噪声以及互联拓扑为 有向的情形下, 文献[16]设计了带有分布式估计器 的控制策略, 并分析了跟踪误差的均方收敛情况. 文献[17]考虑的模型为具有多时变时滞的二阶积 分器系统, 并在拓扑为固定和切换的情形下分别给 出了实现跟踪一致性的充要条件和充分条件. 随 后, 文献[18]将上述问题推广到了一般线性系统的 情形. 关于跟踪一致问题的其他重要结果还可参见 文献[19鄄鄄20]. 预见控制自提出以来便在实践中得到了成功的 应用[21鄄鄄22] , 其主要思想是利用已知的未来信息设 计带有预见补偿作用的控制器, 以提高闭环系统的 跟踪和(或)抗干扰品性. 预见控制的理论研究已经 取得了长足的进步, 尤其是线性二次型最优预见控 制, 有关结果可参见文献[23鄄鄄 25]. 近年来, 基于 H2 和 H肄 的最优预见控制问题也得到了深入的研 究. 文献[26]中处理了具有多输入多输出时滞的 H2 最优预见控制问题, 其处理问题的核心思想是 将 H2 调节问题看做具有多输入时滞的线性二次型 最优调节问题. 文献[27]与文献[26]在处理问题 的主要思想上是一致的, 不同的是, 文献[27]中的 方法不仅给出了预见时间与 H2 性能之间的解析表 达式, 而且可以处理参考信号分量的预见步长为相 异的情形. 文献[28]研究了凸多面体不确定离散时 间系统的鲁棒预见控制问题, 作者基于混合 LQ/ H肄 判据设计了能抑制外部干扰的鲁棒伺服控制器. 文献[29]采用上述方法设计了参数相关的静态输 出反馈预见控制器. 当模型中存在大的参数不确定 性时, 文献[30]中的作者基于多模型自适应控制给 出了一种新的预见控制器设计方法. 文献[31]中首次研究了连续时间多智能体系 统的协调预见跟踪问题, 在所给的信息交换拓扑 下, 全局虚拟调节误差渐近地趋于零蕴含着系统可 实现协调预见跟踪. 于是建立基于全局虚拟调节误 差和全局状态向量导数的增广系统, 从而将协调跟 踪问题转化为最优调节问题, 这是文献[31]处理协 调预见跟踪问题的主要思想. 本文将文献[31]中的 方法扩展至离散时间系统的情形, 与文献[31]不同 的是, 通过构建关于预见信息差分的恒等式, 增广 后的系统可进一步转化为标准的离散时间线性系 统. 在用线性二次型最优控制理论获得全局最优预 见控制器后, 可根据系统矩阵的特点对控制器和代 数 Riccati 方程进行降阶处理, 使所得的结果可用 初次进行系统增广后的相应矩阵表示. 这将在一定 程度上降低仿真时的计算复杂度. 1 记号与有关基础知识 本节给出文中用到的一些主要记号和概念. 迬 (迯 )为实数(复数)集. 迬 n 伊 l (迯 n 伊 l )为 n 伊 l 的实数矩阵(复数矩阵)集合. In 表示 n 伊 n 的单位 矩阵,后文此形式均表示相应的单位矩阵. 1沂迬 n 表示元素都为 1 的列向量. 0沂迬 n 伊 l表示 n 伊 l 的零 矩阵. diag( a1 ,a2 ,…,an ) 表示对角矩阵, 其中 ai (i = 1,2,…,n)为主对角元素, 其余元素为 0. 对于 矩阵 A沂迬 n 伊 l , B沂迬 p 伊 q , A茚B 表示 Kronecker 积, 其定义为 A茚B = a11B … a1lB 左 埙 左 an1B … anl é ë ê ê ê ù û ú ú ú B 容易验证, Kronecker 积满足如下性质:(A茚B)(C茚 D) = (AC)茚(BD), (A茚B) T = A T茚B T , A茚B + A茚C = A茚(B + C), 其中 C 和 D 为具有适当维数 ·242·
卢延荣等:离散时间多智能体系统的协调最优预见跟踪 ·243· 的矩阵.有关Kronecker积的其他性质,可参考文 另外,设r(k)的预见步数为M,即对于当前时标 献[32]. k,参考信号r(k),r(k+1),r(k+2),…,r(k+ 对于多智能体系统,智能体间的信息交换拓扑 M.)的值为已知,M。步以后的值为常值,即 通常用有向图罗=((),))表示,其中(分= r(k+j)=r(k),j=Mg+1,Mg+2,Mg+3,… {,2,…,w}是顶点集,(分二孔分×(分代 用预见控制的相关理论来设计控制器.首先把 表弧集.顶点,∈(分表示第i个智能体,弧(:, (1)写成紧凑形式,为此引入向量 秒)∈队表示第j个智能体可以接受来自第i个 「x,(k)7 u(k) 智能体的信息,其中顶点:称为父顶点,)称为子 x2(k) 42(k) 顶点,并称:为心的邻居.基于此,定义第i个智 x(k)= ∈RN,u(k)= ∈Rw 能体的邻居集为={1(巴,:)∈(}.在有向 图罗中,如果除根顶点外,其他顶点有且只有一个 xx() LuN() 父顶点,则称有向图罗为一棵有向树.另外,在有 (k)1 向图罗中,若其全部顶点和部分弧组成的有向图为 2(k) y(k)= ∈RW. 一棵有向树,则称有向图罗包含一棵生成树 定义有向图罗的邻接矩阵为W=[a]∈ Lyx(k)」 RxN,ag表示弧(,)的权重.规定:若(,)∈ 系统(1)可表示为 分,a=1,否则a,=0.拉普拉斯矩阵L= (x(k+1)=(Iw⑧A)x(k)+(Iw☒B)u(k) [l与]∈Rxw,定义为l=∑a,l与=-a与,ij:i, y(k)=(Iw⑧C)x(k) jc. x(0)=xo (3) j=1,2,…N,显然∑与=0. 进一步,对系统(1)及其对应的有向信息交换 本文视参考信号r(k)为领导者(标记为顶点 拓扑写作如下假设 )的输出轨迹.如果第i个顶点能够接受来自领导 B A2:设(A,B)可镇定且 行满秩,1 者的信息,则弧(o,:)存在并记其权重m:=1,否 0 则m:=0.此外,记牵引矩阵为M=diag(m1,m2, 表示具有适当维数的单位矩阵. …,my). A3:设(C,A)可检测. A4:设有向图罗包含一棵生成树,而且根顶点 2问题描述 v,能够观测到来自领导者的信息,即m.=1. 考虑由N个跟随者和一个领导者构成的多智 对于假设A4,一个已知的结果是: 能体系统,其中跟随者的动力学方程为 引理13)如果假设A4成立,那么有 x:(k+1)=Ax,(k)+Bu:(k) (1)L1w=0,换言之,0是矩阵L的一个特征 ,x:(0)=x0, y;(k)=Cx;(k) 值,其相应的特征向量为1、; i=1,2,…,W (1) (2)矩阵H非奇异且其所有特征值具有正的实 其中,x(k)∈R",u:(k)∈R',y:(k)∈R'分别表 部,其中,H=L+M. 示状态,输人和输出,xm表示x:(k)的初值,A、B 在随后的讨论中,我们还需要用到下面的 和C分别为n×n、n×r和l×n的矩阵.对于取定 结果 的i,(1)中的方程就是第i个跟随者的状态方程 引理2 在假设A4成立时,矩阵 设领导者的输出(即参考信号)为r(k),本文 H⑧C 0 的目的是设计一个最优预见控制器,使得系统(1) 行满秩的充分必要条件是 IN-(I,⑧A)I,⑧B」 的闭环系统的输出y,(k)都渐近跟踪r(k),即 lim[y:(k)-r(k)]=0,i=1,2,…,N(2) 1-AB行满秩 0 首先对参考信号作如下假设. 附注1这一结果的证明方法与文献[31]中引 A1:设参考信号r(k)在k→∞时趋于常值向量 理3的证明方法很相似,因此不再重复. r,即 定义跟随者i(i=1,2,…,N)的局部邻居输出 limr(k)=r 误差为
卢延荣等: 离散时间多智能体系统的协调最优预见跟踪 的矩阵. 有关 Kronecker 积的其他性质, 可参考文 献[32]. 对于多智能体系统, 智能体间的信息交换拓扑 通常用有向图 G = (V(G),E(G))表示, 其中 V(G) = {v1 ,v2 ,…,vN }是顶点集, E(G)哿V(G) 伊 V(G)代 表弧集. 顶点 vi沂V(G)表示第 i 个智能体, 弧( vi, vj)沂E(G)表示第 j 个智能体可以接受来自第 i 个 智能体的信息, 其中顶点 vi 称为父顶点, vj 称为子 顶点, 并称 vi 为 vj 的邻居. 基于此, 定义第 i 个智 能体的邻居集为 Ni = {j | (vj,vi)沂E(G)}. 在有向 图 G 中, 如果除根顶点外, 其他顶点有且只有一个 父顶点, 则称有向图 G 为一棵有向树. 另外, 在有 向图 G 中, 若其全部顶点和部分弧组成的有向图为 一棵有向树, 则称有向图 G 包含一棵生成树. 定义有 向 图 G 的 邻 接 矩 阵 为 W = [ aij ] 沂 迬 N 伊 N , aij表示弧(vj,vi)的权重. 规定:若( vj,vi)沂 E(G), aij = 1, 否则 aij = 0. 拉普拉斯矩阵 L = [l ij]沂迬 N 伊 N ,定义为 l ii = 移 j沂Ni aij, l ij = - aij, i屹j; i, j = 1,2,…,N, 显然 移 N j = 1 l ij = 0. 本文视参考信号 r( k) 为领导者(标记为顶点 v0 )的输出轨迹. 如果第 i 个顶点能够接受来自领导 者的信息, 则弧(v0 ,vi)存在并记其权重 mi = 1, 否 则 mi = 0. 此外, 记牵引矩阵为 M = diag(m1 ,m2 , …,mN). 2 问题描述 考虑由 N 个跟随者和一个领导者构成的多智 能体系统, 其中跟随者的动力学方程为 xi(k + 1) = Axi(k) + Bui(k) yi(k) = Cxi(k { ) , xi(0) = xi0 , i = 1,2,…,N (1) 其中,xi(k)沂迬 n , ui(k)沂迬 r , yi(k)沂迬 l 分别表 示状态, 输入和输出, xi0 表示 xi ( k) 的初值, A、B 和 C 分别为 n 伊 n、n 伊 r 和 l 伊 n 的矩阵. 对于取定 的 i, (1)中的方程就是第 i 个跟随者的状态方程. 设领导者的输出(即参考信号)为 r( k), 本文 的目的是设计一个最优预见控制器, 使得系统(1) 的闭环系统的输出 yi(k)都渐近跟踪 r(k), 即 lim k寅肄 [yi(k) - r(k)] = 0, i = 1,2,…,N (2) 首先对参考信号作如下假设. A1: 设参考信号 r(k)在 k寅肄 时趋于常值向量 r, 即 lim k寅肄 r(k) = r 另外, 设 r( k)的预见步数为 MR,即对于当前时标 k, 参考信号 r( k), r( k + 1), r( k + 2),…,r( k + MR)的值为已知, MR 步以后的值为常值, 即 r(k + j) = r(k), j = MR + 1,MR + 2,MR + 3,… 用预见控制的相关理论来设计控制器. 首先把 (1)写成紧凑形式, 为此引入向量 x(k) = x1 (k) x2 (k) 左 xN(k é ë ê ê ê ê ê ù û ú ú ú ú ú ) 沂迬 nN , u(k) = u1 (k) u2 (k) 左 uN(k é ë ê ê ê ê ê ù û ú ú ú ú ú ) 沂迬 rN , y(k) = y1 (k) y2 (k) 左 yN(k é ë ê ê ê ê ê ù û ú ú ú ú ú ) 沂迬 lN . 系统(1)可表示为 x(k + 1) = (IN茚A)x(k) + (IN茚B)u(k) y(k) = (IN茚C)x(k { ) , x(0) = x0 (3) 进一步, 对系统(1)及其对应的有向信息交换 拓扑 G 作如下假设. A2: 设(A,B) 可镇定且 I - A B C é ë ê ê ù û ú ú 0 行满秩, I 表示具有适当维数的单位矩阵. A3: 设(C,A)可检测. A4: 设有向图 G 包含一棵生成树, 而且根顶点 vi r能够观测到来自领导者的信息, 即 mi r = 1. 对于假设 A4, 一个已知的结果是: 引理 1 [31] 如果假设 A4 成立, 那么有 (1)L1N = 0, 换言之, 0 是矩阵 L 的一个特征 值, 其相应的特征向量为 1N; (2)矩阵 H 非奇异且其所有特征值具有正的实 部,其中,H = L + M. 在随后的讨论中, 我 们 还 需 要 用 到 下 面 的 结果. 引 理 2 在 假 设 A4 成 立 时, 矩 阵 H茚C 0 InN - (IN茚A) IN茚 é ë ê ê ù û ú Bú行满秩的充分必要条件是 I - A B C é ë ê ê ù û ú ú 0 行满秩. 附注 1 这一结果的证明方法与文献[31]中引 理 3 的证明方法很相似, 因此不再重复. 定义跟随者 i( i = 1,2,…,N) 的局部邻居输出 误差为 ·243·
·244· 工程科学学报,第40卷,第2期 e,(k)=∑a,y,(k)-y:(k)+m,(r(k)-y,(k) M⑧L ie GR= (4) 由假设A1知,对于当前时标k,R(k),R(k+ 记全局输出误差为 1),R(k+2),…,R(k+M。)的值是已知的.基于 e,(k)7 此,将参考信号的增量做成列向量 e2(k) e(k)= ∈RW △R(k+1) △R(k+2) Lex(k) X(k)= 并令R(k)=1v⑧r()∈R,则由(4)得到 △R(k+MR)」 e(k)=-((L+M)⑧C)x(k)+(M⑧L)R(k) 显然,X(k)满足如下的代数关系 (5) XR(k+1)=AgXg(k) (9) 其中,L为有向图对应的拉普拉斯矩阵,M为牵 其中AR是(lNM)×(lNMR)矩阵,定义为 引矩阵.为方便起见,记H=L+M.注意到H1v= 0 0 07 (L+M)1x=M1w,则(4)可表示为 e(k)=-(H⑧l)(Ix⑧C)x(k)-R(k)(6) AR= 0 在假设A4下,由于H非奇异,因此从(6)得到当 且仅当lime(k)=0时(2)成立.为此,引入如下的 0 二次型性能指标函数 再次引入状态变量 J=∑∑e(k)0e,(k)+△u(k)R△u,(k) 「X(k)1 Xgo(k) k=-g+1=1 Xp(k) (7) 于是,结合(8)和(9)得到标准的离散时间线性 式中,Q和R分别是l×l和r×r的正定矩阵(i= 系统 1,2,…,N).文献[23]指出,在性能指标中引入输 Xo(+1)=Xgo(k)+Au(k) (10) 入的差分△u,(k),可使闭环系统中包含积分器,而 其中,2= = 「G. 亚= 积分器的存在有助于消除系统在跟踪过程中产生的 0 AR 静态误差. [Gg0… 0],并且2和⊙分别为[N(l+n+ 下面采用预见控制的方法构造一个增广系统, lM.)]×[N(l+n+lMR)]和[N(l+n+lMR)]× 将多智能体系统的协调预见跟踪问题转化为对增广 (Nr)的矩阵. 系统的状态调节问题,然后设计所需要的控制器. 根据本文的控制目的,取观测方程为 e(k)=IXgo(k) (11) 3最优预见控制器的设计 其中,T=[Co0]为(lW)×[N(l+n+lM.)]的矩 3.1增广系统的构造 阵.则(10)和(11)即为所需要的增广系统 将一阶后向差分算子△: 根据系统(10)中的相关变量,性能指标函数 △r(k)=x(k)-x(k-1) (7)可表示为 作用于系统(3)和全局输出误差(5),并引入状态 向量 J=豆(0x()+a如()u() (12) X(k) e(k) L△r(k) 得到 -[88e-[8 ,分别为[N(l+n+ X(k+1)=ΦX(k)+G.△u(k)+GR△R(k+1) Ma)]×[N(l+n+M)]和[(l+n)N]×[(l+n) (8) N]的半正定矩阵.另外,Q.=diag(Q。,Qa,…, 「I-H☒CA -H⑧CB 其中,Φ= Qv),R=diag(R1,R2,…,R). 0I⑧A G。= Iv⑧B 至此,离散时间多智能体系统的协调预见跟踪
工程科学学报,第 40 卷,第 2 期 ei(k) = 移 j沂Ni aij(yj(k) - yi(k)) + mi(r(k) - yi(k)) (4) 记全局输出误差为 e(k) = e1 (k) e2 (k) 左 eN(k é ë ê ê ê ê ê ù û ú ú ú ú ú ) 沂迬 lN 并令 R(k) = 1N茚r(k)沂迬 lN , 则由(4)得到 e(k) = - ((L + M)茚C)x(k) + (M茚Il)R(k) (5) 其中, L 为有向图 G 对应的拉普拉斯矩阵, M 为牵 引矩阵. 为方便起见,记 H = L + M. 注意到 H1N = (L + M)1N = M1N, 则(4)可表示为 e(k) = - (H茚Il)((IN茚C)x(k) - R(k)) (6) 在假设 A4 下, 由于 H 非奇异, 因此从(6)得到当 且仅当lim k寅肄 e(k) = 0 时(2)成立. 为此, 引入如下的 二次型性能指标函数 J = 移 肄 k = -MR+1移 N i = 1 e T i (k)Qei ei(k) + 驻u T i (k)R寛i驻ui(k) (7) 式中, Qei和 R寛i 分别是 l 伊 l 和 r 伊 r 的正定矩阵(i = 1,2,…,N). 文献[23]指出, 在性能指标中引入输 入的差分 驻ui(k), 可使闭环系统中包含积分器, 而 积分器的存在有助于消除系统在跟踪过程中产生的 静态误差. 下面采用预见控制的方法构造一个增广系统, 将多智能体系统的协调预见跟踪问题转化为对增广 系统的状态调节问题, 然后设计所需要的控制器. 3 最优预见控制器的设计 3郾 1 增广系统的构造 将一阶后向差分算子 驻: 驻x(k) = x(k) - x(k - 1) 作用于系统(3)和全局输出误差(5), 并引入状态 向量 X0 (k) = e(k) 驻x(k é ë ê ê ù û ú ú ) 得到 X0 (k + 1) = 椎X0 (k) + Gu驻u(k) + GR驻R(k + 1) (8) 其 中, 椎 = I - H茚CA 0 IN茚 é ë ê ê ù û ú A ú , Gu = - H茚CB IN茚 é ë ê ê ù û ú B ú , GR = M茚I é l ë ê ê ù û ú ú 0 . 由假设 A1 知, 对于当前时标 k, R(k), R(k + 1), R(k + 2), …, R(k + MR )的值是已知的. 基于 此, 将参考信号的增量做成列向量 XR(k) = 驻R(k + 1) 驻R(k + 2) 左 驻R(k + MR é ë ê ê ê ê ê ù û ú ú ú ú ú ) 显然, XR(k)满足如下的代数关系 XR(k + 1) = ARXR(k) (9) 其中 AR 是(lNMR) 伊 (lNMR)矩阵, 定义为 AR = 0 IlN 0 … 0 左 埙 埙 埙 左 左 埙 埙 0 左 埙 IlN 0 … … … é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 0 再次引入状态变量 XR0 (k) = X0 (k) XR(k é ë ê ê ù û ú ú ) 于是, 结合(8) 和(9) 得到标准的离散时间线性 系统 XR0 (k + 1) = 赘XR0 (k) + 专驻u(k) (10) 其 中, 赘 = 椎 追 0 A é ë ê ê ù û ú ú R , 专 = éGu ë ê ê ù û ú ú 0 , 追 = [GR 0 … 0],并且 赘 和 专 分别为[N( l + n + lMR)] 伊 [N( l + n + lMR )] 和[N( l + n + lMR )] 伊 (Nr)的矩阵. 根据本文的控制目的, 取观测方程为 e(k) = 祝XR0 (k) (11) 其中,祝 = [C0 0]为( lN) 伊 [N( l + n + lMR )]的矩 阵. 则(10)和(11)即为所需要的增广系统. 根据系统(10) 中的相关变量, 性能指标函数 (7)可表示为 J = 移 肄 k = 1 X T R0 (k) ^QXR0 (k) + 驻u T (k)R寛驻u(k) (12) 其中, ^Q = éQ 0 ë ê ê ù û ú ú 0 0 , Q = éQe 0 ë ê ê ù û ú ú 0 0 ,分别为[N(l + n + lMR)] 伊 [N(l + n + lMR)]和[( l + n)N] 伊 [( l + n) N]的半正定矩阵. 另外, Qe = diag ( Qe1 ,Qe2 ,…, QeN), R寛 = diag(R寛1 ,R寛2 ,…,R寛N). 至此, 离散时间多智能体系统的协调预见跟踪 ·244·
卢延荣等:离散时间多智能体系统的协调最优预见跟踪 ·245· 问题就转化为系统(11)在性能指标函数(12)下的 左乘[zl-2⊙]得到 最优调节问题.实际上,根据线性二次型最优控制 「(z-l)lw H⑧C -G810 0 0 理论[],将所求得的△u(k)代入系统(10),其闭 0 dnv-(l⑧A) 0 0…0 I⑧B 环系统为渐近稳定的,于是由(11)知e(k)在k→o w -Iw 0 时渐近稳定到0,即系统(1)实现了对领导者的协 w 调预见跟踪.通过应用文献[34]的结果,立即得到 下面的定理 -Iw 定理1若(2,O)可镇定,(Q,2)可检测, 0 0 2Lv0 则系统(10)的使性能指标函数(12)极小的最优控 由于初等变换不改变矩阵的秩,因此上述矩阵与 制输入为: [l-2O]具有相同的秩.又由于1z≥1,所以上 △u(k)=-(R+OP⊙)-1⊙P2Xo(k)(13) 述矩阵中以z山八为对角元的上三角矩阵块可逆,根 其中,P.是一个[N(l+n+lM.)]×[N(l+n+ 据矩阵秩的性质知 M.)]的半正定矩阵,满足如下的离散代数Riccati rank[2I-INMg rank(V) 方程 其中: H⑧C 07 P,=Q+2P2-2P⊙(R+⊙P⊙)-1⊙P2 0 (14) -(1,8A)1,®BK16) 3.2控制器的存在性 于是,只需证明下述命题即可:在假设A4下, 为了保证定理1中控制器的存在性,需要验证 当z∈C且IzI≥1时,V行满秩的充要条件是 原系统在满足何条件时,(2,⊙)是可镇定的以及 「I-AB [2I-A 均行满秩 (Q2,2)是可检测的 B C 0 引理3在假设A4下,(2,⊙)可镇定的充要 必要性.即证明在假设A4下,当1z1≥1时, 条件是假设A2成立 若V行满秩,则[l-A B]与-AB购行 证明:由Popov-Belevitch-Hautus(PBH)秩判 据知[3],需要证明:在假设A4下,当z∈C且1z1≥ 满秩 1时,[-2⊙]行满秩的充要条件是 当z=1时,由(16)得到 [-AB]与 I-AB1 均行满秩 H⑧C c o rank(Vl:=1)=rank LIx-(I⑧A)I⑧B 根据2和⊙的具体结构,有 (17) [d-00= 在假设A4下,由引理2知,如果 (:-1)IIN H⑧CA :-G810 …0:-H8CB H⑧C 0 lnv-(l⑧A) … 01,⑧8 I.N-(I,⑧A)I,⑧B 行 满秩, 那么 0 1w -Iw 0 w 「I-AB行满秩同时, 「I-A B c o 行满秩蕴含 0 -I 着[-AB]-行满秩 0 lw 0 当1z≥1且z≠1时,(z-1)1w非奇异,由矩 注意到 H⑧CA-zH⑧C= 阵秩的性质知,若V行满秩,则 (H⑧C)(I⑧A)-z(H⑧C)(I⑧In)= [InN-(Iw⑧A)Iw⑧B]行满秩.由于 -(H⑧C)[zl.x-(Iw⑧A)] (15) rank[zl.v-(Iw⑧A)I⑧B]=N-ank[zl-AB], 于是,用可逆矩阵 因此进一步得到,在1z|≥1且z≠1时,若V行满 「IwH⑧C 0 07 秩,则[z-AB]行满秩. IN 0 0 联合两种分类情形下的结果便可证得必要性. 0 IwN 充分性即证明在假设A4下,当z∈C且Iz1≥1 0 I-AB1 0 0 …0 Ii] 时,若[l-AB]与 c o 均行满秩,则V行
卢延荣等: 离散时间多智能体系统的协调最优预见跟踪 问题就转化为系统(11)在性能指标函数(12)下的 最优调节问题. 实际上, 根据线性二次型最优控制 理论[33] , 将所求得的 驻u( k) 代入系统(10), 其闭 环系统为渐近稳定的, 于是由(11)知 e(k)在 k寅肄 时渐近稳定到 0, 即系统(1)实现了对领导者的协 调预见跟踪. 通过应用文献[34]的结果,立即得到 下面的定理. 定理 1 若(赘,专)可镇定, ( ^Q 1 / 2 ,赘)可检测, 则系统(10)的使性能指标函数(12)极小的最优控 制输入为: 驻u(k) = - (R寛 + 专 TPr专) - 1专 TPr赘XR0 (k) (13) 其中, Pr 是一个[N( l + n + lMR )] 伊 [ N( l + n + lMR)]的半正定矩阵, 满足如下的离散代数 Riccati 方程 Pr = ^Q + 赘 TPr赘 - 赘 TPr专 (R寛 + 专 TPr专) - 1专 TPr赘 (14) 3郾 2 控制器的存在性 为了保证定理 1 中控制器的存在性,需要验证 原系统在满足何条件时, (赘,专) 是可镇定的以及 ( ^Q 1 / 2 ,赘)是可检测的. 引理 3 在假设 A4 下, (赘,专)可镇定的充要 条件是假设 A2 成立. 证明: 由 Popov鄄鄄 Belevitch鄄鄄 Hautus ( PBH) 秩判 据知[33] ,需要证明:在假设 A4 下, 当 z沂迯 且| z | 逸 1 时, [ zI - 赘 专 ] 行 满 秩 的 充 要 条 件 是 [zI - A B]与 I - A B C é ë ê ê ù û ú ú 0 均行满秩. 根据 赘 和 专 的具体结构, 有 [zI -赘 专] = (z -1)IlN H茚CA - G茚Il 0 … 0 -H茚CB 0 zInN - (IN茚A) 0 0 … 0 IN茚B 0 0 zIlN - IlN 0 左 左 zIlN 埙 左 左 左 埙 - IlN 左 0 0 zIlN 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪 é ë ê ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ú 0 注意到 H茚CA - zH茚C = (H茚C)(IN茚A) - z(H茚C)(IN茚In ) = - (H茚C)[zInN - (IN茚A)] (15) 于是, 用可逆矩阵 IlN H茚C 0 … 0 0 IlN 0 … 0 0 0 IlN 埙 左 左 左 埙 埙 0 0 0 … 0 I é ë ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú lN 左乘[zI - 赘 专]得到 (z -1)IlN zH茚C - G茚Il 0 … 0 0 0 zInN - (IN茚A) 0 0 … 0 IN茚B 0 0 zIlN - IlN 0 左 左 zIlN 埙 左 左 左 埙 - IlN 左 0 0 zIlN 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪 é ë ê ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ú 0 由于初等变换不改变矩阵的秩, 因此上述矩阵与 [zI - 赘 专]具有相同的秩. 又由于|z|逸1, 所以上 述矩阵中以 zIlN为对角元的上三角矩阵块可逆, 根 据矩阵秩的性质知 rank[zI - 赘 专] = lNMR + rank(V) 其中: V = (z - 1)IlN zH茚C 0 0 zInN - (IN茚A) IN茚 é ë ê ê ù û ú ú B (16) 于是, 只需证明下述命题即可: 在假设 A4 下, 当 z沂 迯 且 | z | 逸1 时, V 行满秩的充要条件是 [zI - A B]与 I - A B C é ë ê ê ù û ú ú 0 均行满秩. 必要性. 即证明在假设 A4 下, 当 | z | 逸1 时, 若 V 行 满 秩, 则 [ zI - A B] 与 I - A B C é ë ê ê ù û ú ú 0 均 行 满秩. 当 z = 1 时, 由(16)得到 rank(V| z = 1 ) = rank H茚C 0 InN - (IN茚A) IN茚 é ë ê ê ù û ú Bú (17) 在 假 设 A4 下, 由 引 理 2 知, 如 果 H茚C 0 InN - (IN茚A) IN茚 é ë ê ê ù û ú Bú 行 满 秩, 那 么 I - A B C é ë ê ê ù û ú ú 0 行满秩. 同时, I - A B C é ë ê ê ù û ú ú 0 行满秩蕴含 着[zI - A B]z = 1行满秩. 当|z| 逸1 且 z屹1 时, ( z - 1) IlN非奇异, 由矩 阵 秩 的 性 质 知, 若 V 行 满 秩, 则 [zInN - (IN茚A) IN茚B]行满秩. 由于 rank[zInN - (IN茚A) IN茚B] =N·rank[zI -A B], 因此进一步得到, 在| z | 逸1 且 z屹1 时, 若 V 行满 秩, 则[zI - A B]行满秩. 联合两种分类情形下的结果便可证得必要性. 充分性. 即证明在假设 A4 下, 当 z沂迯 且|z |逸1 时, 若[zI - A B]与 I - A B C é ë ê ê ù û ú ú 0 均行满秩, 则 V 行 ·245·
·246· 工程科学学报,第40卷,第2期 满秩 引理4在假设A4下,(Q2,2)可检测的充 在假设A4下,由引理2知,如 「I-AB 要条件是(C,A)可检测. c0 证明:应用可检测的PBH秩判据知,(Q2, 满秩,则V八-1行满秩.另外,在1z≥1且z≠1时, 2)可检测的充要条件是对任意的z∈C且Iz1≥1, 由于[z-AB]是行满秩的,因此由(16)容易得 xl-2 矩阵 行满秩.由2和Q的结构可得 到V1≠,行满秩.这便证得了引理的充分性. 「(z-1)Iw H⑧CA -G⑧L, 0 0 0 zlN-(Iw☒A) 0 0 S 0 0 2Iw -Iw 0 0 0 -Iw 0 0 zl g 0 0 0 0 0 0 0 0 0 作为分块矩阵,由于w可逆且Q也可逆,所以 控制输人为: 「zl-2 H⑧CA rank =rank LlnN-(Ix⑧A) +IN INMR △u(k)=F。X。(k)+ ∑FG)△R(k+i)= j= (18) 注意在假设A4下H非奇异,所以 F.e()+F,△r()+F,G)△R(k+》 「z'(H-'②Ln)z1(1,⑧C)7f H⑧CA (20) 0 LzIV-(Iw⑧A) 式中,F。=[F。F]=-(R+GPG)GP Iw⑧C F.(G)=-(R+GPG.)-G()-1PGR, LlnN-(I⑧A)」 j=1,2,…,Mg 进而得到 其中,专=Φ+G.F。是一个[(l+n)N]×[(l+n) H⑧CA Iw⑧C N]的稳定矩阵.此外,矩阵P是一个[(l+n)N]× rank lnN-(I⑧A) rank L2IN-(I,⑧A)」 [(l+n)N]的半正定矩阵,满足如下的代数Riccati 方程 N.rank (19) P=Q+ΦPΦ-Φ'PG.(R+GPG.)-1GPΦ 从(18)和(19)得到:对任意的z∈C且Iz1≥1, (21) 「zl-2 C 将定理2中所得△u(k)代入系统(8)得到 例满秩的充要条件是 例满秩.这便 2I-A X。(k+1)=X(k)+w(k) (22) 证得了引理4. Mg 其中,w(k)=G△R(k+1)+∑G.FG)△R(k+. 3.3原系统的最优预见控制器 需要指出的是,由于所有的问题转换过程都使 由假设A1知,参考信号r(k)在k→∞时趋于 得系统的维数增加,因而从系统(10)和性能指标函 常值向量r,因此△R(k+j)在k→∞时趋于0(U=1, 数(12)下出发得到控制器(13),需要求解的代数 2,…,Ms).另外,由定理2知,专为稳定矩阵,故 Riceati方程(14)的维数较高,会带来计算上的困 X(k)在k→时渐近稳定到0.同样地,作为 难.利用系统矩阵和性能指标函数中权重矩阵的特 X。(k)的分量,e(k)在k→x时也渐近稳定到0.在 点,可以对Riccati方程进行降阶.具体的降阶过程 上述分析的基础上,立即可得如下结论 可参见文献[34].利用降阶的结果可以得到定理2. 定理3假设 定理2若(中,G)可镇定,(Q2,中)可检测, (a)A1~A4成立, 则在系统(8)下,使性能指标函数(7)极小的最优 (b)R与Q正定(i=1,2,…,N)
工程科学学报,第 40 卷,第 2 期 满秩. 在假设 A4 下, 由引理 2 知, 如果 I - A B C é ë ê ê ù û ú ú 0 行 满秩, 则 V| z = 1行满秩. 另外, 在|z|逸1 且 z屹1 时, 由于[zI - A B]是行满秩的, 因此由(16) 容易得 到 V| z屹1行满秩. 这便证得了引理的充分性. 引理 4 在假设 A4 下, ( ^Q 1 / 2 ,赘)可检测的充 要条件是(C,A)可检测. 证明: 应用可检测的 PBH 秩判据知, ( ^Q 1 / 2 , 赘)可检测的充要条件是对任意的 z沂迯 且 | z | 逸1, 矩阵 zI - 赘 ^Q 1 / é ë ê ê ù û ú 2 ú行满秩. 由 赘 和 ^Q 的结构可得 zI - 赘 ^Q 1 / é ë ê ê ù û ú 2 ú = (z - 1)IlN H茚CA - G茚Il 0 … … 0 0 zInN - (IN茚A) 0 0 … … 0 0 0 zIlN - IlN 0 … 0 左 左 埙 埙 埙 左 左 左 埙 埙 0 左 左 埙 - IlN 0 0 zIlN Q 1 / 2 e 0 0 0 … … 0 0 0 0 0 … … 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪 詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪 詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪 詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪 é ë ê ê ê ê ê ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ú ú ú ú ú 0 作为分块矩阵, 由于 zIlN可逆且 Q 1 / 2 e 也可逆, 所以 rank zI - 赘 ^Q 1 / é ë ê ê ù û ú 2 ú = rank H茚CA zInN - (IN茚A é ë ê ê ù û ú ú ) + lN + lNMR (18) 注意在假设 A4 下 H 非奇异, 所以 z - 1 (H - 1茚In ) z - 1 (IN茚C) 0 I é ë ê ê ù û ú ú nN H茚CA zInN - (IN茚A é ë ê ê ù û ú ú ) = IN茚C zInN - (IN茚A é ë ê ê ù û ú ú ) 进而得到 rank H茚CA zInN - (IN茚A é ë ê ê ù û ú ú ) = rank IN茚C zInN - (IN茚A é ë ê ê ù û ú ú ) = N·rank C zI - é ë ê ê ù û ú ú A (19) 从(18) 和(19) 得到:对任意的 z沂迯 且 | z | 逸1, zI - 赘 ^Q 1 / é ë ê ê ù û ú 2 ú列满秩的充要条件是 C zI - é ë ê ê ù û ú ú A 列满秩. 这便 证得了引理 4. 3郾 3 原系统的最优预见控制器 需要指出的是, 由于所有的问题转换过程都使 得系统的维数增加, 因而从系统(10)和性能指标函 数(12)下出发得到控制器(13), 需要求解的代数 Riccati 方程(14) 的维数较高, 会带来计算上的困 难. 利用系统矩阵和性能指标函数中权重矩阵的特 点, 可以对 Riccati 方程进行降阶. 具体的降阶过程 可参见文献[34]. 利用降阶的结果可以得到定理2. 定理 2 若(椎,Gu )可镇定, (Q 1 / 2 ,椎)可检测, 则在系统(8)下, 使性能指标函数(7)极小的最优 控制输入为: 驻u(k) = F0X0 (k) + 移 MR j = 1 FR(j)驻R(k + j) = Fe e(k) + Fx驻x(k) + 移 MR j = 1 FR(j)驻R(k + j) (20) 式中, F0 = [Fe Fx] = - (R寛 + G T uPGu ) - 1G T uP椎 FR(j) = - (R寛 + G T uPGu ) - 1G T u (孜 T ) j - 1PGR, j = 1,2,…,MR 其中, 孜 = 椎 + GuF0 是一个[( l + n) N] 伊 [( l + n) N]的稳定矩阵. 此外, 矩阵 P 是一个[(l + n)N] 伊 [(l + n)N]的半正定矩阵, 满足如下的代数 Riccati 方程 P = Q + 椎 TP椎 - 椎 TPGu (R寛 + G T uPGu ) - 1G T uP椎 (21) 将定理 2 中所得 驻u(k)代入系统(8)得到 X0 (k + 1) = 孜X0 (k) + 棕(k) (22) 其中, 棕(k) = GR驻R(k +1) + 移 MR j =1 GuFR(j)驻R(k + j). 由假设 A1 知, 参考信号 r( k)在 k寅肄 时趋于 常值向量 r, 因此 驻R(k + j)在 k寅肄 时趋于0(j = 1, 2,…,MR). 另外, 由定理 2 知, 孜 为稳定矩阵, 故 X0 ( k) 在 k 寅肄 时渐近稳定到 0. 同样地, 作为 X0 (k)的分量, e(k)在 k寅肄 时也渐近稳定到 0. 在 上述分析的基础上,立即可得如下结论. 定理 3 假设 (a) A1 ~ A4 成立, (b) R寛i 与 Qei正定(i = 1,2,…,N), ·246·
卢延荣等:离散时间多智能体系统的协调最优预见跟踪 ·247· 那么在任意的初始条件x(0)=x。下,使协调预见 0 0 0007 00007 跟踪问题可解的全局最优预见控制器为 0 0 00 0 01000 MR L= u(k)=F.∑e(i)+Fx(k)+ -1 0 100 M= 00000 Fg(j)R(k+j) :=0 =1 0 -101 0 00000 (23) 0 -100 1 L00000」 证明:由条件(a)和(b)可得定理2的结果,根 假设领导者的输出信号为 据对闭环系统(22)的分析知,在控制器(20)的作 0, k80 u(k)-u(k-1)= 跟随者的动力学方程(1)由如下的离散时间双积分 器系统描述 含Fa0 F.e()+F,[x)-rk-1)]+ (a(k+1)=x(k)+hx(k) GRk+)-三F.G)R(k MR x2(k+1)=xa(k)+hu:(k),i=1,2,…,5 y:(k)=x1(k) 并令u(0)=0,R(0)=0,比较等式两端可得(23) (24) 的结果. 其中,h为采样间隔,xa(k)∈R和x2(k)∈R分别 4数值仿真 表示第i个跟随者在4=h时刻的位置与速度,在 本例中取采样间隔为h=0.1s.另外,假设此处所 根据文献[35],移动车辆的位置状态和速度状 取的输出信号满足A1,即在当前时刻t4,领导者的 态可建模为一个离散时间双积分器系统.因此本文 输出信息r(k),r(k+1),r(k+2),…,r(k+Mg)是 提出的控制器设计方法可应用于多车辆系统中. 可被跟随者直接利用的. 例.设一个多智能体系统由6辆汽车组成,讨 相应于系统(1),矩阵A,B和C分别为 论5辆跟随者车辆跟踪领导者车辆目标轨迹的问 10.17m 题.其中智能体间的信息交换拓扑罗由图1表示, A= 0.1c=1o 该拓扑满足有向图包含一棵生成树的假设,即满足 利用PBH秩判据判断得,(A,B)是可镇定的, 假设A4. (C,A)是可检测的,此外容易验证矩阵 I-A B 行满秩.即定理2和定理3的条件均成 立,相应于系统(8)和性能指标函数(12),增益矩 阵Q和R取为 「Q。01 0= 00 Q。=diag(0.11,0.1,0.04,0.06,0.27),R=2-L 图1车辆间的有向通信拓扑 于是代数Riccati方程(14)存在对称半正定解阵. Fig.1 Directed communication topology among vehicles 从而根据定理2可得系统(8)的闭环系统渐近稳 从图1看出与有向图写相应的Laplacian矩阵 定,即lim[y:(k)-r(k)]=0,i=1,2,…,N.应用 L和牵引矩阵M分别为 MATLAB,计算得到最优预见控制器(23)中的增益 矩阵F.和F分别为 「0.191930.00000 -0.04209 0.00000 0.00000 0.000000.15567 0.00000 -0.04909 -0.15066 F.=0.076170.00000 0.11827 0.00000 0.00000 0.000000.07385 0.00000 0.14301 -0.02007 0.000000.09987 0.00000 -0.020070.27059
卢延荣等: 离散时间多智能体系统的协调最优预见跟踪 那么在任意的初始条件 x(0) = x0 下, 使协调预见 跟踪问题可解的全局最优预见控制器为 u(k) = Fe 移 k i = 0 e(i) + Fxx(k) + 移 MR j = 1 FR(j)R(k + j) (23) 证明: 由条件(a)和(b)可得定理 2 的结果, 根 据对闭环系统(22)的分析知, 在控制器(20) 的作 用下, 多智能体系统(1)可实现对参考信号 r(k)的 协调最优预见跟踪. 根据差分格式将控制器(20)表 述为如下形式: u(k) - u(k - 1) = 移 k i = 0 Fe e(i) - 移 k-1 i = 0 Fe e(i) + Fx[x(k) - x(k - 1)] + 移 MR j = 1 FR(j)R(k + j) - 移 MR j = 1 FR(j)R(k + j - 1) 并令 u(0) = 0, R(0) = 0, 比较等式两端可得(23) 的结果. 4 数值仿真 根据文献[35], 移动车辆的位置状态和速度状 态可建模为一个离散时间双积分器系统. 因此本文 提出的控制器设计方法可应用于多车辆系统中. 例. 设一个多智能体系统由 6 辆汽车组成,讨 论 5 辆跟随者车辆跟踪领导者车辆目标轨迹的问 题. 其中智能体间的信息交换拓扑 G 由图 1 表示, 该拓扑满足有向图包含一棵生成树的假设, 即满足 假设 A4. 图 1 车辆间的有向通信拓扑 Fig. 1 Directed communication topology among vehicles 从图 1 看出与有向图 G 相应的 Laplacian 矩阵 L 和牵引矩阵 M 分别为 L = 0 0 0 0 0 0 0 0 0 0 - 1 0 1 0 0 0 - 1 0 1 0 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 0 - 1 0 0 1 , M = 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 0 0 0 0 0 假设领导者的输出信号为 r(k) = 0, k 80 跟随者的动力学方程(1)由如下的离散时间双积分 器系统描述 xi1 (k + 1) = xi1 (k) + hxi2 (k) xi2 (k + 1) = xi2 (k) + hui(k) yi(k) = xi1 (k ì î í ïï ïï ) , i = 1,2,…,5 (24) 其中,h 为采样间隔, xi1 (k)沂迬 和 xi2 (k)沂迬 分别 表示第 i 个跟随者在 t k = kh 时刻的位置与速度, 在 本例中取采样间隔为 h = 0郾 1 s. 另外, 假设此处所 取的输出信号满足 A1, 即在当前时刻 t k, 领导者的 输出信息 r(k), r(k + 1), r(k + 2),…,r(k + MR)是 可被跟随者直接利用的. 相应于系统(1), 矩阵 A, B 和 C 分别为 A = é1 0郾 1 ë ê ê ù û ú ú 0 1 , B = é 0 ë ê ê ù û ú ú 0郾 1 , C = [1 0] 利用 PBH 秩判据判断得, (A,B)是可镇定的, (C, A ) 是 可 检 测 的, 此 外 容 易 验 证 矩 阵 I - A B C é ë ê ê ù û ú ú 0 行满秩. 即定理 2 和定理 3 的条件均成 立, 相应于系统(8)和性能指标函数(12), 增益矩 阵 Q 和 R寛 取为 Q = éQe 0 ë ê ê ù û ú ú 0 0 , Qe = diag(0郾 11,0郾 1,0郾 04,0郾 06,0郾 27), R寛 = 2·I5 于是代数 Riccati 方程(14) 存在对称半正定解阵. 从而根据定理 2 可得系统(8) 的闭环系统渐近稳 定, 即lim k寅肄 [yi(k) - r( k)] = 0, i = 1,2,…,N. 应用 MATLAB, 计算得到最优预见控制器(23)中的增益 矩阵 Fe 和 Fx 分别为 Fe = 0郾 19193 0郾 00000 - 0郾 04209 0郾 00000 0郾 00000 0郾 00000 0郾 15567 0郾 00000 - 0郾 04909 - 0郾 15066 0郾 07617 0郾 00000 0郾 11827 0郾 00000 0郾 00000 0郾 00000 0郾 07385 0郾 00000 0郾 14301 - 0郾 02007 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 0郾 00000 0郾 09987 0郾 00000 - 0郾 02007 0郾 27059 ·247·
·248· 工程科学学报,第40卷,第2期 -3.47389 -2.763580.00000 0.00000 0.46476 0.21545 0.00000 0.00000 0.00000 0.000007 0.00000 0.00000 -4.47448 -3.11641 0.00000 0.00000 0.52029 0.23529 1.39459 0.55728 F= 0.46476 0.21545 0.00000 0.00000 -2.19579 -2.17109 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.52029 0.23529 0.00000 0.00000 -2.48322 -2.310270.27049 0.14330 L0.00000 0.00000 1.39459 0.55728 0.00000 0.00000 0.27049 0.14330 -3.70817 -2.81801 选取如下的初始状态对本例进行仿真 2.0 x1(0)7 -0.111「x2(0)1「-0.05 (0)] 0.43Lx2(0)」L0.18 1.5 1(0)7 -0.217「x1(0)1 -0.13 L(0) 0.23」x2(0)」L0.11」 一领导者 x51(0)1「0.20 跟随者1 0.5 跟随者2 Lx2(0)」0.13」 跟随者3 限随者4 图2~图4表示在上述初始条件下,5个跟随 跟随者5 者在预见步长分别为Mg=0,Mg=10和Mg=30时 20406080100120140 闭环系统的输出响应.从图上看出,在控制器(23) 图3在MR=10时,多智能体系统(24)的位置轨迹 的作用下,跟随者(多智能体系统(24))实现了对 Fig.3 Position trajectories of multi-agent systems (24)for Mg =10 领导者(参考信号r(k))的协调预见跟踪,且跟踪 一致性效果随着预见步长的适度增加而得到了相应 的改善.特别地,随着预见步长的增加,跟随者的 2.0 输出会更快地同步于领导者位置发生变化时段 15 (40≤k≤80)的输出信号. 2.0 领导者 跟随者1 15 跟随者2 跟随者3 跟随者4 1.D 跟随者5 领导者 -跟随者1 20 4060 80100120140 跟随者2 跟随者3 图4在Mg=30时,多智能体系统(24)的位置轨迹 跟随者4 ·跟随者5 Fig.4 Position trajectories of multi-agent systems (24)for Mg=30 20406080100120140 图2在M:=0时,多智能体系统(24)的位置轨迹 1.4 跟随者1 Fig.2 Position trajectories of multi-agent systems (24)for Mg=0 12 跟随者2 1.0 跟随者3 跟随者4 图5~图7表示5个智能体在预见步长分别为 跟随者5 MR=0,MR=10和Mg=30时的局部邻居输出误 0.6 差.从图上可以看出随着时间k的增大,在三种情 0.4 形下的局部邻居误差都渐近地稳定到0.于是根据 对(6)式的分析可知,系统(24)的闭环系统的输出 0 y:(k)实现了对参考信号r(k)的渐近跟踪,这也间 0.2 接地反映了本文所设计控制器的有效性.此外, 20406080100120140 图5~图7也反映了多智能体系统在合作完成跟 图5在Mg=0时,多智能体系统(24)的局部邻居输出误差 踪任务时的协调性情况.相较于图6和图7,图5 Fig.5 Local neighborhood output errors of multi-agent systems 中的多智能体系统在领导者输出发生变化时段的 (24)for Mg =0
工程科学学报,第 40 卷,第 2 期 Fx = -3郾 47389 -2郾 76358 0郾 00000 0郾 00000 0郾 46476 0郾 21545 0郾 00000 0郾 00000 0郾 00000 0郾 00000 0郾 00000 0郾 00000 -4郾 47448 -3郾 11641 0郾 00000 0郾 00000 0郾 52029 0郾 23529 1郾 39459 0郾 55728 0郾 46476 0郾 21545 0郾 00000 0郾 00000 -2郾 19579 -2郾 17109 0郾 00000 0郾 00000 0郾 00000 0郾 00000 0郾 00000 0郾 00000 0郾 52029 0郾 23529 0郾 00000 0郾 00000 -2郾 48322 -2郾 31027 0郾 27049 0郾 14330 0郾 00000 0郾 00000 1郾 39459 0郾 55728 0郾 00000 0郾 00 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 000 0郾 27049 0郾 14330 -3郾 70817 -2郾 81801 选取如下的初始状态对本例进行仿真 x11 (0) x12 (0 é ë ê ê ù û ú ú ) = é - 0郾 11 ë ê ê ù û ú ú 0郾 43 , x21 (0) x22 (0 é ë ê ê ù û ú ú ) = é - 0郾 05 ë ê ê ù û ú ú 0郾 18 , x31 (0) x32 (0 é ë ê ê ù û ú ú ) = é - 0郾 21 ë ê ê ù û ú ú 0郾 23 , x41 (0) x42 (0 é ë ê ê ù û ú ú ) = é - 0郾 13 ë ê ê ù û ú ú 0郾 11 , x51 (0) x52 (0 é ë ê ê ù û ú ú ) = é0郾 20 ë ê ê ù û ú ú 0郾 13 图 2 ~ 图 4 表示在上述初始条件下, 5 个跟随 者在预见步长分别为 MR = 0, MR = 10 和 MR = 30 时 闭环系统的输出响应. 从图上看出, 在控制器(23) 的作用下, 跟随者(多智能体系统(24)) 实现了对 领导者(参考信号 r( k))的协调预见跟踪, 且跟踪 一致性效果随着预见步长的适度增加而得到了相应 的改善. 特别地, 随着预见步长的增加, 跟随者的 输出会更快地同步于领导者位置发生变化时段 (40臆k臆80)的输出信号. 图 2 在 MR = 0 时, 多智能体系统(24)的位置轨迹 Fig. 2 Position trajectories of multi鄄agent systems (24) for MR = 0 图 5 ~ 图 7 表示 5 个智能体在预见步长分别为 MR = 0, MR = 10 和 MR = 30 时的局部邻居输出误 差. 从图上可以看出随着时间 k 的增大, 在三种情 形下的局部邻居误差都渐近地稳定到 0. 于是根据 对(6)式的分析可知, 系统(24)的闭环系统的输出 yi(k)实现了对参考信号 r( k)的渐近跟踪, 这也间 接地反映了本文所设计控制器的有效性. 此外, 图 5 ~ 图 7 也反映了多智能体系统在合作完成跟 踪任务时的协调性情况. 相较于图 6 和图 7, 图 5 中的多智能体系统在领导者输出发生变化时段的 图 3 在 MR = 10 时, 多智能体系统(24)的位置轨迹 Fig. 3 Position trajectories of multi鄄agent systems (24) for MR = 10 图 4 在 MR = 30 时, 多智能体系统(24)的位置轨迹 Fig. 4 Position trajectories of multi鄄agent systems (24) for MR = 30 图 5 在 MR = 0 时, 多智能体系统(24)的局部邻居输出误差 Fig. 5 Local neighborhood output errors of multi鄄agent systems (24) for MR = 0 ·248·
卢延荣等:离散时间多智能体系统的协调最优预见跟踪 ·249· 协调性较差.随着预见步长的逐渐增加,这一状 况在图6和图7中得到了相应的改善.图5~图7 说明具有预见补偿作用的控制器可以在一定程度 1.5 上解决多智能体系统在合作完成任务时协调性较 差的问题. 1.0 14 跟随者1 12 跟随者2 一领导者 1.0 跟随者3 层 M.=0 跟随者4 M。=10 ……跟随者5 Mg=30 06 20 406080100120140 0.4 图8第1辆小车在不同预见长时的位置轨迹 Fig.8 Closed-loop outputs of first vehicle for different preview lengths 0.2 20406080100120140 随着预见步长的增加明显减少,结合图8容易得 图6在Mg=10时,多智能体系统(24)的局部邻居输出误差 到,具有预见补偿作用的控制器能够使闭环系统的 Fig.6 Local neighborhood output errors of multi-agent systems (24) 输出更快地趋于稳态值.表格的第4和5行数据表 for Mg =10 明最优预见控制器有利于减小系统输出响应的最大 超调量 14 表1第1辆小车在不同预见步长下的瞬态响应指标 跟随者1 1.2 眼随者2 Table 1 Transient response indices of first vehicle for different preview 跟随者3 1.0 lengths 跟随者4 0.8 -…跟随者5 预见步长 指标 MR =0 Mg=10 Mg=30 04 上升时间/s 10.2 9.3 8.7 0.2 峰值时间/s 11.1 10.2 9.6 峰值 2.0498 2.0501 2.0389 最大超调量 0.0249 0.0251 0.0195 20 406080100120140 调整时间/s 12.4 11.4 10.6 图7在M。=30时,多智能体系统(24)的局部邻居输出误差 附注2需要指出的是上升时间是指系统输出 Fig.7 Local neighborhood output errors of multi-agent systems (24) for Mg =30 响应曲线从零到第一次上升到稳态值所需的时间. 在表1中所得的上升时间值都是利用MATLAB进 图8表示在控制器(23)的作用下,第1辆小车 行仿真后根据四舍五入原则得到的近似值.实际 在不同预见步长下跟踪领导者输出信号的输出 上在MR=0时,y1(102)=1.9949;在Mg=10 响应 时,y1(93)=2.0019;在MR=30时,y1(87)= 为了进一步说明预见前馈补偿对多智能体系统 1.9946.调整时间定义为输出响应曲线衰减到与 实现协调跟踪的有效性.表1给出了图8中第一辆 稳态值之差不超过某一个特定百分数带所需要的 小车在不同预见步长下跟踪领导者输出的瞬态响应 时间,该百分数带一般取±0.02或±0.05,本例 指标. 中取0.02.其中在Mg=0时,y1(124)=2.0184: 从表1看出,随着预见步长的适度增加,第一 在Mg=10时,y1(114)=2.0197;在Ms=30时, 辆小车在跟踪领导者的输出时所需要的上升时间与 y1(106)=2.0195. 峰值时间都明显缩短,这说明利用预见信息设计的 附注3本文在固定信息交换拓扑下研究了离 最优控制器有加快系统响应速度的作用.表格最后 散时间多智能体系统的协调预见跟踪问题.值得一 项的数据显示,第一辆小车输出响应的调整时间 提的是离散时间多智能体系统在切换拓扑下的协调
卢延荣等: 离散时间多智能体系统的协调最优预见跟踪 协调性较差. 随着预见步长的逐渐增加, 这一状 况在图 6 和图 7 中得到了相应的改善. 图 5 ~ 图 7 说明具有预见补偿作用的控制器可以在一定程度 上解决多智能体系统在合作完成任务时协调性较 差的问题. 图 6 在 MR = 10 时, 多智能体系统(24)的局部邻居输出误差 Fig. 6 Local neighborhood output errors of multi鄄agent systems (24) for MR = 10 图 7 在 MR = 30 时, 多智能体系统(24)的局部邻居输出误差 Fig. 7 Local neighborhood output errors of multi鄄agent systems (24) for MR = 30 图 8 表示在控制器(23)的作用下, 第 1 辆小车 在不同预见步长下跟踪领导者输出信号的输出 响应. 为了进一步说明预见前馈补偿对多智能体系统 实现协调跟踪的有效性. 表 1 给出了图 8 中第一辆 小车在不同预见步长下跟踪领导者输出的瞬态响应 指标. 从表 1 看出, 随着预见步长的适度增加, 第一 辆小车在跟踪领导者的输出时所需要的上升时间与 峰值时间都明显缩短, 这说明利用预见信息设计的 最优控制器有加快系统响应速度的作用. 表格最后 一项的数据显示, 第一辆小车输出响应的调整时间 图 8 第 1 辆小车在不同预见长时的位置轨迹 Fig. 8 Closed鄄loop outputs of first vehicle for different preview lengths 随着预见步长的增加明显减少, 结合图 8 容易得 到, 具有预见补偿作用的控制器能够使闭环系统的 输出更快地趋于稳态值. 表格的第 4 和 5 行数据表 明最优预见控制器有利于减小系统输出响应的最大 超调量. 表 1 第 1 辆小车在不同预见步长下的瞬态响应指标 Table 1 Transient response indices of first vehicle for different preview lengths 指标 预见步长 MR = 0 MR = 10 MR = 30 上升时间/ s 10郾 2 9郾 3 8郾 7 峰值时间/ s 11郾 1 10郾 2 9郾 6 峰值 2郾 0498 2郾 0501 2郾 0389 最大超调量 0郾 0249 0郾 0251 0郾 0195 调整时间/ s 12郾 4 11郾 4 10郾 6 附注 2 需要指出的是上升时间是指系统输出 响应曲线从零到第一次上升到稳态值所需的时间. 在表 1 中所得的上升时间值都是利用 MATLAB 进 行仿真后根据四舍五入原则得到的近似值. 实际 上在 MR = 0 时, y1 ( 102 ) = 1郾 9949; 在 MR = 10 时, y1 (93) = 2郾 0019; 在 MR = 30 时, y1 (87 ) = 1郾 9946. 调整时间定义为输出响应曲线衰减到与 稳态值之差不超过某一个特定百分数带所需要的 时间, 该百分数带一般取 依 0郾 02 或 依 0郾 05, 本例 中取 0郾 02. 其中在 MR = 0 时, y1 (124) = 2郾 0184; 在 MR = 10 时, y1 (114) = 2郾 0197; 在 MR = 30 时, y1 (106) = 2郾 0195. 附注 3 本文在固定信息交换拓扑下研究了离 散时间多智能体系统的协调预见跟踪问题. 值得一 提的是离散时间多智能体系统在切换拓扑下的协调 ·249·
·250· 工程科学学报,第40卷,第2期 预见跟踪问题也是一个有趣且富有挑战性的研究 [11]Yang T,Meng Z,Dimarogonas D V,et al.Global consensus for 课题,尤其是智能体间的信息交换拓扑是随机切 discrete-time multi-agent systems with input saturation con- 换的情形.然而,本文提出的控制器设计方法并 straints.Automatica,2014,50(2):499 [12]Qin J,Gao H,Yu C.On discrete-time convergence for general 不能够直接应用于处理该类问题.未来将对本问 linear multi-agent systems under dynamic topology.IEEE Trans 题进行深入研究.文献[36]在随机切换拓扑下解 Autom Control,2014,59(4):1054 决了线性多智能体系统的一致性问题,其处理离 [13]Xiao F,Wang L.Consensus protocols for discrete-time multi-agent 散时间一致性问题的方法对解决该问题具有一定 systems with time-varying delays.Automatica,2008,44(10): 的参考意义. 2577 [14]Cortes J.Distributed algorithms for reaching consensus on general 5总结 functions.Automatica,2008,44(3):726 [15]Hong Y,Chen G.Bushnell L Distributed observers design for 本文研究了离散时间多智能体系统的协调预 leader-following control of multi-agent networks.Automatica, 见跟踪问题,所考虑的信息交换拓扑为固定有向 2008,44(3):846 图,智能体的动力学方程为具有任意维数的一般 [16]Hu J,Feng G.Distributed tracking control of leader-follower 线性系统.应用最优预见控制理论的相关结果, multi-agent systems under noisy measurement.Automatica, 2011,46(8):1382 得到了包含误差积分和预见前馈补偿的最优控制 [17]Zhu W,Cheng D.Leader-following consensus of second-order a- 器,给出了保证控制器存在的充分条件.不同于 gents with multiple time-varying delays.Automatica,2010,46 单个智能体的的情形,多智能体系统的全局最优 (12):1994 预见控制器受互联拓扑和系统动力学行为的共同 [18]Ni W,Cheng D.Leader-following consensus of multi-agent sys- 影响.最后,理论和仿真结果均证明在所提出的 tems under fixed and switching topologies.Syst Control Lett, 控制器下,所有的智能体可实现跟踪一致性,且 2010.59(34):209 [19]Wang X H.Xu D B,Hong Y G.Consensus control of nonlinear 一致性效果会随着预见步长的适度增加而得到明 leader-follower multi-agent systems with actuating disturbances. 显改善 Syst Control Lett,2014,73:58 [20]Cao YC.Ren W.Distributed coordinated tracking with reduced 参考文献 interaction via a variable structure approach.IEEE Trans Autom [1]Lynch N A.Distributed Algorithms.San Francisco:Morgan Kauf- Control,2012,57(1):33 mann,1996 [21]Hac A.Optimal linear preview control of active vehicle suspen- [2]Olfati-Saber R.Murray R M.Consensus problems in networks of sion.Vehicle Syst Dyn,1992,21(1):167 agents with switching topology and time-delays.IEEE Trans Autom [22]Shimmyo S,Sato T,Ohnishi K.Biped walking pattern genera- Control,.2004.49(9):1520 tion by using preview control based on three-mass model./EEE [3]Ren W,Atkins E.Distributed multi-vehicle coordinated control Trans Ind Electron,2013,60(11):5137 via local information exchange.Int J Robust Nonlinear Control, [23]Katayama T,Ohki T,Inoue T,et al.Design of an optimal con- 2007,17(10-11):1002 troller for a discrete-time system subject to previewable demand. [4]Ren W.On consensus algorithms for double-integrator dynamics. 1 nt J Control.1985,41(3):677 IEEE Trans Autom Control,2008,53(6):1503 [24]Kojima A,Ishijima S.LQ preview synthesis optimal control and [5]Wang J H,Cheng D Z,Hu X M.Consensus of multi-agent linear worst case analysis.IEEE Trans Autom Control,1999,44(2): dynamic systems.Asian Control,2008,10(2):144 352 [6]Seo J H,Shim H,Back J.Consensus of high-order linear systems [25]Liao F C,Takaba K.Katayama T,et al.Design of an optimal using dynamic output feedback compensator:low gain approach. preview servomechanism for discrete-time systems in a multirate Automatica,2009,45(11):2659 setting.Dyn Contin Discrete Impuls Syst Ser B,2003,10(5): [7]Yang X R,Liu G P.Consensus of descriptor multi-agent systems 727 via dynamic compensators.IET Control Theory Appl,2014,8 [26] Moelja AA,Meinsma G.H2-optimal control of systems with (6):389 multiple i/o delays:time domain approach.Automatica,2005, [8]Li Z K,Duan Z S,Chen G R.Dynamic consensus of linear multi- 41(7):1229 agent systems.IET Control Theory Appl,2011,5(1):19 [27]Moelja AA,Meinsma G.H2 control of preview systems.Auto- [9]Li Z K,Duan Z S,Chen G R.On H=and H2 performance re- matica,2006,42(6):945 gions of multi-agent systems.Automatica,2011,47(4):797 [28]Takaba K.Robust servomechanism with preview action for polyto- [10]Chen Y,Lii J H,Lin Z.Consensus of discrete-time multi-agent pic uncertain systems.Int J Robust Nonlinear Control,2000,10 systems with transmission nonlinearity.Automatica,2013,49 (2):101 (6):1768 [29]Li L,Liao F.C Parameter-dependent preview control with robust
工程科学学报,第 40 卷,第 2 期 预见跟踪问题也是一个有趣且富有挑战性的研究 课题, 尤其是智能体间的信息交换拓扑是随机切 换的情形. 然而, 本文提出的控制器设计方法并 不能够直接应用于处理该类问题. 未来将对本问 题进行深入研究. 文献[36] 在随机切换拓扑下解 决了线性多智能体系统的一致性问题, 其处理离 散时间一致性问题的方法对解决该问题具有一定 的参考意义. 5 总结 本文研究了离散时间多智能体系统的协调预 见跟踪问题, 所考虑的信息交换拓扑为固定有向 图, 智能体的动力学方程为具有任意维数的一般 线性系统. 应用最优预见控制理论的相关结果, 得到了包含误差积分和预见前馈补偿的最优控制 器, 给出了保证控制器存在的充分条件. 不同于 单个智能体的的情形, 多智能体系统的全局最优 预见控制器受互联拓扑和系统动力学行为的共同 影响. 最后, 理论和仿真结果均证明在所提出的 控制器下, 所有的智能体可实现跟踪一致性, 且 一致性效果会随着预见步长的适度增加而得到明 显改善. 参 考 文 献 [1] Lynch N A. Distributed Algorithms. San Francisco: Morgan Kauf鄄 mann, 1996 [2] Olfati鄄Saber R, Murray R M. Consensus problems in networks of agents with switching topology and time鄄delays. IEEE Trans Autom Control, 2004, 49(9): 1520 [3] Ren W, Atkins E. Distributed multi鄄vehicle coordinated control via local information exchange. Int J Robust Nonlinear Control, 2007, 17(10鄄11): 1002 [4] Ren W. On consensus algorithms for double鄄integrator dynamics. IEEE Trans Autom Control, 2008, 53(6): 1503 [5] Wang J H, Cheng D Z, Hu X M. Consensus of multi鄄agent linear dynamic systems. Asian J Control, 2008, 10(2): 144 [6] Seo J H, Shim H, Back J. Consensus of high鄄order linear systems using dynamic output feedback compensator: low gain approach. Automatica, 2009, 45(11): 2659 [7] Yang X R, Liu G P. Consensus of descriptor multi鄄agent systems via dynamic compensators. IET Control Theory Appl, 2014, 8 (6): 389 [8] Li Z K, Duan Z S, Chen G R. Dynamic consensus of linear multi鄄 agent systems. IET Control Theory Appl, 2011, 5(1): 19 [9] Li Z K, Duan Z S, Chen G R. On H肄 and H2 performance re鄄 gions of multi鄄agent systems. Automatica, 2011, 47(4): 797 [10] Chen Y, L俟 J H, Lin Z. Consensus of discrete鄄time multi鄄agent systems with transmission nonlinearity. Automatica, 2013, 49 (6): 1768 [11] Yang T, Meng Z, Dimarogonas D V, et al. Global consensus for discrete鄄time multi鄄agent systems with input saturation con鄄 straints. Automatica, 2014, 50(2): 499 [12] Qin J, Gao H, Yu C. On discrete鄄time convergence for general linear multi鄄agent systems under dynamic topology. IEEE Trans Autom Control, 2014, 59(4): 1054 [13] Xiao F, Wang L. Consensus protocols for discrete鄄time multi鄄agent systems with time鄄varying delays. Automatica, 2008, 44 (10): 2577 [14] Cort佴s J. Distributed algorithms for reaching consensus on general functions. Automatica, 2008, 44(3): 726 [15] Hong Y, Chen G, Bushnell L. Distributed observers design for leader鄄following control of multi鄄agent networks. Automatica, 2008, 44(3): 846 [16] Hu J, Feng G. Distributed tracking control of leader鄄follower multi鄄agent systems under noisy measurement. Automatica, 2011, 46(8): 1382 [17] Zhu W, Cheng D. Leader鄄following consensus of second鄄order a鄄 gents with multiple time鄄varying delays. Automatica, 2010, 46 (12): 1994 [18] Ni W, Cheng D. Leader鄄following consensus of multi鄄agent sys鄄 tems under fixed and switching topologies. Syst Control Lett, 2010, 59(3鄄4): 209 [19] Wang X H, Xu D B, Hong Y G. Consensus control of nonlinear leader鄄follower multi鄄agent systems with actuating disturbances. Syst Control Lett, 2014, 73: 58 [20] Cao Y C, Ren W. Distributed coordinated tracking with reduced interaction via a variable structure approach. IEEE Trans Autom Control, 2012, 57(1): 33 [21] Hac' A. Optimal linear preview control of active vehicle suspen鄄 sion. Vehicle Syst Dyn, 1992, 21(1): 167 [22] Shimmyo S, Sato T, Ohnishi K. Biped walking pattern genera鄄 tion by using preview control based on three鄄mass model. IEEE Trans Ind Electron, 2013, 60(11): 5137 [23] Katayama T, Ohki T, Inoue T, et al. Design of an optimal con鄄 troller for a discrete鄄time system subject to previewable demand. Int J Control, 1985, 41(3): 677 [24] Kojima A, Ishijima S. LQ preview synthesis optimal control and worst case analysis. IEEE Trans Autom Control, 1999, 44(2): 352 [25] Liao F C, Takaba K, Katayama T, et al. Design of an optimal preview servomechanism for discrete鄄time systems in a multirate setting. Dyn Contin Discrete Impuls Syst Ser B, 2003, 10 (5): 727 [26] Moelja A A, Meinsma G. H2 鄄optimal control of systems with multiple i / o delays: time domain approach. Automatica, 2005, 41(7): 1229 [27] Moelja A A, Meinsma G. H2 control of preview systems. Auto鄄 matica, 2006, 42(6): 945 [28] Takaba K. Robust servomechanism with preview action for polyto鄄 pic uncertain systems. Int J Robust Nonlinear Control, 2000, 10 (2): 101 [29] Li L, Liao F. C Parameter鄄dependent preview control with robust ·250·