离散时间多智能体系统的协调最优预见跟踪

在互联拓扑包含一棵有向生成树的条件下，研究了离散时间多智能体系统的协调最优预见跟踪问题.首先利用状态增广技术把协调跟踪问题转化为一个增广系统的全局最优调节问题.然后应用离散时间线性二次型调节理论的相关结果给出了使增广系统的闭环系统渐近稳定的控制器，并由此得到原系统实现跟踪一致性的全局最优预见控制器.仿真结果不仅验证了所设计控制器的有效性，并且表明适当增加预见步长对保证准确跟踪领导者的输出是至关重要的.

团购合买资源类别：文库，文档格式：PDF，文档页数：11，文件大小：2.92MB

工程科学学报，第40卷，第2期：241-251,2018年2月 Chinese Joural of Engineering,Vol.40,No.2:241-251,February 2018 DOI:10.13374/j.issn2095-9389.2018.02.015;http://journals.ustb.edu.cn 离散时间多智能体系统的协调最优预见跟踪卢延荣，廖福成四，任金鸣，付海龙，盛超逸北京科技大学数理学院，北京100083 ☒通信作者，E-mail:fcliao@usth.edu.cn 摘要在互联拓扑包含一棵有向生成树的条件下，研究了离散时间多智能体系统的协调最优预见跟踪问题.首先利用状态增广技术把协调跟踪问题转化为一个增广系统的全局最优调节问题.然后应用离散时间线性二次型调节理论的相关结果给出了使增广系统的闭环系统渐近稳定的控制器，并由此得到原系统实现跟踪一致性的全局最优预见控制器.仿真结果不仅验证了所设计控制器的有效性，并且表明适当增加预见步长对保证准确跟踪领导者的输出是至关重要的. 关键词多智能体系统：协调跟踪：预见控制：代数Riccati方程分类号TG142.71 Cooperative optimal preview tracking control of discrete-time multi-agent systems LU Yan-rong,LIAO Fu-cheng,REN Jin-ming,FU Hai-long,SHENG Chao-yi School of Mathematics and Physics,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:fcliao@ustb.edu.cn ABSTRACT This study investigated the cooperative optimal preview tracking problem of discrete-time multi-agent systems under the assumption of the communication topology containing a directed spanning tree.First,a state augmentation technique was used to con- vert the cooperative preview tracking problem into a global optimal regulation problem of an augmented system.Second,by resorting to relative conclusions about the discrete-time linear quadratic regulation theory,an optimal controller was obtained,which can guarantee the asymptotic stability of the closed-loop augmented system.Moreover,a global optimal preview controller was provided in order for the original system to achieve the tracking consensus.Finally,the simulation results not only verified the effectiveness of the designed controller,but also indicated that it is critical for accurately tracking the reference signal to moderately increase the preview length. KEY WORDS multi-agent systems;cooperative tracking;preview control;algebraic Riccati equation 近年来，受复杂系统理论、传感、计算机以及通言，一致性问题可分为两类，即无领导者的一致性信技术等快速发展的影响，多智能体系统的协调控问题和有领导者的同步问题，后者也称为分布式跟制受到了研究者的广泛关注.协调控制研究的主要踪问题、领导者跟随者一致性问题或牵引控制问问题是根据所设计的分布式控制策略来分析智能体题等. 的动态特性与智能体间的信息交换拓扑对系统整体在无领导者一致性问题研究方面，文献[2]分行为的影响. 别在拓扑为固定或切换、通信存在或缺少时滞、以及一致性问题在计算机科学中有着很长的历信息流为有向或无向的假设下，较全面地研究了具史)，近期在多智能体系统的背景下已逐渐成为协有一阶积分器系统的一致性问题，并为每一种情形调控制研究中的一个重要而基本的问题.一般而提供了收敛性分析.文献[3]考虑了二阶积分器系收稿日期：2017-06-01 基金项目：国家自然科学基金资助项目(61174209)

工程科学学报,第 40 卷,第 2 期:241鄄鄄251,2018 年 2 月 Chinese Journal of Engineering, Vol. 40, No. 2: 241鄄鄄251, February 2018 DOI: 10. 13374 / j. issn2095鄄鄄9389. 2018. 02. 015; http: / / journals. ustb. edu. cn 离散时间多智能体系统的协调最优预见跟踪卢延荣, 廖福成苣 , 任金鸣, 付海龙, 盛超逸北京科技大学数理学院, 北京 100083 苣通信作者, E鄄mail: fcliao@ ustb. edu. cn 摘要在互联拓扑包含一棵有向生成树的条件下,研究了离散时间多智能体系统的协调最优预见跟踪问题. 首先利用状态增广技术把协调跟踪问题转化为一个增广系统的全局最优调节问题. 然后应用离散时间线性二次型调节理论的相关结果给出了使增广系统的闭环系统渐近稳定的控制器, 并由此得到原系统实现跟踪一致性的全局最优预见控制器. 仿真结果不仅验证了所设计控制器的有效性, 并且表明适当增加预见步长对保证准确跟踪领导者的输出是至关重要的. 关键词多智能体系统; 协调跟踪; 预见控制; 代数 Riccati 方程分类号 TG142郾 71 收稿日期: 2017鄄鄄06鄄鄄01 基金项目: 国家自然科学基金资助项目(61174209) Cooperative optimal preview tracking control of discrete鄄time multi鄄agent systems LU Yan鄄rong, LIAO Fu鄄cheng 苣 , REN Jin鄄ming, FU Hai鄄long, SHENG Chao鄄yi School of Mathematics and Physics, University of Science and Technology Beijing, Beijing 100083, China 苣 Corresponding author, E鄄mail: fcliao@ ustb. edu. cn ABSTRACT This study investigated the cooperative optimal preview tracking problem of discrete鄄time multi鄄agent systems under the assumption of the communication topology containing a directed spanning tree. First, a state augmentation technique was used to con鄄 vert the cooperative preview tracking problem into a global optimal regulation problem of an augmented system. Second, by resorting to relative conclusions about the discrete鄄time linear quadratic regulation theory, an optimal controller was obtained, which can guarantee the asymptotic stability of the closed鄄loop augmented system. Moreover, a global optimal preview controller was provided in order for the original system to achieve the tracking consensus. Finally, the simulation results not only verified the effectiveness of the designed controller, but also indicated that it is critical for accurately tracking the reference signal to moderately increase the preview length. KEY WORDS multi鄄agent systems; cooperative tracking; preview control; algebraic Riccati equation 近年来, 受复杂系统理论、传感、计算机以及通信技术等快速发展的影响, 多智能体系统的协调控制受到了研究者的广泛关注. 协调控制研究的主要问题是根据所设计的分布式控制策略来分析智能体的动态特性与智能体间的信息交换拓扑对系统整体行为的影响. 一致性问题在计算机科学中有着很长的历史[1] , 近期在多智能体系统的背景下已逐渐成为协调控制研究中的一个重要而基本的问题. 一般而言, 一致性问题可分为两类, 即无领导者的一致性问题和有领导者的同步问题, 后者也称为分布式跟踪问题、领导者跟随者一致性问题或牵引控制问题等. 在无领导者一致性问题研究方面, 文献[2]分别在拓扑为固定或切换、通信存在或缺少时滞、以及信息流为有向或无向的假设下, 较全面地研究了具有一阶积分器系统的一致性问题, 并为每一种情形提供了收敛性分析. 文献[3]考虑了二阶积分器系

·242· 工程科学学报，第40卷，第2期统的分布式协议设计问题，并在无向信息交换拓扑 H2最优预见控制问题，其处理问题的核心思想是的假设下推出了系统实现一致性所需的充要条件. 将H,调节问题看做具有多输入时滞的线性二次型随后，该问题在文献[4]中得到了进一步深入的研最优调节问题.文献[27]与文献[26]在处理问题究.当切换互联拓扑满足频繁连通的假设时，文献的主要思想上是一致的，不同的是，文献[27]中的 [5]为多智能体系统设计了基于局部信息的分散式方法不仅给出了预见时间与H,性能之间的解析表控制器，并证明实现一致性的充分条件为线性系统达式，而且可以处理参考信号分量的预见步长为相完全能控.针对互联拓扑中每个智能体的输出信息异的情形.文献[28]研究了凸多面体不确定离散时可测的情形，文献[6]采用低增益方法设计了实现间系统的鲁棒预见控制问题，作者基于混合LQ/ 一致性所需的分布式动态补偿器.近来，该方法得 H判据设计了能抑制外部干扰的鲁棒伺服控制器到了进一步推广，解决了广义多智能体系统的一致文献[29]采用上述方法设计了参数相关的静态输性问题].文献[8]根据每个智能体邻居的输出信出反馈预见控制器.当模型中存在大的参数不确定息设计了观测器型一致性协议，使得多智能体系统性时，文献[30]中的作者基于多模型自适应控制给能按给定的收敛速度实现一致性.文献[9]考虑了出了一种新的预见控制器设计方法. 多智能体系统的H,和H,控制器设计问题(H,和文献[31]中首次研究了连续时间多智能体系 H均为范数)，作者引入了H2和H性能区域的概统的协调预见跟踪问题，在所给的信息交换拓扑念用以度量协议的鲁棒性.文献[10]研究了离散时下，全局虚拟调节误差渐近地趋于零蕴含着系统可间多智能体系统的一致性问题，其中的模型具有传实现协调预见跟踪.于是建立基于全局虚拟调节误递非线性和时变时滞.当模型中具有输入饱和限制差和全局状态向量导数的增广系统，从而将协调跟时，文献[11]在固定无向拓扑的情形下给出了系统踪问题转化为最优调节问题，这是文献[31]处理协实现全局一致性的必要条件.文献[12]运用行随机调预见跟踪问题的主要思想.本文将文献[31]中的矩阵的乘积性质解决了一类离散时间线性多智能体方法扩展至离散时间系统的情形，与文献[31]不同系统的收敛性分析问题.更多关于一致性问题的研的是，通过构建关于预见信息差分的恒等式，增广后的系统可进一步转化为标准的离散时间线性系究成果可参见文献[13-14]. 统.在用线性二次型最优控制理论获得全局最优预对于有领导者的同步问题，文献[15]在切换互见控制器后，可根据系统矩阵的特点对控制器和代联拓扑的情形下考虑了多智能体系统的领导者-跟数Riccati方程进行降阶处理，使所得的结果可用随者一致性问题，通过构建公共Lyapunov函数，作初次进行系统增广后的相应矩阵表示.这将在一定者证明所设计的分布式控制策略可实现对动态领导程度上降低仿真时的计算复杂度者的跟踪.在模型中存在可测噪声以及互联拓扑为有向的情形下，文献[16]设计了带有分布式估计器 1记号与有关基础知识的控制策略，并分析了跟踪误差的均方收敛情况. 本节给出文中用到的一些主要记号和概念. 文献[17]考虑的模型为具有多时变时滞的二阶积 R(C)为实数（复数）集.Rx(C)为n×l 分器系统，并在拓扑为固定和切换的情形下分别给的实数矩阵（复数矩阵）集合.I,表示n×n的单位出了实现跟踪一致性的充要条件和充分条件.随矩阵，后文此形式均表示相应的单位矩阵.1∈R" 后，文献[18]将上述问题推广到了一般线性系统的表示元素都为1的列向量.0∈Rx表示n×l的零情形.关于跟踪一致问题的其他重要结果还可参见矩阵.diag(a1,a2,…,an)表示对角矩阵，其中a 文献[19-20]. (i=1,2,…,n)为主对角元素，其余元素为0.对于预见控制自提出以来便在实践中得到了成功的矩阵A∈RaxL,B∈RPx9,A⑧B表示Kronecker 应用[21-2]，其主要思想是利用已知的未来信息设积，其定义为计带有预见补偿作用的控制器，以提高闭环系统的「aB …aB 跟踪和（或）抗干扰品性.预见控制的理论研究已经 A⑧B= 取得了长足的进步，尤其是线性二次型最优预见控 LanB…anB」制，有关结果可参见文献[23-25].近年来，基于容易验证，Kronecker积满足如下性质：(A⑧B)(C☒ H2和H。的最优预见控制问题也得到了深入的研 D)=(AC)☒(BD),(A⑧B)T=A'⑧B,A☒B+ 究.文献[26]中处理了具有多输入多输出时滞的 A⑧C=A⑧(B+C),其中C和D为具有适当维数

工程科学学报,第 40 卷,第 2 期统的分布式协议设计问题, 并在无向信息交换拓扑的假设下推出了系统实现一致性所需的充要条件. 随后, 该问题在文献[4]中得到了进一步深入的研究. 当切换互联拓扑满足频繁连通的假设时, 文献 [5]为多智能体系统设计了基于局部信息的分散式控制器, 并证明实现一致性的充分条件为线性系统完全能控. 针对互联拓扑中每个智能体的输出信息可测的情形, 文献[6]采用低增益方法设计了实现一致性所需的分布式动态补偿器. 近来, 该方法得到了进一步推广, 解决了广义多智能体系统的一致性问题[7] . 文献[8]根据每个智能体邻居的输出信息设计了观测器型一致性协议, 使得多智能体系统能按给定的收敛速度实现一致性. 文献[9]考虑了多智能体系统的 H2 和 H肄控制器设计问题(H2 和 H肄均为范数), 作者引入了 H2 和 H肄性能区域的概念用以度量协议的鲁棒性. 文献[10]研究了离散时间多智能体系统的一致性问题, 其中的模型具有传递非线性和时变时滞. 当模型中具有输入饱和限制时, 文献[11]在固定无向拓扑的情形下给出了系统实现全局一致性的必要条件. 文献[12]运用行随机矩阵的乘积性质解决了一类离散时间线性多智能体系统的收敛性分析问题. 更多关于一致性问题的研究成果可参见文献[13鄄鄄14]. 对于有领导者的同步问题, 文献[15]在切换互联拓扑的情形下考虑了多智能体系统的领导者鄄鄄跟随者一致性问题, 通过构建公共 Lyapunov 函数, 作者证明所设计的分布式控制策略可实现对动态领导者的跟踪. 在模型中存在可测噪声以及互联拓扑为有向的情形下, 文献[16]设计了带有分布式估计器的控制策略, 并分析了跟踪误差的均方收敛情况. 文献[17]考虑的模型为具有多时变时滞的二阶积分器系统, 并在拓扑为固定和切换的情形下分别给出了实现跟踪一致性的充要条件和充分条件. 随后, 文献[18]将上述问题推广到了一般线性系统的情形. 关于跟踪一致问题的其他重要结果还可参见文献[19鄄鄄20]. 预见控制自提出以来便在实践中得到了成功的应用[21鄄鄄22] , 其主要思想是利用已知的未来信息设计带有预见补偿作用的控制器, 以提高闭环系统的跟踪和(或)抗干扰品性. 预见控制的理论研究已经取得了长足的进步, 尤其是线性二次型最优预见控制, 有关结果可参见文献[23鄄鄄 25]. 近年来, 基于 H2 和 H肄的最优预见控制问题也得到了深入的研究. 文献[26]中处理了具有多输入多输出时滞的 H2 最优预见控制问题, 其处理问题的核心思想是将 H2 调节问题看做具有多输入时滞的线性二次型最优调节问题. 文献[27]与文献[26]在处理问题的主要思想上是一致的, 不同的是, 文献[27]中的方法不仅给出了预见时间与 H2 性能之间的解析表达式, 而且可以处理参考信号分量的预见步长为相异的情形. 文献[28]研究了凸多面体不确定离散时间系统的鲁棒预见控制问题, 作者基于混合 LQ/ H肄判据设计了能抑制外部干扰的鲁棒伺服控制器. 文献[29]采用上述方法设计了参数相关的静态输出反馈预见控制器. 当模型中存在大的参数不确定性时, 文献[30]中的作者基于多模型自适应控制给出了一种新的预见控制器设计方法. 文献[31]中首次研究了连续时间多智能体系统的协调预见跟踪问题, 在所给的信息交换拓扑下, 全局虚拟调节误差渐近地趋于零蕴含着系统可实现协调预见跟踪. 于是建立基于全局虚拟调节误差和全局状态向量导数的增广系统, 从而将协调跟踪问题转化为最优调节问题, 这是文献[31]处理协调预见跟踪问题的主要思想. 本文将文献[31]中的方法扩展至离散时间系统的情形, 与文献[31]不同的是, 通过构建关于预见信息差分的恒等式, 增广后的系统可进一步转化为标准的离散时间线性系统. 在用线性二次型最优控制理论获得全局最优预见控制器后, 可根据系统矩阵的特点对控制器和代数 Riccati 方程进行降阶处理, 使所得的结果可用初次进行系统增广后的相应矩阵表示. 这将在一定程度上降低仿真时的计算复杂度. 1 记号与有关基础知识本节给出文中用到的一些主要记号和概念. 迬 (迯 )为实数(复数)集. 迬 n 伊 l (迯 n 伊 l )为 n 伊 l 的实数矩阵(复数矩阵)集合. In 表示 n 伊 n 的单位矩阵,后文此形式均表示相应的单位矩阵. 1沂迬 n 表示元素都为 1 的列向量. 0沂迬 n 伊 l表示 n 伊 l 的零矩阵. diag( a1 ,a2 ,…,an ) 表示对角矩阵, 其中 ai (i = 1,2,…,n)为主对角元素, 其余元素为 0. 对于矩阵 A沂迬 n 伊 l , B沂迬 p 伊 q , A茚B 表示 Kronecker 积, 其定义为 A茚B = a11B … a1lB 左埙左 an1B … anl é ë ê ê ê ù û ú ú ú B 容易验证, Kronecker 积满足如下性质:(A茚B)(C茚 D) = (AC)茚(BD), (A茚B) T = A T茚B T , A茚B + A茚C = A茚(B + C), 其中 C 和 D 为具有适当维数 ·242·

卢延荣等：离散时间多智能体系统的协调最优预见跟踪 ·243· 的矩阵.有关Kronecker积的其他性质，可参考文另外，设r(k)的预见步数为M,即对于当前时标献[32]. k,参考信号r(k),r(k+1),r(k+2),…,r(k+ 对于多智能体系统，智能体间的信息交换拓扑 M.)的值为已知，M。步以后的值为常值，即通常用有向图罗=(()，))表示，其中（分= r(k+j)=r(k),j=Mg+1,Mg+2,Mg+3,… {,2,…,w}是顶点集，（分二孔分×（分代用预见控制的相关理论来设计控制器.首先把表弧集.顶点，∈（分表示第i个智能体，弧(：， (1)写成紧凑形式，为此引入向量秒)∈队表示第j个智能体可以接受来自第i个「x,(k)7 u(k) 智能体的信息，其中顶点：称为父顶点，)称为子 x2(k) 42(k) 顶点，并称：为心的邻居.基于此，定义第i个智 x(k)= ∈RN,u(k)= ∈Rw 能体的邻居集为={1（巴，：）∈(}.在有向图罗中，如果除根顶点外，其他顶点有且只有一个 xx() LuN() 父顶点，则称有向图罗为一棵有向树.另外，在有 (k)1 向图罗中，若其全部顶点和部分弧组成的有向图为 2(k) y(k)= ∈RW. 一棵有向树，则称有向图罗包含一棵生成树定义有向图罗的邻接矩阵为W=[a]∈ Lyx(k)」 RxN,ag表示弧(，)的权重.规定：若(，)∈ 系统(1)可表示为分，a=1,否则a,=0.拉普拉斯矩阵L= (x(k+1)=(Iw⑧A)x(k)+(Iw☒B)u(k) [l与]∈Rxw,定义为l=∑a,l与=-a与，ij:i, y(k)=(Iw⑧C)x(k) jc. x(0)=xo (3) j=1,2,…N,显然∑与=0. 进一步，对系统(1)及其对应的有向信息交换本文视参考信号r(k)为领导者（标记为顶点拓扑写作如下假设 )的输出轨迹.如果第i个顶点能够接受来自领导 B A2:设(A,B)可镇定且行满秩，1 者的信息，则弧(o,:)存在并记其权重m:=1,否 0 则m:=0.此外，记牵引矩阵为M=diag(m1,m2, 表示具有适当维数的单位矩阵. …,my). A3:设(C,A)可检测. A4:设有向图罗包含一棵生成树，而且根顶点 2问题描述 v,能够观测到来自领导者的信息，即m.=1. 考虑由N个跟随者和一个领导者构成的多智对于假设A4,一个已知的结果是：能体系统，其中跟随者的动力学方程为引理13)如果假设A4成立，那么有 x:(k+1)=Ax,(k)+Bu:(k) (1)L1w=0,换言之，0是矩阵L的一个特征 ,x:(0)=x0, y;(k)=Cx;(k) 值，其相应的特征向量为1、； i=1,2,…,W (1) (2)矩阵H非奇异且其所有特征值具有正的实其中，x(k)∈R",u:(k)∈R',y:(k)∈R'分别表部，其中，H=L+M. 示状态，输人和输出，xm表示x:(k)的初值，A、B 在随后的讨论中，我们还需要用到下面的和C分别为n×n、n×r和l×n的矩阵.对于取定结果的i,(1)中的方程就是第i个跟随者的状态方程引理2 在假设A4成立时，矩阵设领导者的输出（即参考信号）为r(k),本文 H⑧C 0 的目的是设计一个最优预见控制器，使得系统(1) 行满秩的充分必要条件是 IN-(I,⑧A)I,⑧B」的闭环系统的输出y,(k)都渐近跟踪r(k),即 lim[y:(k)-r(k)]=0,i=1,2,…,N(2) 1-AB行满秩 0 首先对参考信号作如下假设. 附注1这一结果的证明方法与文献[31]中引 A1:设参考信号r(k)在k→∞时趋于常值向量理3的证明方法很相似，因此不再重复. r,即定义跟随者i(i=1,2,…,N)的局部邻居输出 limr(k)=r 误差为

卢延荣等: 离散时间多智能体系统的协调最优预见跟踪的矩阵. 有关 Kronecker 积的其他性质, 可参考文献[32]. 对于多智能体系统, 智能体间的信息交换拓扑通常用有向图 G = (V(G),E(G))表示, 其中 V(G) = {v1 ,v2 ,…,vN }是顶点集, E(G)哿V(G) 伊 V(G)代表弧集. 顶点 vi沂V(G)表示第 i 个智能体, 弧( vi, vj)沂E(G)表示第 j 个智能体可以接受来自第 i 个智能体的信息, 其中顶点 vi 称为父顶点, vj 称为子顶点, 并称 vi 为 vj 的邻居. 基于此, 定义第 i 个智能体的邻居集为 Ni = {j | (vj,vi)沂E(G)}. 在有向图 G 中, 如果除根顶点外, 其他顶点有且只有一个父顶点, 则称有向图 G 为一棵有向树. 另外, 在有向图 G 中, 若其全部顶点和部分弧组成的有向图为一棵有向树, 则称有向图 G 包含一棵生成树. 定义有向图 G 的邻接矩阵为 W = [ aij ] 沂迬 N 伊 N , aij表示弧(vj,vi)的权重. 规定:若( vj,vi)沂 E(G), aij = 1, 否则 aij = 0. 拉普拉斯矩阵 L = [l ij]沂迬 N 伊 N ,定义为 l ii = 移 j沂Ni aij, l ij = - aij, i屹j; i, j = 1,2,…,N, 显然移 N j = 1 l ij = 0. 本文视参考信号 r( k) 为领导者(标记为顶点 v0 )的输出轨迹. 如果第 i 个顶点能够接受来自领导者的信息, 则弧(v0 ,vi)存在并记其权重 mi = 1, 否则 mi = 0. 此外, 记牵引矩阵为 M = diag(m1 ,m2 , …,mN). 2 问题描述考虑由 N 个跟随者和一个领导者构成的多智能体系统, 其中跟随者的动力学方程为 xi(k + 1) = Axi(k) + Bui(k) yi(k) = Cxi(k { ) , xi(0) = xi0 , i = 1,2,…,N (1) 其中,xi(k)沂迬 n , ui(k)沂迬 r , yi(k)沂迬 l 分别表示状态, 输入和输出, xi0 表示 xi ( k) 的初值, A、B 和 C 分别为 n 伊 n、n 伊 r 和 l 伊 n 的矩阵. 对于取定的 i, (1)中的方程就是第 i 个跟随者的状态方程. 设领导者的输出(即参考信号)为 r( k), 本文的目的是设计一个最优预见控制器, 使得系统(1) 的闭环系统的输出 yi(k)都渐近跟踪 r(k), 即 lim k寅肄 [yi(k) - r(k)] = 0, i = 1,2,…,N (2) 首先对参考信号作如下假设. A1: 设参考信号 r(k)在 k寅肄时趋于常值向量 r, 即 lim k寅肄 r(k) = r 另外, 设 r( k)的预见步数为 MR,即对于当前时标 k, 参考信号 r( k), r( k + 1), r( k + 2),…,r( k + MR)的值为已知, MR 步以后的值为常值, 即 r(k + j) = r(k), j = MR + 1,MR + 2,MR + 3,… 用预见控制的相关理论来设计控制器. 首先把 (1)写成紧凑形式, 为此引入向量 x(k) = x1 (k) x2 (k) 左 xN(k é ë ê ê ê ê ê ù û ú ú ú ú ú ) 沂迬 nN , u(k) = u1 (k) u2 (k) 左 uN(k é ë ê ê ê ê ê ù û ú ú ú ú ú ) 沂迬 rN , y(k) = y1 (k) y2 (k) 左 yN(k é ë ê ê ê ê ê ù û ú ú ú ú ú ) 沂迬 lN . 系统(1)可表示为 x(k + 1) = (IN茚A)x(k) + (IN茚B)u(k) y(k) = (IN茚C)x(k { ) , x(0) = x0 (3) 进一步, 对系统(1)及其对应的有向信息交换拓扑 G 作如下假设. A2: 设(A,B) 可镇定且 I - A B C é ë ê ê ù û ú ú 0 行满秩, I 表示具有适当维数的单位矩阵. A3: 设(C,A)可检测. A4: 设有向图 G 包含一棵生成树, 而且根顶点 vi r能够观测到来自领导者的信息, 即 mi r = 1. 对于假设 A4, 一个已知的结果是: 引理 1 [31] 如果假设 A4 成立, 那么有 (1)L1N = 0, 换言之, 0 是矩阵 L 的一个特征值, 其相应的特征向量为 1N; (2)矩阵 H 非奇异且其所有特征值具有正的实部,其中,H = L + M. 在随后的讨论中, 我们还需要用到下面的结果. 引理 2 在假设 A4 成立时, 矩阵 H茚C 0 InN - (IN茚A) IN茚 é ë ê ê ù û ú Bú行满秩的充分必要条件是 I - A B C é ë ê ê ù û ú ú 0 行满秩. 附注 1 这一结果的证明方法与文献[31]中引理 3 的证明方法很相似, 因此不再重复. 定义跟随者 i( i = 1,2,…,N) 的局部邻居输出误差为 ·243·

·244· 工程科学学报，第40卷，第2期 e,(k)=∑a,y,(k)-y:(k)+m,(r(k)-y,(k) M⑧L ie GR= (4) 由假设A1知，对于当前时标k,R(k),R(k+ 记全局输出误差为 1),R(k+2),…,R(k+M。)的值是已知的.基于 e,(k)7 此，将参考信号的增量做成列向量 e2(k) e(k)= ∈RW △R(k+1) △R(k+2) Lex(k) X(k)= 并令R(k)=1v⑧r()∈R,则由(4)得到 △R(k+MR)」 e(k)=-((L+M)⑧C)x(k)+(M⑧L)R(k) 显然，X(k)满足如下的代数关系 (5) XR(k+1)=AgXg(k) (9) 其中，L为有向图对应的拉普拉斯矩阵，M为牵其中AR是(lNM)×(lNMR)矩阵，定义为引矩阵.为方便起见，记H=L+M.注意到H1v= 0 0 07 (L+M)1x=M1w,则(4)可表示为 e(k)=-(H⑧l)(Ix⑧C)x(k)-R(k)(6) AR= 0 在假设A4下，由于H非奇异，因此从(6)得到当且仅当lime(k)=0时(2)成立.为此，引入如下的 0 二次型性能指标函数再次引入状态变量 J=∑∑e(k)0e,(k)+△u(k)R△u,(k) 「X(k)1 Xgo(k) k=-g+1=1 Xp(k) (7) 于是，结合(8)和(9)得到标准的离散时间线性式中，Q和R分别是l×l和r×r的正定矩阵(i= 系统 1,2,…,N).文献[23]指出，在性能指标中引入输 Xo(+1)=Xgo(k)+Au(k) (10) 入的差分△u,(k),可使闭环系统中包含积分器，而其中，2= = 「G. 亚= 积分器的存在有助于消除系统在跟踪过程中产生的 0 AR 静态误差. [Gg0… 0],并且2和⊙分别为[N(l+n+ 下面采用预见控制的方法构造一个增广系统， lM.)]×[N(l+n+lMR)]和[N(l+n+lMR)]× 将多智能体系统的协调预见跟踪问题转化为对增广 (Nr)的矩阵. 系统的状态调节问题，然后设计所需要的控制器. 根据本文的控制目的，取观测方程为 e(k)=IXgo(k) (11) 3最优预见控制器的设计其中，T=[Co0]为(lW)×[N(l+n+lM.)]的矩 3.1增广系统的构造阵.则(10)和(11)即为所需要的增广系统将一阶后向差分算子△：根据系统(10)中的相关变量，性能指标函数 △r(k)=x(k)-x(k-1) (7)可表示为作用于系统(3)和全局输出误差(5)，并引入状态向量 J=豆(0x()+a如()u() (12) X(k) e(k) L△r(k) 得到 -[88e-[8 ,分别为[N(l+n+ X(k+1)=ΦX(k)+G.△u(k)+GR△R(k+1) Ma)]×[N(l+n+M)]和[(l+n)N]×[(l+n) (8) N]的半正定矩阵.另外，Q.=diag(Q。,Qa,…, 「I-H☒CA -H⑧CB 其中，Φ= Qv),R=diag(R1,R2,…,R）. 0I⑧A G。= Iv⑧B 至此，离散时间多智能体系统的协调预见跟踪

工程科学学报,第 40 卷,第 2 期 ei(k) = 移 j沂Ni aij(yj(k) - yi(k)) + mi(r(k) - yi(k)) (4) 记全局输出误差为 e(k) = e1 (k) e2 (k) 左 eN(k é ë ê ê ê ê ê ù û ú ú ú ú ú ) 沂迬 lN 并令 R(k) = 1N茚r(k)沂迬 lN , 则由(4)得到 e(k) = - ((L + M)茚C)x(k) + (M茚Il)R(k) (5) 其中, L 为有向图 G 对应的拉普拉斯矩阵, M 为牵引矩阵. 为方便起见,记 H = L + M. 注意到 H1N = (L + M)1N = M1N, 则(4)可表示为 e(k) = - (H茚Il)((IN茚C)x(k) - R(k)) (6) 在假设 A4 下, 由于 H 非奇异, 因此从(6)得到当且仅当lim k寅肄 e(k) = 0 时(2)成立. 为此, 引入如下的二次型性能指标函数 J = 移肄 k = -MR+1移 N i = 1 e T i (k)Qei ei(k) + 驻u T i (k)R寛i驻ui(k) (7) 式中, Qei和 R寛i 分别是 l 伊 l 和 r 伊 r 的正定矩阵(i = 1,2,…,N). 文献[23]指出, 在性能指标中引入输入的差分驻ui(k), 可使闭环系统中包含积分器, 而积分器的存在有助于消除系统在跟踪过程中产生的静态误差. 下面采用预见控制的方法构造一个增广系统, 将多智能体系统的协调预见跟踪问题转化为对增广系统的状态调节问题, 然后设计所需要的控制器. 3 最优预见控制器的设计 3郾 1 增广系统的构造将一阶后向差分算子驻: 驻x(k) = x(k) - x(k - 1) 作用于系统(3)和全局输出误差(5), 并引入状态向量 X0 (k) = e(k) 驻x(k é ë ê ê ù û ú ú ) 得到 X0 (k + 1) = 椎X0 (k) + Gu驻u(k) + GR驻R(k + 1) (8) 其中, 椎 = I - H茚CA 0 IN茚 é ë ê ê ù û ú A ú , Gu = - H茚CB IN茚 é ë ê ê ù û ú B ú , GR = M茚I é l ë ê ê ù û ú ú 0 . 由假设 A1 知, 对于当前时标 k, R(k), R(k + 1), R(k + 2), …, R(k + MR )的值是已知的. 基于此, 将参考信号的增量做成列向量 XR(k) = 驻R(k + 1) 驻R(k + 2) 左驻R(k + MR é ë ê ê ê ê ê ù û ú ú ú ú ú ) 显然, XR(k)满足如下的代数关系 XR(k + 1) = ARXR(k) (9) 其中 AR 是(lNMR) 伊 (lNMR)矩阵, 定义为 AR = 0 IlN 0 … 0 左埙埙埙左左埙埙 0 左埙 IlN 0 … … … é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 0 再次引入状态变量 XR0 (k) = X0 (k) XR(k é ë ê ê ù û ú ú ) 于是, 结合(8) 和(9) 得到标准的离散时间线性系统 XR0 (k + 1) = 赘XR0 (k) + 专驻u(k) (10) 其中, 赘 = 椎追 0 A é ë ê ê ù û ú ú R , 专 = éGu ë ê ê ù û ú ú 0 , 追 = [GR 0 … 0],并且赘和专分别为[N( l + n + lMR)] 伊 [N( l + n + lMR )] 和[N( l + n + lMR )] 伊 (Nr)的矩阵. 根据本文的控制目的, 取观测方程为 e(k) = 祝XR0 (k) (11) 其中,祝 = [C0 0]为( lN) 伊 [N( l + n + lMR )]的矩阵. 则(10)和(11)即为所需要的增广系统. 根据系统(10) 中的相关变量, 性能指标函数 (7)可表示为 J = 移肄 k = 1 X T R0 (k) ^QXR0 (k) + 驻u T (k)R寛驻u(k) (12) 其中, ^Q = éQ 0 ë ê ê ù û ú ú 0 0 , Q = éQe 0 ë ê ê ù û ú ú 0 0 ,分别为[N(l + n + lMR)] 伊 [N(l + n + lMR)]和[( l + n)N] 伊 [( l + n) N]的半正定矩阵. 另外, Qe = diag ( Qe1 ,Qe2 ,…, QeN), R寛 = diag(R寛1 ,R寛2 ,…,R寛N). 至此, 离散时间多智能体系统的协调预见跟踪 ·244·

卢延荣等：离散时间多智能体系统的协调最优预见跟踪 ·245· 问题就转化为系统(11)在性能指标函数(12)下的左乘[zl-2⊙]得到最优调节问题.实际上，根据线性二次型最优控制「(z-l)lw H⑧C -G810 0 0 理论[]，将所求得的△u(k)代入系统(10)，其闭 0 dnv-(l⑧A) 0 0…0 I⑧B 环系统为渐近稳定的，于是由(11)知e(k)在k→o w -Iw 0 时渐近稳定到0，即系统(1)实现了对领导者的协 w 调预见跟踪.通过应用文献[34]的结果，立即得到下面的定理 -Iw 定理1若(2，O)可镇定，(Q,2)可检测， 0 0 2Lv0 则系统(10)的使性能指标函数(12)极小的最优控由于初等变换不改变矩阵的秩，因此上述矩阵与制输入为： [l-2O]具有相同的秩.又由于1z≥1，所以上 △u(k)=-(R+OP⊙)-1⊙P2Xo(k)(13) 述矩阵中以z山八为对角元的上三角矩阵块可逆，根其中，P.是一个[N(l+n+lM.)]×[N(l+n+ 据矩阵秩的性质知 M.)]的半正定矩阵，满足如下的离散代数Riccati rank[2I-INMg rank(V) 方程其中： H⑧C 07 P,=Q+2P2-2P⊙(R+⊙P⊙)-1⊙P2 0 (14) -(1,8A)1,®BK16) 3.2控制器的存在性于是，只需证明下述命题即可：在假设A4下，为了保证定理1中控制器的存在性，需要验证当z∈C且IzI≥1时，V行满秩的充要条件是原系统在满足何条件时，(2，⊙)是可镇定的以及「I-AB [2I-A 均行满秩 (Q2,2)是可检测的 B C 0 引理3在假设A4下，(2，⊙)可镇定的充要必要性.即证明在假设A4下，当1z1≥1时，条件是假设A2成立若V行满秩，则[l-A B]与-AB购行证明：由Popov-Belevitch-Hautus(PBH)秩判据知[3]，需要证明：在假设A4下，当z∈C且1z1≥ 满秩 1时，[-2⊙]行满秩的充要条件是当z=1时，由(16)得到 [-AB]与 I-AB1 均行满秩 H⑧C c o rank(Vl:=1)=rank LIx-(I⑧A)I⑧B 根据2和⊙的具体结构，有 (17) [d-00= 在假设A4下，由引理2知，如果 (:-1)IIN H⑧CA :-G810 …0:-H8CB H⑧C 0 lnv-(l⑧A) … 01,⑧8 I.N-(I,⑧A)I,⑧B 行满秩，那么 0 1w -Iw 0 w 「I-AB行满秩同时，「I-A B c o 行满秩蕴含 0 -I 着[-AB]-行满秩 0 lw 0 当1z≥1且z≠1时，(z-1)1w非奇异，由矩注意到 H⑧CA-zH⑧C= 阵秩的性质知，若V行满秩，则 (H⑧C)(I⑧A)-z(H⑧C)(I⑧In)= [InN-(Iw⑧A)Iw⑧B]行满秩.由于 -(H⑧C)[zl.x-(Iw⑧A)] (15) rank[zl.v-(Iw⑧A)I⑧B]=N-ank[zl-AB], 于是，用可逆矩阵因此进一步得到，在1z|≥1且z≠1时，若V行满「IwH⑧C 0 07 秩，则[z-AB]行满秩. IN 0 0 联合两种分类情形下的结果便可证得必要性. 0 IwN 充分性即证明在假设A4下，当z∈C且Iz1≥1 0 I-AB1 0 0 …0 Ii] 时，若[l-AB]与 c o 均行满秩，则V行

卢延荣等: 离散时间多智能体系统的协调最优预见跟踪问题就转化为系统(11)在性能指标函数(12)下的最优调节问题. 实际上, 根据线性二次型最优控制理论[33] , 将所求得的驻u( k) 代入系统(10), 其闭环系统为渐近稳定的, 于是由(11)知 e(k)在 k寅肄时渐近稳定到 0, 即系统(1)实现了对领导者的协调预见跟踪. 通过应用文献[34]的结果,立即得到下面的定理. 定理 1 若(赘,专)可镇定, ( ^Q 1 / 2 ,赘)可检测, 则系统(10)的使性能指标函数(12)极小的最优控制输入为: 驻u(k) = - (R寛 + 专 TPr专) - 1专 TPr赘XR0 (k) (13) 其中, Pr 是一个[N( l + n + lMR )] 伊 [ N( l + n + lMR)]的半正定矩阵, 满足如下的离散代数 Riccati 方程 Pr = ^Q + 赘 TPr赘 - 赘 TPr专 (R寛 + 专 TPr专) - 1专 TPr赘 (14) 3郾 2 控制器的存在性为了保证定理 1 中控制器的存在性,需要验证原系统在满足何条件时, (赘,专) 是可镇定的以及 ( ^Q 1 / 2 ,赘)是可检测的. 引理 3 在假设 A4 下, (赘,专)可镇定的充要条件是假设 A2 成立. 证明: 由 Popov鄄鄄 Belevitch鄄鄄 Hautus ( PBH) 秩判据知[33] ,需要证明:在假设 A4 下, 当 z沂迯且| z | 逸 1 时, [ zI - 赘专 ] 行满秩的充要条件是 [zI - A B]与 I - A B C é ë ê ê ù û ú ú 0 均行满秩. 根据赘和专的具体结构, 有 [zI -赘专] = (z -1)IlN H茚CA - G茚Il 0 … 0 -H茚CB 0 zInN - (IN茚A) 0 0 … 0 IN茚B 0 0 zIlN - IlN 0 左左 zIlN 埙左左左埙 - IlN 左 0 0 zIlN 詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪 é ë ê ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ú 0 注意到 H茚CA - zH茚C = (H茚C)(IN茚A) - z(H茚C)(IN茚In ) = - (H茚C)[zInN - (IN茚A)] (15) 于是, 用可逆矩阵 IlN H茚C 0 … 0 0 IlN 0 … 0 0 0 IlN 埙左左左埙埙 0 0 0 … 0 I é ë ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú lN 左乘[zI - 赘专]得到 (z -1)IlN zH茚C - G茚Il 0 … 0 0 0 zInN - (IN茚A) 0 0 … 0 IN茚B 0 0 zIlN - IlN 0 左左 zIlN 埙左左左埙 - IlN 左 0 0 zIlN 詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪 é ë ê ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ú 0 由于初等变换不改变矩阵的秩, 因此上述矩阵与 [zI - 赘专]具有相同的秩. 又由于|z|逸1, 所以上述矩阵中以 zIlN为对角元的上三角矩阵块可逆, 根据矩阵秩的性质知 rank[zI - 赘专] = lNMR + rank(V) 其中: V = (z - 1)IlN zH茚C 0 0 zInN - (IN茚A) IN茚 é ë ê ê ù û ú ú B (16) 于是, 只需证明下述命题即可: 在假设 A4 下, 当 z沂迯且 | z | 逸1 时, V 行满秩的充要条件是 [zI - A B]与 I - A B C é ë ê ê ù û ú ú 0 均行满秩. 必要性. 即证明在假设 A4 下, 当 | z | 逸1 时, 若 V 行满秩, 则 [ zI - A B] 与 I - A B C é ë ê ê ù û ú ú 0 均行满秩. 当 z = 1 时, 由(16)得到 rank(V| z = 1 ) = rank H茚C 0 InN - (IN茚A) IN茚 é ë ê ê ù û ú Bú (17) 在假设 A4 下, 由引理 2 知, 如果 H茚C 0 InN - (IN茚A) IN茚 é ë ê ê ù û ú Bú 行满秩, 那么 I - A B C é ë ê ê ù û ú ú 0 行满秩. 同时, I - A B C é ë ê ê ù û ú ú 0 行满秩蕴含着[zI - A B]z = 1行满秩. 当|z| 逸1 且 z屹1 时, ( z - 1) IlN非奇异, 由矩阵秩的性质知, 若 V 行满秩, 则 [zInN - (IN茚A) IN茚B]行满秩. 由于 rank[zInN - (IN茚A) IN茚B] =N·rank[zI -A B], 因此进一步得到, 在| z | 逸1 且 z屹1 时, 若 V 行满秩, 则[zI - A B]行满秩. 联合两种分类情形下的结果便可证得必要性. 充分性. 即证明在假设 A4 下, 当 z沂迯且|z |逸1 时, 若[zI - A B]与 I - A B C é ë ê ê ù û ú ú 0 均行满秩, 则 V 行 ·245·

·246· 工程科学学报，第40卷，第2期满秩引理4在假设A4下，(Q2,2)可检测的充在假设A4下，由引理2知，如「I-AB 要条件是(C,A)可检测. c0 证明：应用可检测的PBH秩判据知，(Q2, 满秩，则V八-1行满秩.另外，在1z≥1且z≠1时， 2)可检测的充要条件是对任意的z∈C且Iz1≥1，由于[z-AB]是行满秩的，因此由(16)容易得 xl-2 矩阵行满秩.由2和Q的结构可得到V1≠，行满秩.这便证得了引理的充分性. 「(z-1)Iw H⑧CA -G⑧L, 0 0 0 zlN-(Iw☒A) 0 0 S 0 0 2Iw -Iw 0 0 0 -Iw 0 0 zl g 0 0 0 0 0 0 0 0 0 作为分块矩阵，由于w可逆且Q也可逆，所以控制输人为：「zl-2 H⑧CA rank =rank LlnN-(Ix⑧A) +IN INMR △u(k)=F。X。(k)+ ∑FG)△R(k+i)= j= (18) 注意在假设A4下H非奇异，所以 F.e()+F,△r()+F,G)△R(k+》「z'(H-'②Ln)z1(1,⑧C)7f H⑧CA (20) 0 LzIV-(Iw⑧A) 式中，F。=[F。F]=-(R+GPG)GP Iw⑧C F.(G)=-(R+GPG.)-G()-1PGR, LlnN-(I⑧A)」 j=1,2,…,Mg 进而得到其中，专=Φ+G.F。是一个[(l+n)N]×[(l+n) H⑧CA Iw⑧C N]的稳定矩阵.此外，矩阵P是一个[(l+n)N]× rank lnN-(I⑧A) rank L2IN-(I,⑧A)」 [(l+n)N]的半正定矩阵，满足如下的代数Riccati 方程 N.rank (19) P=Q+ΦPΦ-Φ'PG.(R+GPG.)-1GPΦ 从(18)和(19)得到：对任意的z∈C且Iz1≥1， (21) 「zl-2 C 将定理2中所得△u(k)代入系统(8)得到例满秩的充要条件是例满秩.这便 2I-A X。(k+1)=X(k)+w(k) (22) 证得了引理4. Mg 其中，w(k)=G△R(k+1)+∑G.FG)△R(k+. 3.3原系统的最优预见控制器需要指出的是，由于所有的问题转换过程都使由假设A1知，参考信号r(k)在k→∞时趋于得系统的维数增加，因而从系统(10)和性能指标函常值向量r,因此△R(k+j)在k→∞时趋于0(U=1, 数(12)下出发得到控制器(13)，需要求解的代数 2,…,Ms).另外，由定理2知，专为稳定矩阵，故 Riceati方程(14)的维数较高，会带来计算上的困 X(k)在k→时渐近稳定到0.同样地，作为难.利用系统矩阵和性能指标函数中权重矩阵的特 X。(k)的分量，e(k)在k→x时也渐近稳定到0.在点，可以对Riccati方程进行降阶.具体的降阶过程上述分析的基础上，立即可得如下结论可参见文献[34].利用降阶的结果可以得到定理2. 定理3假设定理2若（中，G)可镇定，(Q2,中）可检测， (a)A1~A4成立，则在系统(8)下，使性能指标函数(7)极小的最优 (b)R与Q正定(i=1,2,…,N)

工程科学学报,第 40 卷,第 2 期满秩. 在假设 A4 下, 由引理 2 知, 如果 I - A B C é ë ê ê ù û ú ú 0 行满秩, 则 V| z = 1行满秩. 另外, 在|z|逸1 且 z屹1 时, 由于[zI - A B]是行满秩的, 因此由(16) 容易得到 V| z屹1行满秩. 这便证得了引理的充分性. 引理 4 在假设 A4 下, ( ^Q 1 / 2 ,赘)可检测的充要条件是(C,A)可检测. 证明: 应用可检测的 PBH 秩判据知, ( ^Q 1 / 2 , 赘)可检测的充要条件是对任意的 z沂迯且 | z | 逸1, 矩阵 zI - 赘 ^Q 1 / é ë ê ê ù û ú 2 ú行满秩. 由赘和 ^Q 的结构可得 zI - 赘 ^Q 1 / é ë ê ê ù û ú 2 ú = (z - 1)IlN H茚CA - G茚Il 0 … … 0 0 zInN - (IN茚A) 0 0 … … 0 0 0 zIlN - IlN 0 … 0 左左埙埙埙左左左埙埙 0 左左埙 - IlN 0 0 zIlN Q 1 / 2 e 0 0 0 … … 0 0 0 0 0 … … 詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪詪 é ë ê ê ê ê ê ê ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú ú ú ú ú ú ú 0 作为分块矩阵, 由于 zIlN可逆且 Q 1 / 2 e 也可逆, 所以 rank zI - 赘 ^Q 1 / é ë ê ê ù û ú 2 ú = rank H茚CA zInN - (IN茚A é ë ê ê ù û ú ú ) + lN + lNMR (18) 注意在假设 A4 下 H 非奇异, 所以 z - 1 (H - 1茚In ) z - 1 (IN茚C) 0 I é ë ê ê ù û ú ú nN H茚CA zInN - (IN茚A é ë ê ê ù û ú ú ) = IN茚C zInN - (IN茚A é ë ê ê ù û ú ú ) 进而得到 rank H茚CA zInN - (IN茚A é ë ê ê ù û ú ú ) = rank IN茚C zInN - (IN茚A é ë ê ê ù û ú ú ) = N·rank C zI - é ë ê ê ù û ú ú A (19) 从(18) 和(19) 得到:对任意的 z沂迯且 | z | 逸1, zI - 赘 ^Q 1 / é ë ê ê ù û ú 2 ú列满秩的充要条件是 C zI - é ë ê ê ù û ú ú A 列满秩. 这便证得了引理 4. 3郾 3 原系统的最优预见控制器需要指出的是, 由于所有的问题转换过程都使得系统的维数增加, 因而从系统(10)和性能指标函数(12)下出发得到控制器(13), 需要求解的代数 Riccati 方程(14) 的维数较高, 会带来计算上的困难. 利用系统矩阵和性能指标函数中权重矩阵的特点, 可以对 Riccati 方程进行降阶. 具体的降阶过程可参见文献[34]. 利用降阶的结果可以得到定理2. 定理 2 若(椎,Gu )可镇定, (Q 1 / 2 ,椎)可检测, 则在系统(8)下, 使性能指标函数(7)极小的最优控制输入为: 驻u(k) = F0X0 (k) + 移 MR j = 1 FR(j)驻R(k + j) = Fe e(k) + Fx驻x(k) + 移 MR j = 1 FR(j)驻R(k + j) (20) 式中, F0 = [Fe Fx] = - (R寛 + G T uPGu ) - 1G T uP椎 FR(j) = - (R寛 + G T uPGu ) - 1G T u (孜 T ) j - 1PGR, j = 1,2,…,MR 其中, 孜 = 椎 + GuF0 是一个[( l + n) N] 伊 [( l + n) N]的稳定矩阵. 此外, 矩阵 P 是一个[(l + n)N] 伊 [(l + n)N]的半正定矩阵, 满足如下的代数 Riccati 方程 P = Q + 椎 TP椎 - 椎 TPGu (R寛 + G T uPGu ) - 1G T uP椎 (21) 将定理 2 中所得驻u(k)代入系统(8)得到 X0 (k + 1) = 孜X0 (k) + 棕(k) (22) 其中, 棕(k) = GR驻R(k +1) + 移 MR j =1 GuFR(j)驻R(k + j). 由假设 A1 知, 参考信号 r( k)在 k寅肄时趋于常值向量 r, 因此驻R(k + j)在 k寅肄时趋于0(j = 1, 2,…,MR). 另外, 由定理 2 知, 孜为稳定矩阵, 故 X0 ( k) 在 k 寅肄时渐近稳定到 0. 同样地, 作为 X0 (k)的分量, e(k)在 k寅肄时也渐近稳定到 0. 在上述分析的基础上,立即可得如下结论. 定理 3 假设 (a) A1 ~ A4 成立, (b) R寛i 与 Qei正定(i = 1,2,…,N), ·246·

卢延荣等：离散时间多智能体系统的协调最优预见跟踪 ·247· 那么在任意的初始条件x(0)=x。下，使协调预见 0 0 0007 00007 跟踪问题可解的全局最优预见控制器为 0 0 00 0 01000 MR L= u(k)=F.∑e(i)+Fx(k)+ -1 0 100 M= 00000 Fg(j)R(k+j) :=0 =1 0 -101 0 00000 (23) 0 -100 1 L00000」证明：由条件(a)和(b)可得定理2的结果，根假设领导者的输出信号为据对闭环系统(22)的分析知，在控制器(20)的作 0, k80 u(k)-u(k-1)= 跟随者的动力学方程(1)由如下的离散时间双积分器系统描述含Fa0 F.e()+F,[x)-rk-1)]+ (a(k+1)=x(k)+hx(k) GRk+)-三F.G)R(k MR x2(k+1)=xa(k)+hu:(k),i=1,2,…,5 y:(k)=x1(k) 并令u(0)=0,R(0)=0,比较等式两端可得(23) (24) 的结果. 其中，h为采样间隔，xa(k)∈R和x2(k)∈R分别 4数值仿真表示第i个跟随者在4=h时刻的位置与速度，在本例中取采样间隔为h=0.1s.另外，假设此处所根据文献[35]，移动车辆的位置状态和速度状取的输出信号满足A1,即在当前时刻t4,领导者的态可建模为一个离散时间双积分器系统.因此本文输出信息r(k),r(k+1),r(k+2),…,r(k+Mg)是提出的控制器设计方法可应用于多车辆系统中. 可被跟随者直接利用的. 例.设一个多智能体系统由6辆汽车组成，讨相应于系统(1)，矩阵A,B和C分别为论5辆跟随者车辆跟踪领导者车辆目标轨迹的问 10.17m 题.其中智能体间的信息交换拓扑罗由图1表示， A= 0.1c=1o 该拓扑满足有向图包含一棵生成树的假设，即满足利用PBH秩判据判断得，(A,B)是可镇定的，假设A4. (C,A)是可检测的，此外容易验证矩阵 I-A B 行满秩.即定理2和定理3的条件均成立，相应于系统(8)和性能指标函数(12)，增益矩阵Q和R取为「Q。01 0= 00 Q。=diag(0.11,0.1,0.04,0.06,0.27),R=2-L 图1车辆间的有向通信拓扑于是代数Riccati方程(14)存在对称半正定解阵. Fig.1 Directed communication topology among vehicles 从而根据定理2可得系统(8)的闭环系统渐近稳从图1看出与有向图写相应的Laplacian矩阵定，即lim[y:(k)-r(k)]=0,i=1,2,…,N.应用 L和牵引矩阵M分别为 MATLAB,计算得到最优预见控制器(23)中的增益矩阵F.和F分别为「0.191930.00000 -0.04209 0.00000 0.00000 0.000000.15567 0.00000 -0.04909 -0.15066 F.=0.076170.00000 0.11827 0.00000 0.00000 0.000000.07385 0.00000 0.14301 -0.02007 0.000000.09987 0.00000 -0.020070.27059

卢延荣等: 离散时间多智能体系统的协调最优预见跟踪那么在任意的初始条件 x(0) = x0 下, 使协调预见跟踪问题可解的全局最优预见控制器为 u(k) = Fe 移 k i = 0 e(i) + Fxx(k) + 移 MR j = 1 FR(j)R(k + j) (23) 证明: 由条件(a)和(b)可得定理 2 的结果, 根据对闭环系统(22)的分析知, 在控制器(20) 的作用下, 多智能体系统(1)可实现对参考信号 r(k)的协调最优预见跟踪. 根据差分格式将控制器(20)表述为如下形式: u(k) - u(k - 1) = 移 k i = 0 Fe e(i) - 移 k-1 i = 0 Fe e(i) + Fx[x(k) - x(k - 1)] + 移 MR j = 1 FR(j)R(k + j) - 移 MR j = 1 FR(j)R(k + j - 1) 并令 u(0) = 0, R(0) = 0, 比较等式两端可得(23) 的结果. 4 数值仿真根据文献[35], 移动车辆的位置状态和速度状态可建模为一个离散时间双积分器系统. 因此本文提出的控制器设计方法可应用于多车辆系统中. 例. 设一个多智能体系统由 6 辆汽车组成,讨论 5 辆跟随者车辆跟踪领导者车辆目标轨迹的问题. 其中智能体间的信息交换拓扑 G 由图 1 表示, 该拓扑满足有向图包含一棵生成树的假设, 即满足假设 A4. 图 1 车辆间的有向通信拓扑 Fig. 1 Directed communication topology among vehicles 从图 1 看出与有向图 G 相应的 Laplacian 矩阵 L 和牵引矩阵 M 分别为 L = 0 0 0 0 0 0 0 0 0 0 - 1 0 1 0 0 0 - 1 0 1 0 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 0 - 1 0 0 1 , M = 1 0 0 0 0 0 1 0 0 0 0 0 0 0 0 0 0 0 0 0 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 0 0 0 0 0 假设领导者的输出信号为 r(k) = 0, k 80 跟随者的动力学方程(1)由如下的离散时间双积分器系统描述 xi1 (k + 1) = xi1 (k) + hxi2 (k) xi2 (k + 1) = xi2 (k) + hui(k) yi(k) = xi1 (k ì î í ïï ïï ) , i = 1,2,…,5 (24) 其中,h 为采样间隔, xi1 (k)沂迬和 xi2 (k)沂迬分别表示第 i 个跟随者在 t k = kh 时刻的位置与速度, 在本例中取采样间隔为 h = 0郾 1 s. 另外, 假设此处所取的输出信号满足 A1, 即在当前时刻 t k, 领导者的输出信息 r(k), r(k + 1), r(k + 2),…,r(k + MR)是可被跟随者直接利用的. 相应于系统(1), 矩阵 A, B 和 C 分别为 A = é1 0郾 1 ë ê ê ù û ú ú 0 1 , B = é 0 ë ê ê ù û ú ú 0郾 1 , C = [1 0] 利用 PBH 秩判据判断得, (A,B)是可镇定的, (C, A ) 是可检测的, 此外容易验证矩阵 I - A B C é ë ê ê ù û ú ú 0 行满秩. 即定理 2 和定理 3 的条件均成立, 相应于系统(8)和性能指标函数(12), 增益矩阵 Q 和 R寛取为 Q = éQe 0 ë ê ê ù û ú ú 0 0 , Qe = diag(0郾 11,0郾 1,0郾 04,0郾 06,0郾 27), R寛 = 2·I5 于是代数 Riccati 方程(14) 存在对称半正定解阵. 从而根据定理 2 可得系统(8) 的闭环系统渐近稳定, 即lim k寅肄 [yi(k) - r( k)] = 0, i = 1,2,…,N. 应用 MATLAB, 计算得到最优预见控制器(23)中的增益矩阵 Fe 和 Fx 分别为 Fe = 0郾 19193 0郾 00000 - 0郾 04209 0郾 00000 0郾 00000 0郾 00000 0郾 15567 0郾 00000 - 0郾 04909 - 0郾 15066 0郾 07617 0郾 00000 0郾 11827 0郾 00000 0郾 00000 0郾 00000 0郾 07385 0郾 00000 0郾 14301 - 0郾 02007 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 0郾 00000 0郾 09987 0郾 00000 - 0郾 02007 0郾 27059 ·247·

·248· 工程科学学报，第40卷，第2期 -3.47389 -2.763580.00000 0.00000 0.46476 0.21545 0.00000 0.00000 0.00000 0.000007 0.00000 0.00000 -4.47448 -3.11641 0.00000 0.00000 0.52029 0.23529 1.39459 0.55728 F= 0.46476 0.21545 0.00000 0.00000 -2.19579 -2.17109 0.00000 0.00000 0.00000 0.00000 0.00000 0.00000 0.52029 0.23529 0.00000 0.00000 -2.48322 -2.310270.27049 0.14330 L0.00000 0.00000 1.39459 0.55728 0.00000 0.00000 0.27049 0.14330 -3.70817 -2.81801 选取如下的初始状态对本例进行仿真 2.0 x1(0)7 -0.111「x2(0)1「-0.05 (0)] 0.43Lx2(0)」L0.18 1.5 1(0)7 -0.217「x1(0)1 -0.13 L(0) 0.23」x2(0)」L0.11」一领导者 x51(0)1「0.20 跟随者1 0.5 跟随者2 Lx2(0)」0.13」跟随者3 限随者4 图2~图4表示在上述初始条件下，5个跟随跟随者5 者在预见步长分别为Mg=0,Mg=10和Mg=30时 20406080100120140 闭环系统的输出响应.从图上看出，在控制器(23) 图3在MR=10时，多智能体系统(24)的位置轨迹的作用下，跟随者（多智能体系统(24）)实现了对 Fig.3 Position trajectories of multi-agent systems (24)for Mg =10 领导者（参考信号r(k))的协调预见跟踪，且跟踪一致性效果随着预见步长的适度增加而得到了相应的改善.特别地，随着预见步长的增加，跟随者的 2.0 输出会更快地同步于领导者位置发生变化时段 15 (40≤k≤80)的输出信号. 2.0 领导者跟随者1 15 跟随者2 跟随者3 跟随者4 1.D 跟随者5 领导者 -跟随者1 20 4060 80100120140 跟随者2 跟随者3 图4在Mg=30时，多智能体系统(24)的位置轨迹跟随者4 ·跟随者5 Fig.4 Position trajectories of multi-agent systems (24)for Mg=30 20406080100120140 图2在M:=0时，多智能体系统(24)的位置轨迹 1.4 跟随者1 Fig.2 Position trajectories of multi-agent systems (24)for Mg=0 12 跟随者2 1.0 跟随者3 跟随者4 图5~图7表示5个智能体在预见步长分别为跟随者5 MR=0,MR=10和Mg=30时的局部邻居输出误 0.6 差.从图上可以看出随着时间k的增大，在三种情 0.4 形下的局部邻居误差都渐近地稳定到0.于是根据对(6)式的分析可知，系统(24)的闭环系统的输出 0 y:(k)实现了对参考信号r(k)的渐近跟踪，这也间 0.2 接地反映了本文所设计控制器的有效性.此外， 20406080100120140 图5~图7也反映了多智能体系统在合作完成跟图5在Mg=0时，多智能体系统(24)的局部邻居输出误差踪任务时的协调性情况.相较于图6和图7，图5 Fig.5 Local neighborhood output errors of multi-agent systems 中的多智能体系统在领导者输出发生变化时段的 (24)for Mg =0

工程科学学报,第 40 卷,第 2 期 Fx = -3郾 47389 -2郾 76358 0郾 00000 0郾 00000 0郾 46476 0郾 21545 0郾 00000 0郾 00000 0郾 00000 0郾 00000 0郾 00000 0郾 00000 -4郾 47448 -3郾 11641 0郾 00000 0郾 00000 0郾 52029 0郾 23529 1郾 39459 0郾 55728 0郾 46476 0郾 21545 0郾 00000 0郾 00000 -2郾 19579 -2郾 17109 0郾 00000 0郾 00000 0郾 00000 0郾 00000 0郾 00000 0郾 00000 0郾 52029 0郾 23529 0郾 00000 0郾 00000 -2郾 48322 -2郾 31027 0郾 27049 0郾 14330 0郾 00000 0郾 00000 1郾 39459 0郾 55728 0郾 00000 0郾 00 é ë ê ê ê ê ê ê ù û ú ú ú ú ú ú 000 0郾 27049 0郾 14330 -3郾 70817 -2郾 81801 选取如下的初始状态对本例进行仿真 x11 (0) x12 (0 é ë ê ê ù û ú ú ) = é - 0郾 11 ë ê ê ù û ú ú 0郾 43 , x21 (0) x22 (0 é ë ê ê ù û ú ú ) = é - 0郾 05 ë ê ê ù û ú ú 0郾 18 , x31 (0) x32 (0 é ë ê ê ù û ú ú ) = é - 0郾 21 ë ê ê ù û ú ú 0郾 23 , x41 (0) x42 (0 é ë ê ê ù û ú ú ) = é - 0郾 13 ë ê ê ù û ú ú 0郾 11 , x51 (0) x52 (0 é ë ê ê ù û ú ú ) = é0郾 20 ë ê ê ù û ú ú 0郾 13 图 2 ~ 图 4 表示在上述初始条件下, 5 个跟随者在预见步长分别为 MR = 0, MR = 10 和 MR = 30 时闭环系统的输出响应. 从图上看出, 在控制器(23) 的作用下, 跟随者(多智能体系统(24)) 实现了对领导者(参考信号 r( k))的协调预见跟踪, 且跟踪一致性效果随着预见步长的适度增加而得到了相应的改善. 特别地, 随着预见步长的增加, 跟随者的输出会更快地同步于领导者位置发生变化时段 (40臆k臆80)的输出信号. 图 2 在 MR = 0 时, 多智能体系统(24)的位置轨迹 Fig. 2 Position trajectories of multi鄄agent systems (24) for MR = 0 图 5 ~ 图 7 表示 5 个智能体在预见步长分别为 MR = 0, MR = 10 和 MR = 30 时的局部邻居输出误差. 从图上可以看出随着时间 k 的增大, 在三种情形下的局部邻居误差都渐近地稳定到 0. 于是根据对(6)式的分析可知, 系统(24)的闭环系统的输出 yi(k)实现了对参考信号 r( k)的渐近跟踪, 这也间接地反映了本文所设计控制器的有效性. 此外, 图 5 ~ 图 7 也反映了多智能体系统在合作完成跟踪任务时的协调性情况. 相较于图 6 和图 7, 图 5 中的多智能体系统在领导者输出发生变化时段的图 3 在 MR = 10 时, 多智能体系统(24)的位置轨迹 Fig. 3 Position trajectories of multi鄄agent systems (24) for MR = 10 图 4 在 MR = 30 时, 多智能体系统(24)的位置轨迹 Fig. 4 Position trajectories of multi鄄agent systems (24) for MR = 30 图 5 在 MR = 0 时, 多智能体系统(24)的局部邻居输出误差 Fig. 5 Local neighborhood output errors of multi鄄agent systems (24) for MR = 0 ·248·

卢延荣等：离散时间多智能体系统的协调最优预见跟踪 ·249· 协调性较差.随着预见步长的逐渐增加，这一状况在图6和图7中得到了相应的改善.图5~图7 说明具有预见补偿作用的控制器可以在一定程度 1.5 上解决多智能体系统在合作完成任务时协调性较差的问题. 1.0 14 跟随者1 12 跟随者2 一领导者 1.0 跟随者3 层 M.=0 跟随者4 M。=10 ……跟随者5 Mg=30 06 20 406080100120140 0.4 图8第1辆小车在不同预见长时的位置轨迹 Fig.8 Closed-loop outputs of first vehicle for different preview lengths 0.2 20406080100120140 随着预见步长的增加明显减少，结合图8容易得图6在Mg=10时，多智能体系统(24)的局部邻居输出误差到，具有预见补偿作用的控制器能够使闭环系统的 Fig.6 Local neighborhood output errors of multi-agent systems (24) 输出更快地趋于稳态值.表格的第4和5行数据表 for Mg =10 明最优预见控制器有利于减小系统输出响应的最大超调量 14 表1第1辆小车在不同预见步长下的瞬态响应指标跟随者1 1.2 眼随者2 Table 1 Transient response indices of first vehicle for different preview 跟随者3 1.0 lengths 跟随者4 0.8 -…跟随者5 预见步长指标 MR =0 Mg=10 Mg=30 04 上升时间/s 10.2 9.3 8.7 0.2 峰值时间/s 11.1 10.2 9.6 峰值 2.0498 2.0501 2.0389 最大超调量 0.0249 0.0251 0.0195 20 406080100120140 调整时间/s 12.4 11.4 10.6 图7在M。=30时，多智能体系统(24)的局部邻居输出误差附注2需要指出的是上升时间是指系统输出 Fig.7 Local neighborhood output errors of multi-agent systems (24) for Mg =30 响应曲线从零到第一次上升到稳态值所需的时间. 在表1中所得的上升时间值都是利用MATLAB进图8表示在控制器(23)的作用下，第1辆小车行仿真后根据四舍五入原则得到的近似值.实际在不同预见步长下跟踪领导者输出信号的输出上在MR=0时，y1(102)=1.9949;在Mg=10 响应时，y1(93)=2.0019；在MR=30时，y1(87)= 为了进一步说明预见前馈补偿对多智能体系统 1.9946.调整时间定义为输出响应曲线衰减到与实现协调跟踪的有效性.表1给出了图8中第一辆稳态值之差不超过某一个特定百分数带所需要的小车在不同预见步长下跟踪领导者输出的瞬态响应时间，该百分数带一般取±0.02或±0.05，本例指标. 中取0.02.其中在Mg=0时，y1(124)=2.0184: 从表1看出，随着预见步长的适度增加，第一在Mg=10时，y1(114)=2.0197;在Ms=30时，辆小车在跟踪领导者的输出时所需要的上升时间与 y1(106)=2.0195. 峰值时间都明显缩短，这说明利用预见信息设计的附注3本文在固定信息交换拓扑下研究了离最优控制器有加快系统响应速度的作用.表格最后散时间多智能体系统的协调预见跟踪问题.值得一项的数据显示，第一辆小车输出响应的调整时间提的是离散时间多智能体系统在切换拓扑下的协调

卢延荣等: 离散时间多智能体系统的协调最优预见跟踪协调性较差. 随着预见步长的逐渐增加, 这一状况在图 6 和图 7 中得到了相应的改善. 图 5 ~ 图 7 说明具有预见补偿作用的控制器可以在一定程度上解决多智能体系统在合作完成任务时协调性较差的问题. 图 6 在 MR = 10 时, 多智能体系统(24)的局部邻居输出误差 Fig. 6 Local neighborhood output errors of multi鄄agent systems (24) for MR = 10 图 7 在 MR = 30 时, 多智能体系统(24)的局部邻居输出误差 Fig. 7 Local neighborhood output errors of multi鄄agent systems (24) for MR = 30 图 8 表示在控制器(23)的作用下, 第 1 辆小车在不同预见步长下跟踪领导者输出信号的输出响应. 为了进一步说明预见前馈补偿对多智能体系统实现协调跟踪的有效性. 表 1 给出了图 8 中第一辆小车在不同预见步长下跟踪领导者输出的瞬态响应指标. 从表 1 看出, 随着预见步长的适度增加, 第一辆小车在跟踪领导者的输出时所需要的上升时间与峰值时间都明显缩短, 这说明利用预见信息设计的最优控制器有加快系统响应速度的作用. 表格最后一项的数据显示, 第一辆小车输出响应的调整时间图 8 第 1 辆小车在不同预见长时的位置轨迹 Fig. 8 Closed鄄loop outputs of first vehicle for different preview lengths 随着预见步长的增加明显减少, 结合图 8 容易得到, 具有预见补偿作用的控制器能够使闭环系统的输出更快地趋于稳态值. 表格的第 4 和 5 行数据表明最优预见控制器有利于减小系统输出响应的最大超调量. 表 1 第 1 辆小车在不同预见步长下的瞬态响应指标 Table 1 Transient response indices of first vehicle for different preview lengths 指标预见步长 MR = 0 MR = 10 MR = 30 上升时间/ s 10郾 2 9郾 3 8郾 7 峰值时间/ s 11郾 1 10郾 2 9郾 6 峰值 2郾 0498 2郾 0501 2郾 0389 最大超调量 0郾 0249 0郾 0251 0郾 0195 调整时间/ s 12郾 4 11郾 4 10郾 6 附注 2 需要指出的是上升时间是指系统输出响应曲线从零到第一次上升到稳态值所需的时间. 在表 1 中所得的上升时间值都是利用 MATLAB 进行仿真后根据四舍五入原则得到的近似值. 实际上在 MR = 0 时, y1 ( 102 ) = 1郾 9949; 在 MR = 10 时, y1 (93) = 2郾 0019; 在 MR = 30 时, y1 (87 ) = 1郾 9946. 调整时间定义为输出响应曲线衰减到与稳态值之差不超过某一个特定百分数带所需要的时间, 该百分数带一般取依 0郾 02 或依 0郾 05, 本例中取 0郾 02. 其中在 MR = 0 时, y1 (124) = 2郾 0184; 在 MR = 10 时, y1 (114) = 2郾 0197; 在 MR = 30 时, y1 (106) = 2郾 0195. 附注 3 本文在固定信息交换拓扑下研究了离散时间多智能体系统的协调预见跟踪问题. 值得一提的是离散时间多智能体系统在切换拓扑下的协调 ·249·

·250· 工程科学学报，第40卷，第2期预见跟踪问题也是一个有趣且富有挑战性的研究 [11]Yang T,Meng Z,Dimarogonas D V,et al.Global consensus for 课题，尤其是智能体间的信息交换拓扑是随机切 discrete-time multi-agent systems with input saturation con- 换的情形.然而，本文提出的控制器设计方法并 straints.Automatica,2014,50(2):499 [12]Qin J,Gao H,Yu C.On discrete-time convergence for general 不能够直接应用于处理该类问题.未来将对本问 linear multi-agent systems under dynamic topology.IEEE Trans 题进行深入研究.文献[36]在随机切换拓扑下解 Autom Control,2014,59(4):1054 决了线性多智能体系统的一致性问题，其处理离 [13]Xiao F,Wang L.Consensus protocols for discrete-time multi-agent 散时间一致性问题的方法对解决该问题具有一定 systems with time-varying delays.Automatica,2008,44(10): 的参考意义. 2577 [14]Cortes J.Distributed algorithms for reaching consensus on general 5总结 functions.Automatica,2008,44(3):726 [15]Hong Y,Chen G.Bushnell L Distributed observers design for 本文研究了离散时间多智能体系统的协调预 leader-following control of multi-agent networks.Automatica, 见跟踪问题，所考虑的信息交换拓扑为固定有向 2008,44(3):846 图，智能体的动力学方程为具有任意维数的一般 [16]Hu J,Feng G.Distributed tracking control of leader-follower 线性系统.应用最优预见控制理论的相关结果， multi-agent systems under noisy measurement.Automatica, 2011,46(8):1382 得到了包含误差积分和预见前馈补偿的最优控制 [17]Zhu W,Cheng D.Leader-following consensus of second-order a- 器，给出了保证控制器存在的充分条件.不同于 gents with multiple time-varying delays.Automatica,2010,46 单个智能体的的情形，多智能体系统的全局最优 (12):1994 预见控制器受互联拓扑和系统动力学行为的共同 [18]Ni W,Cheng D.Leader-following consensus of multi-agent sys- 影响.最后，理论和仿真结果均证明在所提出的 tems under fixed and switching topologies.Syst Control Lett, 控制器下，所有的智能体可实现跟踪一致性，且 2010.59(34):209 [19]Wang X H.Xu D B,Hong Y G.Consensus control of nonlinear 一致性效果会随着预见步长的适度增加而得到明 leader-follower multi-agent systems with actuating disturbances. 显改善 Syst Control Lett,2014,73:58 [20]Cao YC.Ren W.Distributed coordinated tracking with reduced 参考文献 interaction via a variable structure approach.IEEE Trans Autom [1]Lynch N A.Distributed Algorithms.San Francisco:Morgan Kauf- Control,2012,57(1):33 mann,1996 [21]Hac A.Optimal linear preview control of active vehicle suspen- [2]Olfati-Saber R.Murray R M.Consensus problems in networks of sion.Vehicle Syst Dyn,1992,21(1):167 agents with switching topology and time-delays.IEEE Trans Autom [22]Shimmyo S,Sato T,Ohnishi K.Biped walking pattern genera- Control,.2004.49(9):1520 tion by using preview control based on three-mass model./EEE [3]Ren W,Atkins E.Distributed multi-vehicle coordinated control Trans Ind Electron,2013,60(11):5137 via local information exchange.Int J Robust Nonlinear Control, [23]Katayama T,Ohki T,Inoue T,et al.Design of an optimal con- 2007,17(10-11):1002 troller for a discrete-time system subject to previewable demand. [4]Ren W.On consensus algorithms for double-integrator dynamics. 1 nt J Control.1985,41(3):677 IEEE Trans Autom Control,2008,53(6):1503 [24]Kojima A,Ishijima S.LQ preview synthesis optimal control and [5]Wang J H,Cheng D Z,Hu X M.Consensus of multi-agent linear worst case analysis.IEEE Trans Autom Control,1999,44(2): dynamic systems.Asian Control,2008,10(2):144 352 [6]Seo J H,Shim H,Back J.Consensus of high-order linear systems [25]Liao F C,Takaba K.Katayama T,et al.Design of an optimal using dynamic output feedback compensator:low gain approach. preview servomechanism for discrete-time systems in a multirate Automatica,2009,45(11):2659 setting.Dyn Contin Discrete Impuls Syst Ser B,2003,10(5): [7]Yang X R,Liu G P.Consensus of descriptor multi-agent systems 727 via dynamic compensators.IET Control Theory Appl,2014,8 [26] Moelja AA,Meinsma G.H2-optimal control of systems with (6):389 multiple i/o delays:time domain approach.Automatica,2005, [8]Li Z K,Duan Z S,Chen G R.Dynamic consensus of linear multi- 41(7):1229 agent systems.IET Control Theory Appl,2011,5(1):19 [27]Moelja AA,Meinsma G.H2 control of preview systems.Auto- [9]Li Z K,Duan Z S,Chen G R.On H=and H2 performance re- matica,2006,42(6):945 gions of multi-agent systems.Automatica,2011,47(4):797 [28]Takaba K.Robust servomechanism with preview action for polyto- [10]Chen Y,Lii J H,Lin Z.Consensus of discrete-time multi-agent pic uncertain systems.Int J Robust Nonlinear Control,2000,10 systems with transmission nonlinearity.Automatica,2013,49 (2):101 (6):1768 [29]Li L,Liao F.C Parameter-dependent preview control with robust

工程科学学报,第 40 卷,第 2 期预见跟踪问题也是一个有趣且富有挑战性的研究课题, 尤其是智能体间的信息交换拓扑是随机切换的情形. 然而, 本文提出的控制器设计方法并不能够直接应用于处理该类问题. 未来将对本问题进行深入研究. 文献[36] 在随机切换拓扑下解决了线性多智能体系统的一致性问题, 其处理离散时间一致性问题的方法对解决该问题具有一定的参考意义. 5 总结本文研究了离散时间多智能体系统的协调预见跟踪问题, 所考虑的信息交换拓扑为固定有向图, 智能体的动力学方程为具有任意维数的一般线性系统. 应用最优预见控制理论的相关结果, 得到了包含误差积分和预见前馈补偿的最优控制器, 给出了保证控制器存在的充分条件. 不同于单个智能体的的情形, 多智能体系统的全局最优预见控制器受互联拓扑和系统动力学行为的共同影响. 最后, 理论和仿真结果均证明在所提出的控制器下, 所有的智能体可实现跟踪一致性, 且一致性效果会随着预见步长的适度增加而得到明显改善. 参考文献 [1] Lynch N A. Distributed Algorithms. San Francisco: Morgan Kauf鄄 mann, 1996 [2] Olfati鄄Saber R, Murray R M. Consensus problems in networks of agents with switching topology and time鄄delays. IEEE Trans Autom Control, 2004, 49(9): 1520 [3] Ren W, Atkins E. Distributed multi鄄vehicle coordinated control via local information exchange. Int J Robust Nonlinear Control, 2007, 17(10鄄11): 1002 [4] Ren W. On consensus algorithms for double鄄integrator dynamics. IEEE Trans Autom Control, 2008, 53(6): 1503 [5] Wang J H, Cheng D Z, Hu X M. Consensus of multi鄄agent linear dynamic systems. Asian J Control, 2008, 10(2): 144 [6] Seo J H, Shim H, Back J. Consensus of high鄄order linear systems using dynamic output feedback compensator: low gain approach. Automatica, 2009, 45(11): 2659 [7] Yang X R, Liu G P. Consensus of descriptor multi鄄agent systems via dynamic compensators. IET Control Theory Appl, 2014, 8 (6): 389 [8] Li Z K, Duan Z S, Chen G R. Dynamic consensus of linear multi鄄 agent systems. IET Control Theory Appl, 2011, 5(1): 19 [9] Li Z K, Duan Z S, Chen G R. On H肄 and H2 performance re鄄 gions of multi鄄agent systems. Automatica, 2011, 47(4): 797 [10] Chen Y, L俟 J H, Lin Z. Consensus of discrete鄄time multi鄄agent systems with transmission nonlinearity. Automatica, 2013, 49 (6): 1768 [11] Yang T, Meng Z, Dimarogonas D V, et al. Global consensus for discrete鄄time multi鄄agent systems with input saturation con鄄 straints. Automatica, 2014, 50(2): 499 [12] Qin J, Gao H, Yu C. On discrete鄄time convergence for general linear multi鄄agent systems under dynamic topology. IEEE Trans Autom Control, 2014, 59(4): 1054 [13] Xiao F, Wang L. Consensus protocols for discrete鄄time multi鄄agent systems with time鄄varying delays. Automatica, 2008, 44 (10): 2577 [14] Cort佴s J. Distributed algorithms for reaching consensus on general functions. Automatica, 2008, 44(3): 726 [15] Hong Y, Chen G, Bushnell L. Distributed observers design for leader鄄following control of multi鄄agent networks. Automatica, 2008, 44(3): 846 [16] Hu J, Feng G. Distributed tracking control of leader鄄follower multi鄄agent systems under noisy measurement. Automatica, 2011, 46(8): 1382 [17] Zhu W, Cheng D. Leader鄄following consensus of second鄄order a鄄 gents with multiple time鄄varying delays. Automatica, 2010, 46 (12): 1994 [18] Ni W, Cheng D. Leader鄄following consensus of multi鄄agent sys鄄 tems under fixed and switching topologies. Syst Control Lett, 2010, 59(3鄄4): 209 [19] Wang X H, Xu D B, Hong Y G. Consensus control of nonlinear leader鄄follower multi鄄agent systems with actuating disturbances. Syst Control Lett, 2014, 73: 58 [20] Cao Y C, Ren W. Distributed coordinated tracking with reduced interaction via a variable structure approach. IEEE Trans Autom Control, 2012, 57(1): 33 [21] Hac' A. Optimal linear preview control of active vehicle suspen鄄 sion. Vehicle Syst Dyn, 1992, 21(1): 167 [22] Shimmyo S, Sato T, Ohnishi K. Biped walking pattern genera鄄 tion by using preview control based on three鄄mass model. IEEE Trans Ind Electron, 2013, 60(11): 5137 [23] Katayama T, Ohki T, Inoue T, et al. Design of an optimal con鄄 troller for a discrete鄄time system subject to previewable demand. Int J Control, 1985, 41(3): 677 [24] Kojima A, Ishijima S. LQ preview synthesis optimal control and worst case analysis. IEEE Trans Autom Control, 1999, 44(2): 352 [25] Liao F C, Takaba K, Katayama T, et al. Design of an optimal preview servomechanism for discrete鄄time systems in a multirate setting. Dyn Contin Discrete Impuls Syst Ser B, 2003, 10 (5): 727 [26] Moelja A A, Meinsma G. H2 鄄optimal control of systems with multiple i / o delays: time domain approach. Automatica, 2005, 41(7): 1229 [27] Moelja A A, Meinsma G. H2 control of preview systems. Auto鄄 matica, 2006, 42(6): 945 [28] Takaba K. Robust servomechanism with preview action for polyto鄄 pic uncertain systems. Int J Robust Nonlinear Control, 2000, 10 (2): 101 [29] Li L, Liao F. C Parameter鄄dependent preview control with robust ·250·

点击下载完整版文档（PDF格式）

共11页，试读结束，阅读完整版请下载

点击下载（PDF格式）

浏览记录

离散时间多智能体系统的协调最优预见跟踪