工程科学学报,第41卷,第9期:1215-1221,2019年9月 Chinese Joural of Engineering,Vol.41,No.9:1215-1221,September 2019 D0L:10.13374/j.issn2095-9389.2019.09.014:htp:/journals.ustb.edu.cm 确定性多变量自校正控制的稳定性、收敛性和鲁棒性 赵 标),张维存2)区,楚天广3) 1)北京科技大学工程技术研究院,北京1000832)北京科技大学自动化学院,北京1000833)北京大学工学院,北京100871 ☒通信作者,E-mail:weicunzhang(@263.nct 摘要本文用基于传递函数概念的虚拟等价系统方法统一分析各种类型的多变量确定性自校正控制系统的稳定性、收敛 性和鲁棒性,分别针对参数估计收敛到真值、参数估计收敛到非真值以及参数估计不收敛的3种情况给出若干定理、推论和注 释.在各个判据的基础上,进一步深化对确定性多变量自校正控制系统的理解.所得结论说明:参数估计的收敛性不是确定 性多变量自校正控制系统稳定和收敛的必要条件:系统自身的反馈信息对确定性多变量自校正控制是充分的,即外加激励信 号不是必要的 关键词虚拟等价系统:多变量自校正控制:通用判据:稳定性:收敛性:鲁棒性 分类号TP273 Stability,convergence,and robustness of deterministic multivariable self-tuning control ZHAO Li,ZHANG Wei-cun,CHU Tian-guang 1)Institute of Engineering Technology,University of Science and Technology Beijing,Beijing 100083,China 2)School of Automation and Electrical Engineering,University of Science and Technology Beijing,Beijing 100083,China 3)College of Engineering,Peking University,Beijing 100871,China Corresponding author,E-mail:weicunzhang@263.net ABSTRACT Self-tuning control is an important approach to intelligent control system design because this kind of control system uses online parameter estimation (or learning)to derive the model of the plant,and as a result of model parameter estimation (or learn- ing),the controller parameters can be adjusted online.However,we still lack a unified analysis tool (which is independent of specific controller design strategy and parameter estimation algorithm)that can be used by engineers to easily understand and judge the stabili- ty,convergence,and robustness of this kind of self-tuning control system.This study is focused on a unified analysis of deterministic multivariable self-tuning control systems with the help of the virtual equivalent system(VES)approach based on the transfer function concept.For different parameter estimation situations (three cases are considered,i.e.,parameter estimation converges to its true val- ue,parameter estimation converges to other values,and parameter estimation does not converge),four theorems and two corollaries on the stability.convergence,and robustness of deterministic multivariable self-tuning control systems are given with some remarks.These results are independent of specific controller design strategy and parameter estimation algorithm.From the results obtained in this stud- y,it is concluded that the convergence of parameter estimates is unnecessary for the stability and convergence of a self-tuning control system.The feedback information of the self-tuning control system itself is sufficient to achieve the control objective,i.e.,the external excitation signal is unnecessary for the deterministic multivariable self-tuning control system.Moreover,on the basis of the results of the stability,convergence,and robustness of deterministic multivariable self-tuning control systems,we have obtained a profound un- derstanding of the self-tuning control system design method.This understanding will provide more flexibility for engineers in real appli- cations of this kind of controller design strategy. KEY WORDS virtual equivalent system (VES);deterministic multivariable self-tuning control;general criterion;stability;conver- 收稿日期:2019-01-03 基金项目:国家自然科学基金资助项目(61520106010,61741302)
工程科学学报,第 41 卷,第 9 期:1215鄄鄄1221,2019 年 9 月 Chinese Journal of Engineering, Vol. 41, No. 9: 1215鄄鄄1221, September 2019 DOI: 10. 13374 / j. issn2095鄄鄄9389. 2019. 09. 014; http: / / journals. ustb. edu. cn 确定性多变量自校正控制的稳定性、收敛性和鲁棒性 赵 栎1) , 张维存2) 苣 , 楚天广3) 1) 北京科技大学工程技术研究院, 北京 100083 2) 北京科技大学自动化学院, 北京 100083 3) 北京大学工学院, 北京 100871 苣通信作者, E鄄mail: weicunzhang@ 263. net 摘 要 本文用基于传递函数概念的虚拟等价系统方法统一分析各种类型的多变量确定性自校正控制系统的稳定性、收敛 性和鲁棒性,分别针对参数估计收敛到真值、参数估计收敛到非真值以及参数估计不收敛的 3 种情况给出若干定理、推论和注 释. 在各个判据的基础上,进一步深化对确定性多变量自校正控制系统的理解. 所得结论说明:参数估计的收敛性不是确定 性多变量自校正控制系统稳定和收敛的必要条件;系统自身的反馈信息对确定性多变量自校正控制是充分的,即外加激励信 号不是必要的. 关键词 虚拟等价系统; 多变量自校正控制; 通用判据; 稳定性; 收敛性; 鲁棒性 分类号 TP273 收稿日期: 2019鄄鄄01鄄鄄03 基金项目: 国家自然科学基金资助项目(61520106010, 61741302) Stability, convergence, and robustness of deterministic multivariable self鄄tuning control ZHAO Li 1) , ZHANG Wei鄄cun 2) 苣 , CHU Tian鄄guang 3) 1) Institute of Engineering Technology, University of Science and Technology Beijing, Beijing 100083, China 2) School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing 100083, China 3) College of Engineering, Peking University, Beijing 100871, China 苣Corresponding author, E鄄mail: weicunzhang@ 263. net ABSTRACT Self鄄tuning control is an important approach to intelligent control system design because this kind of control system uses online parameter estimation (or learning) to derive the model of the plant, and as a result of model parameter estimation ( or learn鄄 ing), the controller parameters can be adjusted online. However, we still lack a unified analysis tool (which is independent of specific controller design strategy and parameter estimation algorithm) that can be used by engineers to easily understand and judge the stabili鄄 ty, convergence, and robustness of this kind of self鄄tuning control system. This study is focused on a unified analysis of deterministic multivariable self鄄tuning control systems with the help of the virtual equivalent system (VES) approach based on the transfer function concept. For different parameter estimation situations (three cases are considered, i. e. , parameter estimation converges to its true val鄄 ue, parameter estimation converges to other values, and parameter estimation does not converge), four theorems and two corollaries on the stability, convergence, and robustness of deterministic multivariable self鄄tuning control systems are given with some remarks. These results are independent of specific controller design strategy and parameter estimation algorithm. From the results obtained in this stud鄄 y, it is concluded that the convergence of parameter estimates is unnecessary for the stability and convergence of a self鄄tuning control system. The feedback information of the self鄄tuning control system itself is sufficient to achieve the control objective, i. e. , the external excitation signal is unnecessary for the deterministic multivariable self鄄tuning control system. Moreover, on the basis of the results of the stability, convergence, and robustness of deterministic multivariable self鄄tuning control systems, we have obtained a profound un鄄 derstanding of the self鄄tuning control system design method. This understanding will provide more flexibility for engineers in real appli鄄 cations of this kind of controller design strategy. KEY WORDS virtual equivalent system (VES); deterministic multivariable self鄄tuning control; general criterion; stability; conver鄄
·1216· 工程科学学报,第41卷,第9期 gence;robustness 自适应控制的研究曾经引起众多学者的广泛关 值、参数估计收敛到非真值、参数估计不收敛.这些 注,取得了众多的研究成果.但我们对自适应控制 判据在一定程度上可以为控制工程实践提供“事 系统的认识仍然有待深入探索,焦点问题是其稳定 前”的指导:考虑到针对最小相位系统的一步超前 性、收敛性和鲁棒性,更具体地说,是如何使其稳定 自校正控制的特殊性,专门给出了一个更加简单的 性、收敛性和鲁棒性条件更加易于工程实际中进行 判据,并给出了直观的解释. 应用和判定 1确定性自校正控制的虚拟等价系统 早期的研究阶段,人们对自适应控制寄予厚望, 认为这种控制方法能够以变应变,但是在无人机自 首先考虑被控对象为结构信息已知而参数未知 动驾驶仪上的实验失败,使人们的研究热情有所下 的多输入-多输出线性系统P,9为一步延迟算子, 降:再后来有了Rohr's反例,更使得人们对自适应 A(q1)、B(g1)为q的多项式 控制方法产生了诸多怀疑. A(q)y(k)=q-B(g)u(k) (1) 实际上,过分的乐观和悲观都是不可取的,首先 式中,y(k)和u(k)分别是被控对象P的适当维数 自适应控制方法不是万能的,不能指望它可以“无 的输出信号和输入信号,并假定 限”地自适应,而应该是在一定条件下和一定范围 y(k)=0,u(k)=0,k<0 (2) 内的自适应,即,估计参数在一个“有限”域内自适 (A(g1)=1+A191+…+A.9,n≥1 应(细节见后面的定理和注释):过分怀疑自适应控 (3) B(g-1)=B。+B91+…+Bm9m,m≥1 制方法的能力也是不可取的,比如Ror's反例所讨 式(1)可以进一步写成回归形式 论的情形,在此反例中,原本是三阶的被控对象只进 y(k)=(k-d)0 (4) 行了一阶建模,过于简化,实际上,若对此三阶被控 其中, 对象进行二阶建模,则Rohr's反例就不是反 例了 0=[-A1,…-An,Bo,…Bm] (5) 自适应控制方案可以由各种参数估计算法和各 b(k-d)=[y(k-1),…y(k-n),…, 种控制策略任意组合,种类繁多,而且还会不断有新 u(k-d),…u(k-d-m)] (6) 的方案出现,比如各种各样的多模型自适应控制方 显然,为了实现自校正控制,需要对未知参数0进行 案[)】,很难逐一分析各种自适应控制方案的稳定性 估计,估计值记为(不限定具体的参数估计算法) 和收敛性.因此,人们一直期待着能找到一般性(或 0(k)=[-A1,…,-An,B0,…,Bn](7) 统一)的稳定性、收敛性分析方法,从而得出具有普 估计模型简记为P(k),参数估计的整体效果 遍性的结论[3),文献[5]是这方面的一种尝试,提 可以用模型输出误差来表示,即 出了用虚拟等价系统来统一理解和判断自校正控制 e(k)=y(k)-(k-d)0(k)= 系统的稳定性和收敛性 (k-d)0-中(k-d)0(k) (8) 文献[6]基于关键性技术引理建立了一些基于 自校正控制器记为C(k),也可以作为一个矩阵 简单控制策略(如一步超前控制策略)的确定性自 0.(k)看待,是0(k)的函数,可以通过各种设计方法 校正控制系统的稳定性和收敛性结果,其特点是,仅 得到,如极点配置等.控制律可以记为 适用于最小相位系统但不要求参数估计收敛:文献 u(k)=中.(k)0.(k) (9) [7-11]中证明了一些基于极点配置策略的自校正 (k)=[y(k),y(k-1),…,y(k-1),…, 控制系统的稳定性和收敛性,其特点是适用于非最 u(k-1),…] (10) 小相位系统但要求参数估计收敛.这些结果都是针 y(k)为已知有界参考输入,它是控制系统的跟踪目 对特定的控制律和特定的参数估计算法,也就是说 标.中(k)中元素个数由具体的控制器设计方法 这些结论都是在给定参数估计算法和控制器设计方 确定 法以及某些受控对象假设条件下的“事后”判别 以上给出了一个确定性多变量自校正控制系统 本文在文献[5]的基础上,进一步放宽对系统 的描述,其方框图如图1所示,其中,控制器设计策 结构信息的依赖,并将研究范围扩大到多变量系统. 略和参数估计算法可以任意选择,各自细节部分省 将考虑参数估计的三种情况,即:参数估计收敛到真 略,将图1所示系统简记为(C(k),P)
工程科学学报,第 41 卷,第 9 期 gence; robustness 自适应控制的研究曾经引起众多学者的广泛关 注,取得了众多的研究成果. 但我们对自适应控制 系统的认识仍然有待深入探索,焦点问题是其稳定 性、收敛性和鲁棒性,更具体地说,是如何使其稳定 性、收敛性和鲁棒性条件更加易于工程实际中进行 应用和判定. 早期的研究阶段,人们对自适应控制寄予厚望, 认为这种控制方法能够以变应变,但是在无人机自 动驾驶仪上的实验失败,使人们的研究热情有所下 降;再后来有了 Rohr爷 s 反例,更使得人们对自适应 控制方法产生了诸多怀疑. 实际上,过分的乐观和悲观都是不可取的,首先 自适应控制方法不是万能的,不能指望它可以“无 限冶地自适应,而应该是在一定条件下和一定范围 内的自适应,即,估计参数在一个“有限冶 域内自适 应(细节见后面的定理和注释);过分怀疑自适应控 制方法的能力也是不可取的,比如 Rohr爷s 反例所讨 论的情形,在此反例中,原本是三阶的被控对象只进 行了一阶建模,过于简化,实际上,若对此三阶被控 对象 进 行 二 阶 建 模, 则 Rohr 爷 s 反 例 就 不 是 反 例了[1] . 自适应控制方案可以由各种参数估计算法和各 种控制策略任意组合,种类繁多,而且还会不断有新 的方案出现,比如各种各样的多模型自适应控制方 案[2] ,很难逐一分析各种自适应控制方案的稳定性 和收敛性. 因此,人们一直期待着能找到一般性(或 统一)的稳定性、收敛性分析方法,从而得出具有普 遍性的结论[3鄄鄄4] ,文献[5]是这方面的一种尝试,提 出了用虚拟等价系统来统一理解和判断自校正控制 系统的稳定性和收敛性. 文献[6]基于关键性技术引理建立了一些基于 简单控制策略(如一步超前控制策略)的确定性自 校正控制系统的稳定性和收敛性结果,其特点是,仅 适用于最小相位系统但不要求参数估计收敛;文献 [7鄄鄄11]中证明了一些基于极点配置策略的自校正 控制系统的稳定性和收敛性,其特点是适用于非最 小相位系统但要求参数估计收敛. 这些结果都是针 对特定的控制律和特定的参数估计算法,也就是说 这些结论都是在给定参数估计算法和控制器设计方 法以及某些受控对象假设条件下的“事后冶判别. 本文在文献[5] 的基础上,进一步放宽对系统 结构信息的依赖,并将研究范围扩大到多变量系统. 将考虑参数估计的三种情况,即:参数估计收敛到真 值、参数估计收敛到非真值、参数估计不收敛. 这些 判据在一定程度上可以为控制工程实践提供“事 前冶的指导;考虑到针对最小相位系统的一步超前 自校正控制的特殊性,专门给出了一个更加简单的 判据,并给出了直观的解释. 1 确定性自校正控制的虚拟等价系统 首先考虑被控对象为结构信息已知而参数未知 的多输入鄄鄄多输出线性系统 P,q - 1为一步延迟算子, A(q - 1 )、B(q - 1 )为 q - 1的多项式. A(q - 1 )y(k) = q - dB(q - 1 )u(k) (1) 式中,y(k)和 u( k)分别是被控对象 P 的适当维数 的输出信号和输入信号,并假定 y(k) = 0,u(k) = 0,坌k < 0 (2) A(q - 1 ) = I + A1 q - 1 + … + An q - n ,n逸1 B(q - 1 ) = B0 + B1 q - 1 + … + Bm q - m ,m逸 { 1 (3) 式(1)可以进一步写成回归形式 y(k) = 准 T (k - d)兹 (4) 其中, 兹 T = [ - A1 ,… - An ,B0 ,…Bm ] (5) 准 T (k - d) = [y(k - 1),…y(k - n),…, u(k - d),…u(k - d - m)] (6) 显然,为了实现自校正控制,需要对未知参数 兹 进行 估计,估计值记为(不限定具体的参数估计算法) ^ 兹 T (k) = [ - ^A1 ,…, - ^An , ^B0 ,…, ^Bm ] (7) 估计模型简记为 Pm ( k),参数估计的整体效果 可以用模型输出误差来表示,即 e(k) = y(k) - 准 T (k - d) ^ 兹(k) = 准 T (k - d)兹 - 准 T (k - d) ^ 兹(k) (8) 自校正控制器记为 C ( k),也可以作为一个矩阵 兹c(k)看待,是 ^ 兹(k)的函数,可以通过各种设计方法 得到,如极点配置等. 控制律可以记为 u(k) = 准 T c (k)兹c(k) (9) 准 T c (k) = [yr(k),yr(k - 1),…,y(k - 1),…, u(k - 1),…] (10) yr(k)为已知有界参考输入,它是控制系统的跟踪目 标. 准 T c ( k) 中元素个数由具体的控制器设计方法 确定. 以上给出了一个确定性多变量自校正控制系统 的描述,其方框图如图 1 所示,其中,控制器设计策 略和参数估计算法可以任意选择,各自细节部分省 略,将图 1 所示系统简记为(C(k),P). ·1216·
赵栎等:确定性多变量自校正控制的稳定性、收敛性和鲁棒性 ·1217· y u( y y@ 图1确定性自校正控制系统 图3自校正控制系统对应的定常系统 Fig.1 Deterministic self-tuning control system Fig.3 Non-adaptive control system for deterministic self-tuning con- trol system 为图1系统构造一个输入输出意义上的等价系 统,它由“假想”的定常控制器C,被控对象P和一 系统输出量显然会收敛到相应的非自适应控制系统 个补偿信号△(k)构成,如图2所示.那么,如何构 的对应量,但是,从动态过程来看,二者相差多少,仍 造C和△u(k)呢?假想被控对象0已知,按照 然值得探究 P(k)到C(k)的映射关系,在一定条件下(如可控 考虑基于任意控制策略和任意参数估计算法的 性条件)必定存在一个对应于P的定常控制器,记 自校正控制系统,有如下结果. 为C,其矩阵形式为0,显然它是0的函数,相应的 定理1:针对被控对象结构信息已知的确定性 控制律记为 自校正控制系统,若 u(k)=中(k)0 (11) 1)参数估计收敛到真值: 则△u(k)可以如式(12)构造 2)控制策略对参数已知对象满足稳定要求,即 △u(k)=u(k)-u(k)=中(k)0.(k)-中(k)0. (P,C)构成的闭环系统稳定; (12) 3)对象参数估计值到控制器参数的映射在 但是,由于参数0未知,故0。或C以及△u(k)未知, 0(k)=0处连续. 因而这个等价系统是一个假想的系统,简记为(C, 则自校正控制系统是稳定的和收敛的 P,△u(k)),把这个等价系统称为自校正控制系统 证明:由条件1)有0(k)→0,由条件3)知道, 的“虚拟等价系统”.△(k)实际上是模型和受控对 0.(k)是0(k)的连续函数,故0.(k)→0。 象在输出效果上的差异e(k)在控制域的一个映射, 由△u(k)的定义即式(12)知道 它受模型参数到控制器参数之间的映射规律的影 I△u(k)‖=o(I中.(k)I)(13) 响.虽然不能精确地计算△u(k),但可以通过e(k) 不失一般性,考虑控制器的阶数低于被控对象的阶 对它加以估计,通过后面的分析可以看到,当参数估 数,由式(10),即中(k)的组成,可以看出(注意: 计满足一定条件时,补偿信号△u(k)有很好的性 y(k)为有界参考输入) 质,便于我们判断系统的稳定性和收敛性甚至鲁 ‖中.(k)‖=0(B+I(k-d)I)(14) 棒性 式中,B为有界常数,符号o和0的定义如下]: △u 设f(x),g(x)为任意函数,且g(x)恒取正值, 若当x→a(这里a可以是0、或其他确定数值) 时,有f(x)/g(x)→0,则记作f(x)=o(g(x));若 图2确定性自校正控制的虚拟等价系统 f(x)1/g(x)≤A,则记作f(x)=O(g(x),A为常 Fig.2 VES of deterministic self-tuning control system 数.故有 I△u(k)‖=o(B+I中(k-d))(15) 如果将虚拟等价系统中的△u(k)去掉,则得到 下面将图2所示线性定常结构的虚拟等价系统 图3所示的线性定常系统.它正好是定义自校正控 分解为图3和图4两个初始条件为零的子系统 制系统收敛性的参照系统,自校正控制系统的稳定 △u( 性是指输入、输出的范数有界,而收敛性是指y(k) y1(k),u(k)→u1(k),即收敛于图3所示的“理 u() 想”系统的输入和输出. 图4参数收敛到真值时的分解子系统2 2结论及证明 Fig.4 Decomposed subsystem 2 of Fig.2 2.1参数估计收敛到真值 根据线性系统的迭加原理有 这是直观上最容易理解的一类情况,一个自校 y(k)=y1(k)+y2(k) (16) 正控制系统,当参数估计收敛到真值时,其控制量和 u(k)=u(k)+u2(k) (17)
赵 栎等: 确定性多变量自校正控制的稳定性、收敛性和鲁棒性 图 1 确定性自校正控制系统 Fig. 1 Deterministic self鄄tuning control system 为图 1 系统构造一个输入输出意义上的等价系 统,它由“假想冶的定常控制器 C,被控对象 P 和一 个补偿信号 驻u(k)构成,如图 2 所示. 那么,如何构 造 C 和 驻u ( k) 呢? 假想被控对象 兹 已知, 按照 Pm (k)到 C(k)的映射关系,在一定条件下(如可控 性条件)必定存在一个对应于 P 的定常控制器,记 为 C,其矩阵形式为 兹c,显然它是 兹 的函数,相应的 控制律记为 u0 (k) = 准 T c (k)兹c (11) 则 驻u(k)可以如式(12)构造 驻u(k) = u(k) - u0 (k) = 准 T c (k)兹c(k) - 准 T c (k)兹c (12) 但是,由于参数 兹 未知,故 兹c 或 C 以及 驻u(k)未知, 因而这个等价系统是一个假想的系统,简记为(C, P,驻u(k)),把这个等价系统称为自校正控制系统 的“虚拟等价系统冶. 驻u(k)实际上是模型和受控对 象在输出效果上的差异 e(k)在控制域的一个映射, 它受模型参数到控制器参数之间的映射规律的影 响. 虽然不能精确地计算 驻u(k),但可以通过 e(k) 对它加以估计,通过后面的分析可以看到,当参数估 计满足一定条件时,补偿信号 驻u( k) 有很好的性 质,便于我们判断系统的稳定性和收敛性甚至鲁 棒性. 图 2 确定性自校正控制的虚拟等价系统 Fig. 2 VES of deterministic self鄄tuning control system 如果将虚拟等价系统中的 驻u(k)去掉,则得到 图 3 所示的线性定常系统. 它正好是定义自校正控 制系统收敛性的参照系统,自校正控制系统的稳定 性是指输入、输出的范数有界,而收敛性是指 y( k) 寅y1 ( k),u( k) 寅u1 ( k),即收敛于图 3 所示的“理 想冶系统的输入和输出. 2 结论及证明 2郾 1 参数估计收敛到真值 这是直观上最容易理解的一类情况,一个自校 正控制系统,当参数估计收敛到真值时,其控制量和 图 3 自校正控制系统对应的定常系统 Fig. 3 Non鄄adaptive control system for deterministic self鄄tuning con鄄 trol system 系统输出量显然会收敛到相应的非自适应控制系统 的对应量,但是,从动态过程来看,二者相差多少,仍 然值得探究. 考虑基于任意控制策略和任意参数估计算法的 自校正控制系统,有如下结果. 定理 1:针对被控对象结构信息已知的确定性 自校正控制系统,若 1)参数估计收敛到真值; 2)控制策略对参数已知对象满足稳定要求,即 (P,C)构成的闭环系统稳定; 3)对象参数估计值到控制器参数的映射在 ^ 兹(k) = 兹 处连续. 则自校正控制系统是稳定的和收敛的. 证明: 由条件 1)有 ^ 兹(k)寅兹,由条件 3)知道, 兹c(k)是 ^ 兹(k)的连续函数,故 兹c(k)寅兹c 由 驻u(k)的定义即式(12)知道 椰驻u(k)椰 = o(椰准c(k)椰) (13) 不失一般性,考虑控制器的阶数低于被控对象的阶 数,由式(10),即 准c ( k) 的组成,可以看出(注意: yr(k)为有界参考输入) 椰准c(k)椰 = O(茁 + 椰准(k - d)椰) (14) 式中,茁 为有界常数,符号 o 和 O 的定义如下[12] : 设 f(x),g( x)为任意函数,且 g( x)恒取正值, 若当 x寅a(这里 a 可以是 0、肄 或其他确定数值) 时,有 f(x) / g( x) 寅0,则记作 f( x) = o( g( x));若 | f(x) | / g(x)臆A,则记作 f( x) = O( g( x)),A 为常 数. 故有 椰驻u(k)椰 = o(茁 + 椰准(k - d)椰) (15) 下面将图 2 所示线性定常结构的虚拟等价系统 分解为图 3 和图 4 两个初始条件为零的子系统. 图 4 参数收敛到真值时的分解子系统 2 Fig. 4 Decomposed subsystem 2 of Fig. 2 根据线性系统的迭加原理有 y(k) = y1 (k) + y2 (k) (16) u(k) = u1 (k) + u2 (k) (17) ·1217·
.1218. 工程科学学报,第41卷,第9期 考察图3所示系统,由条件2)知以图3所示系 1)参数估计收敛到0。,估计模型P(k)一致可 统输入输出信号有界,即 控,且 u(k)=0(1) (18) le(k)I=Iy(k)-中(k-d)0(k)‖= Iy1(k)I=0(1) (19) o(a+‖(k-d)‖), 对图4所示系统,由于闭环系统稳定以及式 其中α为非零常数: (15),故有 2)控制策略对参数已知对象满足稳定要求: lly2(k)ll=o(B+I(k-d)) (20) 3)对象参数估计值到控制器参数的映射在0 Iu,(k)‖=o(B+‖(k-d)I) (21) (k)=0。处连续 至此,有 则自校正控制系统是稳定的和收敛的 y(k)=y,(k)+y2(k)=y1(k)+o(B+‖(k-d)I) 证明:为了证明定理2,需要构建如图5所示的 (22) 虚拟等价系统 u(k)=u(k)+2(k)=u(k)+o(B+‖(k-d)‖) △u e + ++ (23) ⑧ u(k) u ly()y (k)+y2()= lly(k)+0(B+(k-d))(24) 图5参数估计收敛到非真值时的虚拟等价系统 Iu(k)‖≤Iu(k)Ⅱ+Iu2(k)‖= Fig.5 VES II for self-tuning control system Iu(k)‖+o(B+I中(k-d)I)(25) 图中,P。代表参数估计的收敛值所对应的 用反证法可以证明序列‖中(k-d)‖必有界, 模型,C。(对应参数记为0。)则代表与P。对应的控 细节省略.这样由式(20)和(21),得到 制器.显然图5所示的虚拟等价系统与图2所示的 I‖42(k)‖=o(1),ly2(k)‖=o(1) 虚拟等价系统在组成上是不同的,首先是C。、P。分 进一步考虑到式(16)和(17),有 别与C、P不同,其次是e'(k)、△u'(k)的定义分别 y(k)→y,(k)u(k)→u(k) 与式(8)和(12)不同,图5中 定理1证毕. e'(k)=y(k)-中(k-d)8=y(k)- 注释1:从现有的参数估计研究结果看,若要求 中(k-d)0(k)+b(k-d)0(k)-中(k-d)0。 参数估计收敛到真值,需要在控制信号(k)上叠加 即 持续激励信号[)或衰减激励信号).当然这并不 e'(k)=e(k)+中(k-d)0(k)-T(k-d)0。 是必须的,后面的分析结果说明,要达到自校正控制 (26) 系统稳定和收敛的目标,并不需要保证估计参数收 敛到真值,甚至可以在参数估计不收敛的情况下,照 △u'(k)=u(k)-uo(k)=中(k)0.(k)-中(k)0o 样达到自校正控制系统的目的. (27) 注释2:定理1之条件3)的要求并不苛刻,以最 由条件1)知 常见的极点配置控制策略为例,模型参数到控制器 Ie'(k)‖=o(a+‖(k-d)I)(28) 参数的映射,等价于求解Diophantine方程,进一步 由条件3)知 等价于Sylvester矩阵求逆[s],只要式(1)所描述的 I△'(k)I=o(B+I中(k-d)‖)(29) 被控对象可控(对单变量系统等价于A(q1)和 将图5所示系统分解为3个子系统,分别见图 B(g)没有公因子,而对于多变量系统则等价于其 6~8.则由条件2)知道图6所示子系统稳定 传递函数矩阵没有零极点对消),则Sylvester矩阵 以下仿照定理1的证明过程,可以得到结论 可逆,又矩阵求逆在其有解之处是连续的[16],因此 (细节省略) 定理条件3)仅相当于要求被控对象可控 ,份 2.2参数估计收敛到非真值 考虑被控对象结构信息未知的情况,实际上,这 图6参数收敛到非真值时的分解系统1 样考虑的意义在于,估计模型的阶次可以低于真实 Fig.6 Decomposed subsystem 1 of VES II 被控对象的阶次 定理2:针对被控对象结构信息未知的多变量 注释3:由注释2知道,对于一般的控制策略一 确定性自校正控制系统,若 极点配置控制策略而言,定理2之条件3)相当于要
工程科学学报,第 41 卷,第 9 期 考察图 3 所示系统,由条件 2)知以图 3 所示系 统输入输出信号有界,即 椰u1 (k)椰 = O(1) (18) 椰y1 (k)椰 = O(1) (19) 对图 4 所示系统,由于闭环系统稳定以及式 (15),故有 椰y2 (k)椰 = o(茁 + 椰准(k - d)椰) (20) 椰u2 (k)椰 = o(茁 + 椰准(k - d)椰) (21) 至此,有 y(k) = y1 (k) + y2 (k) = y1 (k) + o(茁 +椰准(k - d)椰) (22) u(k) = u1 (k) + u2 (k) = u1 (k) + o(茁 +椰准(k - d)椰) (23) 椰y(k)椰臆椰y1 (k)椰 + 椰y2 (k)椰 = 椰y1 (k)椰 + o(茁 + 椰准(k - d)椰) (24) 椰u(k)椰臆椰u1 (k)椰 + 椰u2 (k)椰 = 椰u1 (k)椰 + o(茁 + 椰准(k - d)椰) (25) 用反证法可以证明序列椰准( k - d)椰必有界, 细节省略. 这样由式(20)和(21),得到 椰u2 (k)椰 = o(1),椰y2 (k)椰 = o(1) 进一步考虑到式(16)和(17),有 y(k)寅y1 (k) u(k)寅u1 (k) 定理 1 证毕. 注释 1:从现有的参数估计研究结果看,若要求 参数估计收敛到真值,需要在控制信号 u(k)上叠加 持续激励信号[13] 或衰减激励信号[14] . 当然这并不 是必须的,后面的分析结果说明,要达到自校正控制 系统稳定和收敛的目标,并不需要保证估计参数收 敛到真值,甚至可以在参数估计不收敛的情况下,照 样达到自校正控制系统的目的. 注释 2:定理 1 之条件 3)的要求并不苛刻,以最 常见的极点配置控制策略为例,模型参数到控制器 参数的映射,等价于求解 Diophantine 方程,进一步 等价于 Sylvester 矩阵求逆[15] ,只要式(1)所描述的 被控对象可控( 对单变量系统等价于 A( q - 1 ) 和 B(q - 1 )没有公因子,而对于多变量系统则等价于其 传递函数矩阵没有零极点对消),则 Sylvester 矩阵 可逆,又矩阵求逆在其有解之处是连续的[16] ,因此 定理条件 3)仅相当于要求被控对象可控. 2郾 2 参数估计收敛到非真值 考虑被控对象结构信息未知的情况,实际上,这 样考虑的意义在于,估计模型的阶次可以低于真实 被控对象的阶次. 定理 2:针对被控对象结构信息未知的多变量 确定性自校正控制系统,若 1)参数估计收敛到 兹0 ,估计模型 Pm (k)一致可 控,且 椰e(k)椰 = 椰y(k) - 准 T (k - d) ^ 兹(k)椰 = o(琢 + 椰准(k - d)椰), 其中 琢 为非零常数; 2)控制策略对参数已知对象满足稳定要求; 3)对象参数估计值到控制器参数的映射在 ^ 兹 (k) = 兹0 处连续. 则自校正控制系统是稳定的和收敛的. 证明:为了证明定理 2,需要构建如图 5 所示的 虚拟等价系统. 图 5 参数估计收敛到非真值时的虚拟等价系统 Fig. 5 VES II for self鄄tuning control system 图中,P0 代表参数估计的收敛值 兹0 所对应的 模型,C0 (对应参数记为 兹c0 )则代表与 P0 对应的控 制器. 显然图 5 所示的虚拟等价系统与图 2 所示的 虚拟等价系统在组成上是不同的,首先是 C0 、P0 分 别与 C、P 不同,其次是 e忆( k)、驻u忆( k) 的定义分别 与式(8)和(12)不同,图 5 中 e忆(k) = y(k) - 准 T (k - d)兹0 = y(k) - 准 T (k - d) ^ 兹(k) + 准 T (k - d) ^ 兹(k) - 准 T (k - d)兹0 即 e忆(k) = e(k) + 准 T (k - d) ^ 兹(k) - 准 T (k - d)兹0 (26) 驻u忆(k) = u(k) - u0 (k) = 准 T c (k)兹c(k) - 准 T c (k)兹c0 (27) 由条件 1)知 椰e忆(k)椰 = o(琢 + 椰准(k - d)椰) (28) 由条件 3)知 椰驻u忆(k)椰 = o(茁 + 椰准(k - d)椰) (29) 将图 5 所示系统分解为 3 个子系统,分别见图 6 ~ 8. 则由条件 2)知道图 6 所示子系统稳定. 以下仿照定理 1 的证明过程,可以得到结论 (细节省略). 图 6 参数收敛到非真值时的分解系统 1 Fig. 6 Decomposed subsystem 1 of VES II 注释 3:由注释 2 知道,对于一般的控制策略― 极点配置控制策略而言,定理 2 之条件 3)相当于要 ·1218·
赵栎等:确定性多变量自校正控制的稳定性、收敛性和鲁棒性 ·1219· △u(内 中(k-d)(k)对控制系统的稳定性和收敛性进行 y.() 判断,也就是说定理3可用于现场控制系统的稳定 u.() 性监控 图7参数收敛到非真值时的分解系统2 定理3的证明思路:仍然使用图2所示的虚拟 Fig.7 Decomposed subsystem 2 of VES II 等价系统 在定理条件2)和条件3)满足的情况下,仿照 e') 文献[5],可以证明一步超前自校正控制有如下 +1+ y, 性质 I△u(k)Ⅱ=O(Ie(k)I)=o(a+I(k-d)‖) 图8参数收敛到非真值时的分解系统3 (30) Fig.8 Decomposed subsystem 3 of VES II 与定理1的证明方法类似,将一步超前自校正 求参数估计模型收敛于一个可控模型。 控制系统的虚拟等价系统分解为图3和图4两个子 注释4:由定理1和定理2可以推出各种极点 系统,根据条件1)知道图3所示子系统是稳定的. 配置类型的自校正控制的稳定性、收敛性,如文献 以下证明过程与定理1的证明类似,细节省略. [7-11]的结果(除去参数估计性能分析部分),这是 注释6:一步超前自校正控制的稳定性、收敛性 因为,目前关于极点配置自校正控制系统的稳定性 为什么不需要参数估计收敛? 和收敛性结果,基本上分为两种:其一是外加持续激 实际上,以上3个定理的证明过程中的关键就 励信号,使参数估计收敛到真值,其二是修正参数估 是证明虚拟等价系统中的△u(k)或△u'(k)的性质. 计,使得参数估计收敛且一致可控,这两种情况分别 定理1和定理2中由于考虑任意控制策略(如极点 对应定理1和定理2.参数估计保证可控性的方法 配置),估计参数和控制器参数之间有比较复杂的 见文献[11,17-18]. 映射关系,因此必须要求参数估计收敛才能保证 2.3参数估计不收敛 △u(k)的性质;而一步超前控制策略中,控制器参数 分别针对一步超前控制策略和任意控制策略给 是直接用估计参数来表示的,细节见文献[5],正是 出两个定理和两个推论.与参数估计收敛到非真值 由于这个特点使得不要求参数估计收敛就有(参照 的情况一样,允许估计模型的结构信息和实际被控 图2所示的虚拟等价系统): 对象不一致. ‖△u(k)‖=O(Ie(k)I) 首先考虑针对最小相位对象的一步超前控制策 成立,因此只要求 略[6),这一类自校正控制系统的稳定和收敛条件可 ‖e(k)‖=o(a+l中(k-d)I) 以更加简化.本文提供的证明与文献[6]的证明不 就可以保证所需要的△u(k)的性质,即‖△u(k)‖ 同,且能比较直观地解释为什么这种特殊类型的自 =o(a+‖中(k-d)‖),这是证明的关键所在,也 校正控制系统不需要参数估计收敛就可以保证系统 解释了为什么一步超前自校正控制的稳定性、收敛 的稳定性和收敛性乃至鲁棒性. 性不需要参数估计收敛为前提 定理3:针对被控对象结构信息未知的最小相 进一步,同时考虑系统低阶建模和系统存在干 位被控对象的多变量确定性一步超前自校正控制系 扰的情况,则有以下关于一步超前自校正控制系统 统,若 的鲁棒性结论. 1)B(q-1)为Hurwitz稳定多项式,且IB。I≠0; 推论1:针对被控对象结构信息未知的最小相 2)控制策略u(k)存在; 位被控对象的多变量确定性一步超前自校正控制系 3)参数估计满足 统,若 ‖e(k)I=Iy(k)-b(k-d)0(k)I=o(a+I中 4)B(g1)为Hurwitz稳定多项式,且IB。|≠0: (k-d)I),a为非零常数 5)控制策略u(k)存在; 则一步超前自校正控制系统是稳定的和收敛的 6)参数估计误差有界,即 注释5:定理3的证明不需要参考文献[6]的 ‖e(k)‖≤M'<o “关键性技术引理”; 则一步超前自校正控制系统是稳定的 定理3的另一个优点是在不知道对象的阶数或 下面考虑参数估计不收敛时基于任意(线性) 阶数的上界的时候,可以根据测量值y(k)和计算值 控制策略的自校正控制系统的稳定性和收敛性
赵 栎等: 确定性多变量自校正控制的稳定性、收敛性和鲁棒性 图 7 参数收敛到非真值时的分解系统 2 Fig. 7 Decomposed subsystem 2 of VES II 图 8 参数收敛到非真值时的分解系统 3 Fig. 8 Decomposed subsystem 3 of VES II 求参数估计模型收敛于一个可控模型. 注释 4:由定理 1 和定理 2 可以推出各种极点 配置类型的自校正控制的稳定性、收敛性,如文献 [7鄄鄄11]的结果(除去参数估计性能分析部分),这是 因为,目前关于极点配置自校正控制系统的稳定性 和收敛性结果,基本上分为两种:其一是外加持续激 励信号,使参数估计收敛到真值,其二是修正参数估 计,使得参数估计收敛且一致可控,这两种情况分别 对应定理 1 和定理 2. 参数估计保证可控性的方法 见文献[11,17鄄鄄18]. 2郾 3 参数估计不收敛 分别针对一步超前控制策略和任意控制策略给 出两个定理和两个推论. 与参数估计收敛到非真值 的情况一样,允许估计模型的结构信息和实际被控 对象不一致. 首先考虑针对最小相位对象的一步超前控制策 略[6] ,这一类自校正控制系统的稳定和收敛条件可 以更加简化. 本文提供的证明与文献[6]的证明不 同,且能比较直观地解释为什么这种特殊类型的自 校正控制系统不需要参数估计收敛就可以保证系统 的稳定性和收敛性乃至鲁棒性. 定理 3:针对被控对象结构信息未知的最小相 位被控对象的多变量确定性一步超前自校正控制系 统,若 1)B(q - 1 )为 Hurwitz 稳定多项式,且|B0 |屹0; 2)控制策略 u(k)存在; 3)参数估计满足 椰e(k)椰 = 椰y(k) - 准 T (k - d) ^ 兹(k)椰 = o(琢 + 椰准 (k - d)椰),琢 为非零常数. 则一步超前自校正控制系统是稳定的和收敛的. 注释 5:定理 3 的证明不需要参考文献[6] 的 “关键性技术引理冶; 定理 3 的另一个优点是在不知道对象的阶数或 阶数的上界的时候,可以根据测量值 y(k)和计算值 准 T (k - d) ^ 兹(k)对控制系统的稳定性和收敛性进行 判断,也就是说定理 3 可用于现场控制系统的稳定 性监控. 定理 3 的证明思路:仍然使用图 2 所示的虚拟 等价系统. 在定理条件 2) 和条件 3) 满足的情况下,仿照 文献[5],可以证明一步超前自校正控制有如下 性质 椰驻u(k)椰 = O(椰e(k)椰) = o(琢 + 椰准(k - d)椰) (30) 与定理 1 的证明方法类似,将一步超前自校正 控制系统的虚拟等价系统分解为图 3 和图 4 两个子 系统,根据条件 1)知道图 3 所示子系统是稳定的. 以下证明过程与定理 1 的证明类似,细节省略. 注释 6:一步超前自校正控制的稳定性、收敛性 为什么不需要参数估计收敛? 实际上,以上 3 个定理的证明过程中的关键就 是证明虚拟等价系统中的 驻u(k)或 驻u忆(k)的性质. 定理 1 和定理 2 中由于考虑任意控制策略(如极点 配置),估计参数和控制器参数之间有比较复杂的 映射关系,因此必须要求参数估计收敛才能保证 驻u(k)的性质;而一步超前控制策略中,控制器参数 是直接用估计参数来表示的,细节见文献[5],正是 由于这个特点使得不要求参数估计收敛就有(参照 图 2 所示的虚拟等价系统): 椰驻u(k)椰 = O(椰e(k)椰) 成立,因此只要求 椰e(k)椰 = o(琢 + 椰准(k - d)椰) 就可以保证所需要的 驻u(k)的性质,即椰驻u( k)椰 = o(琢 + 椰准( k - d)椰),这是证明的关键所在,也 解释了为什么一步超前自校正控制的稳定性、收敛 性不需要参数估计收敛为前提. 进一步,同时考虑系统低阶建模和系统存在干 扰的情况,则有以下关于一步超前自校正控制系统 的鲁棒性结论. 推论 1:针对被控对象结构信息未知的最小相 位被控对象的多变量确定性一步超前自校正控制系 统,若 4)B(q - 1 )为 Hurwitz 稳定多项式,且|B0 |屹0; 5)控制策略 u(k)存在; 6)参数估计误差有界,即 椰e(k)椰臆M忆 < 肄 则一步超前自校正控制系统是稳定的. 下面考虑参数估计不收敛时基于任意(线性) 控制策略的自校正控制系统的稳定性和收敛性. ·1219·
·1220. 工程科学学报.第41卷,第9期 定理4:针对∑P的任意控制策略的自校正 △u'( ++ 控制系统,若 C() ⑧☒ -P.() u(k 1)I0(k)I≤M<0,I0(k)-0(k-1)I→0,1为 有限值; 图12参数估计不收敛时的分解子系统2 2)Ie(k)‖=o(a+I中(k-d)I),a为非零常 Fig.12 Decomposed subsystem 2 of Fig.10 数: e(k) 3)控制策略对参数已知对象满足稳定要求,且跟踪 ++ y() =⑧ 参考输入信号; C P 4)控制器参数是对象参数估计值的连续函数,即 图13参数估计不收敛时的分解子系统3 0.(k)是0(k)的连续函数. Fig.13 Decomposed subsystem 3 of Fig.10 则自校正控制系统是稳定的和收敛的 证明思路: 4的结论 由于考虑任意(线性)控制策略,所以不能如定 注释7:定理4的条件1)和条件2)为一般参数 理3的证明过程,找到△u(k)和e(k)的比例关系, 估计算法所能满足的性质[6-1,2).条件1)也说明, 因此不能继续使用图2所示的虚拟等价系统,为此 估计参数应该限定在一定范围内,也就是说,自适应 考虑另外一种虚拟等价系统,如图9所示 控制不应该是“无限”范围的自适应,而应该是“有 e') 限”范围的自适应,才能保证其稳定性乃至收敛性. u(k) ++ 进一步,同时考虑系统低阶建模和系统存在干 ⑧ C P 扰的情况,则有以下针对任意控制策略自校正控制 图9参数估计不收敛时的虚拟等价系统 系统的鲁棒性结论 Fig.9 VES of self-tuning control system 推论2:针对被控对象∑P,考虑系统受到有 将图9所示系统进一步演变为图10所示的虚 界干扰且低阶建模情况下的自校正控制系统,若 拟等价系统,由定理4之条件1)和4)知道,:和 1)I0(k)I≤M<3,I0(k)-0(k-l)I→0,l为 4-1之间的间隔可以选择为充分长,仍然能够保持所 有限值; 需要的△u'(k)的性质,即I△u'(k)‖=o(B+‖中 2)参数估计误差有界,即 (k-d)‖).因此,图10所示系统是一个“慢时变” Ie(k)I≤M'<o 切换系统 3)控制策略对参数已知对象满足稳定要求,且跟踪 △u' e(k) 参考输入信号: 4)控制器参数是对象参数估计值的连续函数,即 Cu) 0(k)是(k)的连续函数 则自校正控制系统是稳定的 图10参数估计不收敛时的虚拟等价系统 Fig.10 Another VES of self-tuning control system 注释8:上述理论分析的关键部分,即虚拟等价 系统的分解前后的等价性在文献[5,22]中都有证 将图10所示的虚拟等价系统分解为3个子系 明,同时文献[22]给出了相应的仿真验证 统,分别如图11~13所示,由条件1)和2)知道 ‖e:(k)‖=o(a+I(k-d)‖) 3 确定性自校正控制系统 P.( y份 自校正控制系统的收敛性取决于模型是否在整 体上可以逼近受控对象的输出效果,并非取决于模 图11参数估计不收敛时的分解子系统1 型参数是否收敛到它的真值,甚至可以不收敛 Fig.11 Decomposed subsystem 1 of Fig.10 反馈不仅可以为系统提供一定的鲁棒性(抗干 利用“慢切换”系统的结果[90]及条件1)和 扰能力和容忍参数小范围波动),而且可以为自适 3),知道图11所示系统是稳定且跟踪的:其余部分 应控制系统的学习功能或自适应能力提供充分的信 利用本文所用的证明手法(反证法),可以得到定理 息,即,为了辨识参数而外加激励信号不是必须的. 自校正控制系统中控制器参数的不断调整,对
工程科学学报,第 41 卷,第 9 期 定理 4:针对 移 P 的任意控制策略的自校正 控制系统,若 1)椰 ^ 兹(k)椰臆M < 肄 ,椰 ^ 兹(k) - ^ 兹(k - l)椰寅0,l 为 有限值; 2)椰e(k) 椰 = o( 琢 + 椰准( k - d) 椰),琢 为非零常 数; 3)控制策略对参数已知对象满足稳定要求,且跟踪 参考输入信号; 4)控制器参数是对象参数估计值的连续函数,即 兹c(k)是 ^ 兹(k)的连续函数. 则自校正控制系统是稳定的和收敛的. 证明思路: 由于考虑任意(线性)控制策略,所以不能如定 理 3 的证明过程,找到 驻u(k)和 e( k)的比例关系, 因此不能继续使用图 2 所示的虚拟等价系统,为此 考虑另外一种虚拟等价系统,如图 9 所示. 图 9 参数估计不收敛时的虚拟等价系统 Fig. 9 VES of self鄄tuning control system 将图 9 所示系统进一步演变为图 10 所示的虚 拟等价系统,由定理 4 之条件 1) 和 4) 知道,t k 和 t k - 1之间的间隔可以选择为充分长,仍然能够保持所 需要的 驻u忆(k)的性质,即椰驻u忆( k)椰 = o( 茁 + 椰准 (k - d)椰). 因此,图 10 所示系统是一个“慢时变冶 切换系统. 图 10 参数估计不收敛时的虚拟等价系统 Fig. 10 Another VES of self鄄tuning control system 将图 10 所示的虚拟等价系统分解为 3 个子系 统,分别如图 11 ~ 13 所示,由条件 1)和 2)知道 椰ei(k)椰 = o(琢 + 椰准(k - d)椰) 图 11 参数估计不收敛时的分解子系统 1 Fig. 11 Decomposed subsystem 1 of Fig. 10 利用“慢切换冶 系统的结果[19鄄鄄20] 及条件 1) 和 3),知道图 11 所示系统是稳定且跟踪的;其余部分 利用本文所用的证明手法(反证法),可以得到定理 图 12 参数估计不收敛时的分解子系统 2 Fig. 12 Decomposed subsystem 2 of Fig. 10 图 13 参数估计不收敛时的分解子系统 3 Fig. 13 Decomposed subsystem 3 of Fig. 10 4 的结论. 注释 7:定理 4 的条件 1)和条件 2)为一般参数 估计算法所能满足的性质[6鄄鄄7,21] . 条件 1) 也说明, 估计参数应该限定在一定范围内,也就是说,自适应 控制不应该是“无限 冶范围的自适应,而应该是“有 限冶范围的自适应,才能保证其稳定性乃至收敛性. 进一步,同时考虑系统低阶建模和系统存在干 扰的情况,则有以下针对任意控制策略自校正控制 系统的鲁棒性结论. 推论 2:针对被控对象 移 P,考虑系统受到有 界干扰且低阶建模情况下的自校正控制系统,若 1)椰 ^ 兹(k)椰臆M < 肄 ,椰 ^ 兹(k) - ^ 兹(k - l)椰寅0,l 为 有限值; 2)参数估计误差有界,即 椰e(k)椰臆M忆 < 肄 3)控制策略对参数已知对象满足稳定要求,且跟踪 参考输入信号; 4)控制器参数是对象参数估计值的连续函数,即 兹c(k)是 ^ 兹(k)的连续函数. 则自校正控制系统是稳定的. 注释 8:上述理论分析的关键部分,即虚拟等价 系统的分解前后的等价性在文献[5,22] 中都有证 明,同时文献[22]给出了相应的仿真验证. 3 确定性自校正控制系统 自校正控制系统的收敛性取决于模型是否在整 体上可以逼近受控对象的输出效果,并非取决于模 型参数是否收敛到它的真值,甚至可以不收敛. 反馈不仅可以为系统提供一定的鲁棒性(抗干 扰能力和容忍参数小范围波动),而且可以为自适 应控制系统的学习功能或自适应能力提供充分的信 息,即,为了辨识参数而外加激励信号不是必须的. 自校正控制系统中控制器参数的不断调整,对 ·1220·
赵栎等:确定性多变量自校正控制的稳定性、收敛性和鲁棒性 ·1221· 系统动态性能的影响相当于增加了一个扰动信号 (5):879 e(k)(或者折算为△u(k)),这是自适应或自学习所 [6]Goodwin G C.Sin K S.Adaptive Filtering Prediction and Control 付出的必然代价.对系统的稳定性、收敛性指标来 Courier Corporation,2014 [7]Lozano-Leal R,Goodwin G.A globally convergent adaptive pole 说,在一定条件下这一扰动信号没有造成影响,但对 placement algorithm without a persistency of excitation require- 系统的动态指标的影响是明显的 ment.IEEE Trans Autom Control,1985,30(8):795 有3种方法可以用来抑制e(k)/△u(k)的影 [8]Lozano-Leal R.Robust adaptive regulation without persistent exci- 响:第一,采用多模型自适应控制的方法,在e(k)较 tation.IEEE Trans Autom Control,1989,34(12)1260 大时,采用基于先验知识的固定模型:第二,修改控 [9]Lozano R.Singularity-free adaptive pole-placement without resor- ting to persistency of excitation:detailed analysis for first order 制策略,即对参数估计误差进行预测,并考虑到控制 systems.Automatica,1992,28(1):27 律中,这种思路和自适应预测控制殊途同归:第三, [10]Lozano R,Dion J M,Dugard L Singularity-free adaptive pole 因为产生△u(k)的根源是参数估计误差e(k),而从 placement using periodic controllers.IEEE Trans Autom Control, e(k)到△u(k)的映射由控制策略决定,因此可以通 1993,38(1):104 过采用鲁棒控制策略来尽量抑制e(k). [11]Lozano R.Zhao X H.Adaptive pole placement without excitation probing signals.IEEE Trans Autom Control,1994,39(1):47 4结论 [12]Xu LZ,Wang X H.Methods and Examples of Mathematical A- nalysis (Revised Edition).Beijing:Higher Education Press, 借助虚拟等价系统,将自校正控制系统的稳定 1983 性、收敛性和鲁棒性分析的困难从系统结构上转移 (徐利治,王兴华.数学分析的方法及例题选讲(修订版) 到补偿信号上,从而降低了原问题的难度,使得自校 北京:高等教育出版社,1983) 正控制系统的稳定性、收敛性乃至鲁棒性分析变得 [13]Caines P,Lafortune S.Adaptive control with recursive identifica- tion for stochastic linear systems.IEEE Trans Autom Control, 更加直观、易于理解。得到的若干定理和推论,在一 1984,29(4):312 定程度上可以统一对自校正控制系统的稳定性和收 [14]Chen H F,Guo L.Asymptotically optimal adaptive control with 敛性的判断和认识,同时得出一些新的观点,包括: consistent parameter estimates.SIAM Control Optim,1987,25 参数估计的收敛性不是自校正控制系统稳定和收敛 (3):558 的必要条件:系统自身的反馈信息对自校正控制系 [15]Astrom K J,Wittenmark B.Adaptire Control.Newyork:Courier 统的控制目的是充分的,即,外加激励信号不是必 Corporation,2013 [16]Hu S G.Functional Analysis.Beijing:Higher Education Press, 须的 2007 (胡适耕.泛函分析.北京:高等教育出版社,2007) 参考文献 [17]Prandini M,Campi M C.A new recursive identification algorithm [1]Zhang WC.Research on Robust Adaptive Control Theory and Its for singularity free adaptive control.Syst Control Lett,1998,34 Applications[Dissertation].Beijing:Tsinghua University,1993 (4):177 (张维存。鲁棒自适应控制理论及应用研究[学位论文].北 [18]Prandini M,Bittanti S,Campi M C.A penalized identification 京:清华大学,1993) criterion for securing controllability in adaptive control.Math [2]Fekri S,Athans M,Pascoal A.Issues,progress and new results Syst Estim Control,1998,8(4):1 in robust adaptive control.Int J Adapt Control Signal Process, [19]Liberzon D,Morse A S.Basic problems in stability and design of 2006,20(10):519 switched systems.IEEE Control Syst Mag,1999,19(5):59 [3]Li QQ.Adaptire Control System:Theory,Design,and Applica- [20]Shorten R,Wirth F,Mason 0,et al.Stability criteria for tions.Beijing:Science Press,1990 switched and hybrid systems.SIAM Rev,2007,49(4):545 (李清泉.自适应控制系统理论、设计与应用.北京:科学出 [21]Feng C B,Shi W.Adaptire control.Beijing:Publishing House 版社,1990) of Electronics Industry,1986 [4]Xie X M,Ding F.Adaptice Control System.Beijing:Tsinghua U- (冯纯伯,史维.自适应控制,北京:电子工业出版社,1986) niversity Press,2002 [22]Zhang W C,Wei W.Virtual equivalent system theory for adap- (谢新民.丁锋.自适应控制系统.北京:清华大学出版社, tive control and simulation verification.Sci Sin Inform,2018,48 2002) (7):947 [5]Zhang W C.On the stability and convergence of self-tuning con- (张维存,魏伟.自适应控制的虚拟等价系统理论及仿真验 trol-virtual equivalent system approach.Int Control,2010,83 证.中国科学:信息科学,2018,48(7):947)
赵 栎等: 确定性多变量自校正控制的稳定性、收敛性和鲁棒性 系统动态性能的影响相当于增加了一个扰动信号 e(k)(或者折算为 驻u(k)),这是自适应或自学习所 付出的必然代价. 对系统的稳定性、收敛性指标来 说,在一定条件下这一扰动信号没有造成影响,但对 系统的动态指标的影响是明显的. 有 3 种方法可以用来抑制 e( k) / 驻u( k) 的影 响:第一,采用多模型自适应控制的方法,在 e(k)较 大时,采用基于先验知识的固定模型;第二,修改控 制策略,即对参数估计误差进行预测,并考虑到控制 律中,这种思路和自适应预测控制殊途同归;第三, 因为产生 驻u(k)的根源是参数估计误差 e(k),而从 e(k)到 驻u(k)的映射由控制策略决定,因此可以通 过采用鲁棒控制策略来尽量抑制 e(k). 4 结论 借助虚拟等价系统,将自校正控制系统的稳定 性、收敛性和鲁棒性分析的困难从系统结构上转移 到补偿信号上,从而降低了原问题的难度,使得自校 正控制系统的稳定性、收敛性乃至鲁棒性分析变得 更加直观、易于理解. 得到的若干定理和推论,在一 定程度上可以统一对自校正控制系统的稳定性和收 敛性的判断和认识,同时得出一些新的观点,包括: 参数估计的收敛性不是自校正控制系统稳定和收敛 的必要条件;系统自身的反馈信息对自校正控制系 统的控制目的是充分的,即,外加激励信号不是必 须的. 参 考 文 献 [1] Zhang W C. Research on Robust Adaptive Control Theory and Its Applications [Dissertation]. Beijing: Tsinghua University, 1993 (张维存. 鲁棒自适应控制理论及应用研究[学位论文]. 北 京: 清华大学, 1993) [2] Fekri S, Athans M, Pascoal A. Issues, progress and new results in robust adaptive control. Int J Adapt Control Signal Process, 2006, 20(10): 519 [3] Li Q Q. Adaptive Control System: Theory, Design, and Applica鄄 tions. Beijing: Science Press, 1990 (李清泉. 自适应控制系统理论、设计与应用. 北京: 科学出 版社, 1990) [4] Xie X M, Ding F. Adaptive Control System. Beijing: Tsinghua U鄄 niversity Press, 2002 (谢新民, 丁锋. 自适应控制系统. 北京: 清华大学出版社, 2002) [5] Zhang W C. On the stability and convergence of self鄄tuning con鄄 trol鄄virtual equivalent system approach. Int J Control, 2010, 83 (5): 879 [6] Goodwin G C, Sin K S. Adaptive Filtering Prediction and Control. Courier Corporation, 2014 [7] Lozano鄄Leal R, Goodwin G. A globally convergent adaptive pole placement algorithm without a persistency of excitation require鄄 ment. IEEE Trans Autom Control, 1985, 30(8): 795 [8] Lozano鄄Leal R. Robust adaptive regulation without persistent exci鄄 tation. IEEE Trans Autom Control, 1989, 34(12): 1260 [9] Lozano R. Singularity鄄free adaptive pole鄄placement without resor鄄 ting to persistency of excitation: detailed analysis for first order systems. Automatica, 1992, 28(1): 27 [10] Lozano R, Dion J M, Dugard L. Singularity鄄free adaptive pole placement using periodic controllers. IEEE Trans Autom Control, 1993, 38(1): 104 [11] Lozano R, Zhao X H. Adaptive pole placement without excitation probing signals. IEEE Trans Autom Control, 1994, 39(1): 47 [12] Xu L Z, Wang X H. Methods and Examples of Mathematical A鄄 nalysis ( Revised Edition ). Beijing: Higher Education Press, 1983 (徐利治, 王兴华. 数学分析的方法及例题选讲(修订版). 北京: 高等教育出版社,1983) [13] Caines P, Lafortune S. Adaptive control with recursive identifica鄄 tion for stochastic linear systems. IEEE Trans Autom Control, 1984, 29(4): 312 [14] Chen H F, Guo L. Asymptotically optimal adaptive control with consistent parameter estimates. SIAM J Control Optim, 1987, 25 (3): 558 [15] 魡str觟m K J, Wittenmark B. Adaptive Control. Newyork: Courier Corporation, 2013 [16] Hu S G. Functional Analysis. Beijing: Higher Education Press, 2007 (胡适耕. 泛函分析. 北京: 高等教育出版社, 2007) [17] Prandini M, Campi M C. A new recursive identification algorithm for singularity free adaptive control. Syst Control Lett, 1998, 34 (4): 177 [18] Prandini M, Bittanti S, Campi M C. A penalized identification criterion for securing controllability in adaptive control. J Math Syst Estim Control, 1998, 8(4): 1 [19] Liberzon D, Morse A S. Basic problems in stability and design of switched systems. IEEE Control Syst Mag, 1999, 19(5): 59 [20] Shorten R, Wirth F, Mason O, et al. Stability criteria for switched and hybrid systems. SIAM Rev, 2007, 49(4): 545 [21] Feng C B, Shi W. Adaptive control. Beijing: Publishing House of Electronics Industry,1986 (冯纯伯,史维. 自适应控制,北京:电子工业出版社,1986) [22] Zhang W C, Wei W. Virtual equivalent system theory for adap鄄 tive control and simulation verification. Sci Sin Inform, 2018, 48 (7): 947 (张维存, 魏伟. 自适应控制的虚拟等价系统理论及仿真验 证. 中国科学: 信息科学, 2018, 48(7): 947) ·1221·