第8卷第5期 智能系统学报 Vol.8 No.5 2013年10月 CAAI Transactions on Intelligent Systems 0ct.2013 D0:10.3969/j.issn.1673-4785.201212012 网络出版地址:http://www.cnki.net/kcms/detail/23.1538.TP.20130929.1040.001.html 浸入与不变方法原理 及其在非线性自适应控制中的应用 刘振,谭湘敏,易建强,袁如意,范国梁 (中国科学院自动化研究所综合信息系统研究中心,北京100190) 摘要:非线性系统理论的实际工程需求和复杂性使其成为控制学科中最具吸引力和挑战性的研究领域,为此介绍 了一种新的非线性控制律设计方法一浸入与不变(I&)理论该方法首先选择一个比被控系统维数低的(局部)渐 近稳定的目标系统,然后设计浸入映射和控制律,使得原系统在控制律作用下的动态轨迹都是目标系统在浸入映射 下的像,并且该控制律能够保持目标系统的像为不变吸引流形,且使闭环轨迹有界.针对未知点质量模型,设计了一 种新的非线性浸入与不变自适应控制律,实现了对参考指令的精确跟踪将其与基于确定等价原则的自适应控制律 相比较,仿真结果表明,所设计的浸入与不变控制律能够更好地处理带有未知参数的系统 关键词:非线性控制:浸人与不变理论:自适应控制:控制律:未知点质量系统 中图分类号:TP273文献标志码:A文章编号:1673-4785(2013)05-0400-08 中文引用格式:刘振,谭湘敏,易建强,等浸入与不变方法原理及其在非线性自适应控制中的就用[J].智能系统学报,2013,8(5): 400-407. 英文引用格式:LIU Zhen,TAN Xiangmin,YI Jianqiang,etal.Immersion and invariance theory and its applications in nonlinear adaptive control[J].CAAI Transactions on Intelligent Systems,2013,8(5):400-407. Immersion and invariance theory and its application in nonlinear adaptive control LIU Zhen,TAN Xiangmin,YI Jiangiang,YUAN Ruyi,FAN Guoliang Integrated Information System Research Center,Institute of Automation,Chinese Academy of Sciences,Beijing 100190,China) Abstract:The actual engineering demands and the complexities of the nonlinear system theory have led it to become the most attractive and challenging research field in control subjects,therefore,a new nonlinear control law design method-immersion and invariance (I&I)theory has been introduced.With this method,a (partially)asymptoti- cally stable system with a dimension less than that of the controlled system is firstly selected as the target system, then the immersion mapping and control law are designed to make the controlled dynamics of the original system is an immersion image of the target system.In addition,the control law can keep the image of the target system as an invariant and attractive manifold,and render the trajectory of the closed-loop system bounded.Focusing on the un- known point mass model,a new nonlinear immersion and invariance adaptive control law is designed for realizing the precise tracking of a reference command.Compared with the adaptive control law based on the certainty-equiva- lent principle,the simulation results show that the proposed I&I adaptive control law is quite effective for processing a system with unknown parameters. Keywords:nonlinear control;immersion and invariance theory;adaptive control;control law;unknown point mass system 非线性是自然界和工程技术领域里普遍存在的 际工程对象进行精确建模.任何一个实际的物理系 现象.由于各种各样的原因,人们总是无法对一个实 统都是非线性的,而所谓的线性只是对非线性的一 种简化或近似,或说是非线性的一种特例.控制科学 收稿日期:2012-12-06.网络出版日期:2013-09-29. 发展至今,线性系统控制理论已经具有了相当完美 基金项目:国家自然科学基金资助项目(61273149,61203003):科技 部创新方法工作专项项目(2012M010200). 的理论框架,并且在工程实践中也有着成功的应用. 通信作者:谭湘敏.E-mail:minxiangtan(@163.com
第 8 卷第 5 期 智 能 系 统 学 报 Vol.8 №.5 2013 年 10 月 CAAI Transactions on Intelligent Systems Oct. 2013 DOI:10.3969 / j.issn.1673 ̄4785.201212012 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20130929.1040.001.html 浸入与不变方法原理 及其在非线性自适应控制中的应用 刘振ꎬ谭湘敏ꎬ易建强ꎬ袁如意ꎬ范国梁 (中国科学院自动化研究所 综合信息系统研究中心ꎬ北京 100190) 摘 要:非线性系统理论的实际工程需求和复杂性使其成为控制学科中最具吸引力和挑战性的研究领域ꎬ为此介绍 了一种新的非线性控制律设计方法———浸入与不变(I&I)理论.该方法首先选择一个比被控系统维数低的(局部)渐 近稳定的目标系统ꎬ然后设计浸入映射和控制律ꎬ使得原系统在控制律作用下的动态轨迹都是目标系统在浸入映射 下的像ꎬ并且该控制律能够保持目标系统的像为不变吸引流形ꎬ且使闭环轨迹有界.针对未知点质量模型ꎬ设计了一 种新的非线性浸入与不变自适应控制律ꎬ实现了对参考指令的精确跟踪.将其与基于确定等价原则的自适应控制律 相比较ꎬ仿真结果表明ꎬ所设计的浸入与不变控制律能够更好地处理带有未知参数的系统. 关键词:非线性控制ꎻ浸入与不变理论ꎻ自适应控制ꎻ控制律ꎻ未知点质量系统 中图分类号:TP273 文献标志码:A 文章编号:1673 ̄4785(2013)05 ̄0400 ̄08 中文引用格式:刘振ꎬ谭湘敏ꎬ易建强ꎬ等.浸入与不变方法原理及其在非线性自适应控制中的就用[J]. 智能系统学报ꎬ 2013ꎬ 8(5): 400 ̄407. 英文引用格式:LIU Zhenꎬ TAN Xiangminꎬ YI Jianqiangꎬ et al. Immersion and invariance theory and its applications in nonlinear adaptive control[J]. CAAI Transactions on Intelligent Systemsꎬ 2013ꎬ 8(5): 400 ̄407. Immersion and invariance theory and its application in nonlinear adaptive control LIU Zhenꎬ TAN Xiangminꎬ YI Jianqiangꎬ YUAN Ruyiꎬ FAN Guoliang (Integrated Information System Research Centerꎬ Institute of Automationꎬ Chinese Academy of Sciencesꎬ Beijing 100190ꎬ China) Abstract:The actual engineering demands and the complexities of the nonlinear system theory have led it to become the most attractive and challenging research field in control subjectsꎬ thereforeꎬ a new nonlinear control law design method—immersion and invariance (I&I) theory has been introduced. With this methodꎬ a (partially) asymptoti ̄ cally stable system with a dimension less than that of the controlled system is firstly selected as the target systemꎬ then the immersion mapping and control law are designed to make the controlled dynamics of the original system is an immersion image of the target system. In additionꎬ the control law can keep the image of the target system as an invariant and attractive manifoldꎬ and render the trajectory of the closed ̄loop system bounded. Focusing on the un ̄ known point mass modelꎬ a new nonlinear immersion and invariance adaptive control law is designed for realizing the precise tracking of a reference command. Compared with the adaptive control law based on the certainty ̄equiva ̄ lent principleꎬ the simulation results show that the proposed I&I adaptive control law is quite effective for processing a system with unknown parameters. Keywords:nonlinear controlꎻ immersion and invariance theoryꎻ adaptive controlꎻ control lawꎻ unknown point mass system 收稿日期:2012 ̄12 ̄06. 网络出版日期:2013 ̄09 ̄29. 基金项目:国家自然科学基金资助项目( 61273149ꎬ61203003)ꎻ科技 部创新方法工作专项项目(2012IM010200). 通信作者:谭湘敏. E ̄mail: minxiangtan@ 163.com. 非线性是自然界和工程技术领域里普遍存在的 现象.由于各种各样的原因ꎬ人们总是无法对一个实 际工程对象进行精确建模.任何一个实际的物理系 统都是非线性的ꎬ而所谓的线性只是对非线性的一 种简化或近似ꎬ或说是非线性的一种特例.控制科学 发展至今ꎬ线性系统控制理论已经具有了相当完美 的理论框架ꎬ并且在工程实践中也有着成功的应用
第5期 刘振,等:浸入与不变方法原理及其在非线性自适应控制中的应用 ·401- 但其必须建立被控对象或过程的精确线性模型的局 假设3(隐流形)下面集合恒等成立: 限极大地制约了其进一步的发展.随着科学技术的 M={x(t)∈R"Ip(x)=0}= 进步,传统的线性控制理论已经越来越难以满足对 {x(t)∈R"Ix=π(5),专∈R}. 系统控制性能的要求;因此,对非线性系统控制理论 假设4(流形吸引性与轨迹有界性)存在系统 的研究,具有重要的理论意义和迫切的现实需求, 从20世纪80年代以来,非线性系统理论得到 i=2Ux)+g(x)(x,2), 了蓬勃的发展.这一期间,以A.Isidori教授为代表 x=f(x)+g(x)ψ(x,z), (3) 的非线性系统理论先驱们将微分几何等现代数学工 各个状态都是有界的,且满足: 具成功应用到控制理论中.正如他在文献[1]中所预 lim (t)=0. (4) 言:用微分几何法研究非线性系统所取得的成功,就 像50年代用拉氏变换及复变函数理论对单输入单 那么,x,就是闭环系统(5)的(局部)渐近稳定平衡 输出系统的研究,或60年代用线性代数对多变量系 点,也称为浸入与不变稳定 统的研究一样.微分几何方法的引入,给控制理论带 x=f(x)+g(x)(x,z). (5) 来了突破性进展,诸多基于微分几何方法的控制理 详细证明过程可参考文献[2-3]。 论被相继提出,并得到了广泛应用, 从上面的叙述中可以看出,一个系统的I&I镇 2003年,意大利学者A.Astol6等采用微分几何 定可以分2步实现首先,选择一个比原系统维数严 的概念提出了一种新的非线性系统控制方法一浸入 格低的(局部)渐近稳定的目标系统,找到一个浸入 与不变(immersion and invariance,l&I)[2).与通常 映射x=π(专),使得假设2成立;其次,设计控制 的非线性系统镇定需要Lyapunov函数不同,I&I方 律,使得流形M为不变吸引流形,并且闭环系统有 法不需要构造Lyapunov函数.该方法通过选择浸入 界.显然,应用&方法时,需要根据目标系统的选 映射和设计控制律,使得被控系统的任何轨迹都是 取,通过求解偏微分方程进而确定浸入映射π(·), 目标系统在该浸入映射下的像,并且设计的控制律 而这往往是比较困难的幸运的是,很多情况下根据 能够使目标系统的像为不变吸引流形,从而保证整 原系统和控制目标物理原理及系统理论的知识来选 个系统的稳定性该方法虽然提出时间不长,但由于 择目标系统可以大大简化该问题.该方法特别适用 其显著的非线性自适应性能,已经被广泛应用到各 于对被控对象的降阶系统设计稳定控制器的情 个方面s1本文专门讨论1&I方法的基本原理、设 形23].图1是1&I方法的一个形象描述,原系统是 计方法及其在自适应理论上的拓展,并将其应用到 一个n维系统(图中n=3),按照I&I理论,目标系 未知点质量系统的自适应控制上, 统可以选择1到n-1维任何一种情况.而基于Lya- 1 浸入与不变稳定理论 punov直接法的控制器设计方法可以看作是I&I方 法的一个特例,但设计控制律时需要选择Lyapunov 1.1基本原理 函数V(x),该函数正定且其导数7=ax(V)<0.从 设系统 I&I理论的角度看,I&I方法是将一个在原点渐近稳 x=f(x)+g(x)u. (1)》 定的一维目标系统V=α(V)浸入到高维的原系统中 式中:系统状态x∈R",输入u∈Rm, 1维目标系统 考虑系统(1)的镇定问题,即寻找状态反馈控 (如渐进收敛的Lyapunov函数系统) 制律u=v(x),使x.为闭环系统的(局部)渐近稳 n维原系统 0P-a0<0g 定平衡点.假设存在如下映射: x-Ax)+g(x)u Tx ()系统浸入 a(·):R”→R,T(·):R”→R",c(·):R→Rm, 2维日标系统 π(). p():R"→R"P,(·,·):Rax(ap)→Rm, n-l维目标系统 其中p<n,使得下面的4个假设成立[创 () ξ=a(5) 系统浸入 假设1(目标系统)存在系统专=α(专),专∈ 全局吸引的 不变流形亚() R”,具有(局部)渐近稳定平衡点专。,且x。= π(5,) 假设2(浸入条件)对于所有专∈R”,有 图1浸入与不变方法 dT Fig.1 Graphical illustration of the immersion and in- f八π())+g(π())c(π(专))= 话a(5).(2) variance approach
但其必须建立被控对象或过程的精确线性模型的局 限极大地制约了其进一步的发展.随着科学技术的 进步ꎬ传统的线性控制理论已经越来越难以满足对 系统控制性能的要求ꎻ因此ꎬ对非线性系统控制理论 的研究ꎬ具有重要的理论意义和迫切的现实需求. 从 20 世纪 80 年代以来ꎬ非线性系统理论得到 了蓬勃的发展.这一期间ꎬ以 A. Isidori 教授为代表 的非线性系统理论先驱们将微分几何等现代数学工 具成功应用到控制理论中.正如他在文献[1]中所预 言:用微分几何法研究非线性系统所取得的成功ꎬ就 像 50 年代用拉氏变换及复变函数理论对单输入单 输出系统的研究ꎬ或 60 年代用线性代数对多变量系 统的研究一样.微分几何方法的引入ꎬ给控制理论带 来了突破性进展ꎬ诸多基于微分几何方法的控制理 论被相继提出ꎬ并得到了广泛应用. 2003 年ꎬ意大利学者 A. Astolfi 等采用微分几何 的概念提出了一种新的非线性系统控制方法—浸入 与不变( immersion and invarianceꎬ I&I) [2 ̄4] .与通常 的非线性系统镇定需要 Lyapunov 函数不同ꎬI&I 方 法不需要构造 Lyapunov 函数.该方法通过选择浸入 映射和设计控制律ꎬ使得被控系统的任何轨迹都是 目标系统在该浸入映射下的像ꎬ并且设计的控制律 能够使目标系统的像为不变吸引流形ꎬ从而保证整 个系统的稳定性.该方法虽然提出时间不长ꎬ但由于 其显著的非线性自适应性能ꎬ已经被广泛应用到各 个方面[5 ̄12] .本文专门讨论 I&I 方法的基本原理、设 计方法及其在自适应理论上的拓展ꎬ并将其应用到 未知点质量系统的自适应控制上. 1 浸入与不变稳定理论 1.1 基本原理 设系统 ̇x = f(x) + g(x)u. (1) 式中:系统状态 x ∈ R n ꎬ输入 u ∈ R m . 考虑系统(1)的镇定问题ꎬ即寻找状态反馈控 制律 u = v(x) ꎬ使 x∗ 为闭环系统的(局部)渐近稳 定平衡点.假设存在如下映射: α():R p → R p ꎬπ():R p → R n ꎬc():R p → R m ꎬ φ():R n → R n-p ꎬψ(ꎬ):R n×(n-p) → R m ꎬ 其中 p < n ꎬ使得下面的 4 个假设成立[3] . 假设 1(目标系统) 存在系统 ̇ξ =α(ξ)ꎬξ ∈ R p ꎬ 具有 ( 局 部) 渐 近 稳 定 平 衡 点 ξ∗ꎬ 且 x∗ = π(ξ ∗) . 假设 2(浸入条件) 对于所有 ξ ∈ R p ꎬ 有 f(π(ξ) ) + g(π(ξ) ) c(π(ξ) ) = ∂π ∂ξ α(ξ). (2) 假设 3(隐流形) 下面集合恒等成立: M = x(t) ∈ R n { | φ(x) = 0} = x(t) ∈ R n | x = π(ξ)ꎬ ξ ∈ R p { } . 假设 4(流形吸引性与轨迹有界性) 存在系统 ̇z = ∂φ ∂x (f(x) + g(x)ψ(xꎬz))ꎬ ̇x = f(x) + g(x)ψ(xꎬz)ꎬ (3) 各个状态都是有界的ꎬ且满足: lim t→¥ z(t) = 0. (4) 那么ꎬx∗就是闭环系统(5)的(局部)渐近稳定平衡 点ꎬ也称为浸入与不变稳定. ̇x = f(x) + g(x)ψ(xꎬz). (5) 详细证明过程可参考文献[2 ̄3]. 从上面的叙述中可以看出ꎬ一个系统的 I&I 镇 定可以分 2 步实现.首先ꎬ选择一个比原系统维数严 格低的(局部)渐近稳定的目标系统ꎬ找到一个浸入 映射 x = π(ξ)ꎬ 使得假设 2 成立ꎻ其次ꎬ设计控制 律ꎬ使得流形 M 为不变吸引流形ꎬ并且闭环系统有 界.显然ꎬ应用 I&I 方法时ꎬ需要根据目标系统的选 取ꎬ通过求解偏微分方程进而确定浸入映射 π()ꎬ 而这往往是比较困难的.幸运的是ꎬ很多情况下根据 原系统和控制目标物理原理及系统理论的知识来选 择目标系统可以大大简化该问题.该方法特别适用 于对被控对象的降阶系统设计稳定控制器的情 形[2 ̄3] .图 1 是 I&I 方法的一个形象描述ꎬ原系统是 一个 n 维系统(图中 n = 3)ꎬ按照 I&I 理论ꎬ目标系 统可以选择 1 到 n-1 维任何一种情况.而基于 Lya ̄ punov 直接法的控制器设计方法可以看作是 I&I 方 法的一个特例ꎬ但设计控制律时需要选择Lyapunov 函数 V(x)ꎬ 该函数正定且其导数 V = α(V) < 0.从 I&I 理论的角度看ꎬI&I 方法是将一个在原点渐近稳 定的一维目标系统 V = α(V) 浸入到高维的原系统中. 图 1 浸入与不变方法 Fig.1 Graphical illustration of the immersion and in ̄ variance approach 第 5 期 刘振ꎬ等:浸入与不变方法原理及其在非线性自适应控制中的应用 401
·402· 智能系统学报 第8卷 1.2简单示例 按照上述的推导过程,可取 下面通过一个简单的例子来详细说明I&I镇定 K(x1,)=rxi+2. 的方法考虑系统: 式中:1≥1,12>0最终的1&I镇定控制律为 x1=f八x1,x2)=-x1-xi+x1x2, 山1=-(T1x+T2)x2 (6) (x2=u. 另外,原系统(6)的状态方程显然满足“下三 角”形式,因此可参考文献[l3],设计一种Backstep 式中:系统状态x=(x1,x,)T∈R,控制输入u∈R. ping控制律为 简单地计算可以得出,=(x,0)=-x1-x在 u=-2x-3x2+2x-2xx2 原点是渐近稳定的,因此可取目标系统为专=一专- 2种控制律的仿真结果如图2~4所示.初始状 (参考文献[2],这是对于此类系统选取目标系统 态都选为x=(4,3),其中图2和图3中I&I控制 的通常方法) 律的参数选为r1=1,2=2.可以看出,采用I&I方法 选择π,()=专,则偏微分方程(2)可以记为 设计的控制律不仅形式更为简单,而且镇定效果也 -ξ-E+π2(5)E=-5-53, 很出色.图4是I&I方法在不同参数下对应的状态 aπ2(5) 轨迹图,阴影部分代表不变流形z=0,轨迹图显示 ()= 出不同参数下该流形都具有不变性和吸引性. 通过第1个方程求出π2()=0.因此隐流形可以表 6 示为p(x)=x2: …Backstepping控制律 至此,假设1、假设2和假设3都已验证成立.根 1&1控制律 据式(3),流形外(off-he-manifold)动态方程可以表 示为:=元2=山.取u=-K(x1,x)z,其中K(x1, 6 P 10 x2)≥k>0,于是闭环系统的状态方程可以表示为 tis (a)状态x, 1=-1-x+x2, 15 x2=-K(x1,x2)x2, (7) 10 --…Backstepping控制律 1&I控制律 2=-K(x1,x2)z. 从式(7)的最后2个方程可以看出x2和z收敛 到零,因此式(4)成立.下面只需证明x,有界即可完 41s6 10 成I&I镇定设计.取 12 b)状态x W(1,x2)=V(x)+2近, 图2状态x的变化曲线 求导得 Fig.2 Time histories of the states x ×10 3 /,0)+ av W= av ,-K(x,x)x≤ --Backstepping控制律 I&I控制律 ,0)+y(x,)+ axi 1 av2 4 6 8 10 (8) tis y(x1)ax -K(x1,x2)x2 (a)全局 式中:y(x1)>0. ×10 取V(x1)=x/2,简单地推导可以得出,当取 -…Backstepping控制律 y(x1)=1,K(x1,x2)-x>0时,有W<0.至此可 一1&I控制律 证明x,有界,于是假设4成立.从式(8)可以看出, V(x1)不必选取x,=f八x1,0)的Lyapunov函数,而只 0.04 0.080.12 0.160.20 t/s 需保证V(x1)≥0,然后适当选取y和K使W<0即 (b)局部 可.在某些情况下,保证后者要比选取Lyapunov函 图3输入u的变化曲线 数简单 Fig.3 Time histories of the control input u
1.2 简单示例 下面通过一个简单的例子来详细说明 I&I 镇定 的方法.考虑系统: ̇x1 = f(x1 ꎬx2 ) = - x1 - x 3 1 + x1 x2 ꎬ ̇x2 { = u. (6) 式中:系统状态 x = x1 ꎬx2 ( ) T ∈ R 2 ꎬ控制输入 u ∈ R. 简单地计算可以得出 ̇x1 = f(x1 ꎬ0) = - x1 - x 3 1 在 原点是渐近稳定的ꎬ因此可取目标系统为 ̇ξ = - ξ - ξ 3 (参考文献[2]ꎬ这是对于此类系统选取目标系统 的通常方法). 选择 π1(ξ) = ξ ꎬ则偏微分方程(2)可以记为 - ξ - ξ 3 + π2(ξ)ξ = - ξ - ξ 3 ꎬ c(ξ) = ∂π2(ξ) ∂ξ ̇ξ. ì î í ï ï ïï 通过第 1 个方程求出 π2(ξ) = 0.因此隐流形可以表 示为 φ(x) = x2 . 至此ꎬ假设 1、假设 2 和假设 3 都已验证成立.根 据式(3)ꎬ流形外(off ̄the ̄manifold)动态方程可以表 示为 ̇ z = ̇x2 = u. 取 u = - K(x1 ꎬx2 )z ꎬ其中 K(x1 ꎬ x2 ) ≥ k > 0ꎬ于是闭环系统的状态方程可以表示为 ̇x1 = - x1 - x 3 1 + x2 ꎬ ̇x2 = - K(x1 ꎬx2 )x2 ꎬ ̇ z = - K(x1 ꎬx2 )z. ì î í ï ï ï ï (7) 从式(7)的最后 2 个方程可以看出 x2 和 z 收敛 到零ꎬ因此式(4)成立.下面只需证明 x1 有界即可完 成 I&I 镇定设计.取 W(x1 ꎬx2 ) = V(x1 ) + 1 2 x 2 2 ꎬ 求导得 W = ∂V ∂x1 f(x1 ꎬ0) + ∂V ∂x1 x1 x2 - K(x1 ꎬx2 )x 2 2 ≤ ∂V ∂x1 f(x1 ꎬ0) + γ(x1 )x 2 1 x 2 2 + 1 γ(x1 ) ∂V ∂x1 2 - K(x1 ꎬx2 )x 2 2 . (8) 式中: γ(x1 ) > 0. 取 V(x1 ) = x 2 1 / 2ꎬ 简单地推导可以得出ꎬ当取 γ(x1 ) = 1ꎬ K(x1 ꎬx2 ) - x 2 1 > 0 时ꎬ有 W 0.最终的 I&I 镇定控制律为 uI&I = - (r1 x 2 1 + r2 )x2 . 另外ꎬ原系统( 6) 的状态方程显然满足“下三 角”形式ꎬ因此可参考文献[13]ꎬ设计一种 Backstep ̄ ping 控制律为 ub = - 2x 2 1 - 3x2 + 2x 4 1 - 2x 2 1 x2 . 2 种控制律的仿真结果如图 2 ~ 4 所示.初始状 态都选为 x = (4ꎬ3) T ꎬ 其中图 2 和图 3 中 I&I 控制 律的参数选为 r1 = 1ꎬ r2 = 2.可以看出ꎬ采用 I&I 方法 设计的控制律不仅形式更为简单ꎬ而且镇定效果也 很出色.图 4 是 I&I 方法在不同参数下对应的状态 轨迹图ꎬ阴影部分代表不变流形 z =0ꎬ 轨迹图显示 出不同参数下该流形都具有不变性和吸引性. 图 2 状态 x 的变化曲线 Fig.2 Time histories of the states x 图 3 输入 u 的变化曲线 Fig.3 Time histories of the control input u 402 智 能 系 统 学 报 第 8 卷
第5期 刘振,等:浸入与不变方法原理及其在非线性自适应控制中的应用 ·403. 制方法与传统的基于确定等价原则的自适应控制方 -片=1.'2=2 法的不同。 -…1=5,2=2 …=1.2=5 考虑系统: x=01x2+02x+u. (9) 0 式中:日,02∈R是未知常数,设计控制律使闭环系 -1 统(9)在原点渐近稳定平衡. 4 如果采用基于确定等价原则的自适应控制方 2 法,可以设计状态反馈控制律和参数估计自适应律: 1 2 3 0 0 u=-0x2-02x-cx, 61=w1,a2=w2 图4状态轨迹 Fig.4 Trajectories of the states 式中:c>0.选择Lyapunov函数: 2浸入与不变自适应控制 Wxa.4)=+ 2(0-8,)2+ 2.1基本原理 2(0-6)3 1 对于系统(1),若函数f(·)和g(·)中含有未 式中:r1>0,12>0,求导整理得 知参数0∈R?,那么系统的镇定问题就变成含有未 知参数的自适应控制问题.定义如下假设: V=(0,-0)(x3-r1w)+ 假设5(可镇定性) 存在一个参数化的函数 (02-02)(x2-r2w2)-cx2 v(x,0),0∈R,使得系统 因此自适应律可以选为 x=f.(x)Af(x)+g(x)v(x,0) 13 01 有一个全局渐近稳定的平衡点x=x 如果系统(1)满足假设5,并且能找到函数 ,=2 B(·)和ω(·),使得如下扩展系统: (x=f(x)+g(x)v(x,0+B(x)), 此时有V=-cx2. i=w(x,0). 上述方法可以保证(x,0,02)=0是全局渐近 关于目标系统:专=f.()是I&I稳定的,那么系 稳定的.但它的一个缺点是参数估计误差-日的动 统(1)就被称为自适应浸入与不变(I&I)可镇定 态变化过程无法调节,而这一估计误差有时会严重 的 影响到闭环系统的瞬态响应.而&I自适应镇定可 在I&I自适应方法中,系统的未知参数0用0+ 以很好地解决这个问题。 B(x)来估计,相比传统的基于确定等价原则的自适 考虑如下扩展系统: 应控制方法多出额外一项B(x).B(x)的引入使得 x=0x2+02x+u, 整个参数估计律由单一的积分作用转变为比例积分 作用,设计估计律时更加灵活有效.另外,&I理论通 a=: (10) 过保持流形的不变性与吸引性来保证整个系统的稳 02=0: 定性,该思想同样也可以应用到参数估计自适应律 定义流形: 的设计上.通常在I&I自适应设计中选取未知参数 M={(x,01,02)∈R310,-01+B,(x)=0, 的估计值和真实值之间的差值作为不变流形,通过 保持该流形的不变与吸引性,可以保证估计误差有 02-02+B2(x)=0} 界甚至收敛到零。 式中:B,(x)和B2(x)是待选取的函数.若该流形能 2.2简单示例 够保持不变性,系统(10)的第1个式子可以表示为 下面通过一个简单的例子来说明I&I自适应控 x=(a+B,(x))x2+(a2+B2(x)x+u.(11)
图 4 状态轨迹 Fig.4 Trajectories of the states 2 浸入与不变自适应控制 2.1 基本原理 对于系统(1)ꎬ若函数 f() 和 g() 中含有未 知参数 θ ∈ R q ꎬ那么系统的镇定问题就变成含有未 知参数的自适应控制问题.定义如下假设: 假设 5(可镇定性) 存在一个参数化的函数 υ(xꎬθ)ꎬ θ ∈ R q ꎬ使得系统 x = f∗(x) f(x) + g(x)υ(xꎬθ) 有一个全局渐近稳定的平衡点 x = x∗. 如果系统 ( 1) 满足假设 5ꎬ 并且能找到函数 β() 和 ω()ꎬ 使得如下扩展系统: : x = f(x) + g(x)υ(xꎬθ ^ + β(x))ꎬ θ ^ = ω(xꎬθ ^ ). { 关于目标系统 ΣT : ̇ξ = f∗(ξ) 是 I&I 稳定的ꎬ那么系 统(1) 就被称为自适应浸入与不变( I&I) 可镇定 的[2] . 在 I&I 自适应方法中ꎬ系统的未知参数 θ 用 θ ^ + β(x) 来估计ꎬ相比传统的基于确定等价原则的自适 应控制方法多出额外一项 β(x). β(x) 的引入使得 整个参数估计律由单一的积分作用转变为比例积分 作用ꎬ设计估计律时更加灵活有效.另外ꎬI&I 理论通 过保持流形的不变性与吸引性来保证整个系统的稳 定性ꎬ该思想同样也可以应用到参数估计自适应律 的设计上.通常在 I&I 自适应设计中选取未知参数 的估计值和真实值之间的差值作为不变流形ꎬ通过 保持该流形的不变与吸引性ꎬ可以保证估计误差有 界甚至收敛到零. 2.2 简单示例 下面通过一个简单的例子来说明 I&I 自适应控 制方法与传统的基于确定等价原则的自适应控制方 法的不同. 考虑系统: ̇x = θ1 x 2 + θ2 x + u. (9) 式中: θ1 ꎬθ2 ∈ R 是未知常数ꎬ设计控制律使闭环系 统(9)在原点渐近稳定平衡. 如果采用基于确定等价原则的自适应控制方 法ꎬ可以设计状态反馈控制律和参数估计自适应律: u = - ^θ1 x 2 - ^θ2 x - cxꎬ ^θ 1 = ω1 ꎬ ^θ 2 = ω2 . ì î í ïï ï 式中: c > 0.选择 Lyapunov 函数: V(xꎬ ^θ1 ꎬ ^θ2 ) = 1 2 x 2 + 1 2 r1 ( ^θ1 - θ1 ) 2 + 1 2 r2 ( ^θ2 - θ2 ) 2 . 式中: r1 > 0ꎬr2 > 0ꎬ求导整理得 V = ( ^θ1 - θ1 )(x 3 - r1ω1 ) + ( ^θ2 - θ2 )(x 2 - r2ω2 ) - cx 2 . 因此自适应律可以选为 ω1 = 1 r1 x 3 ꎬ ω2 = 1 r2 x 2 . ì î í ï ïï ï ï 此时有 V = - cx 2 . 上述方法可以保证 (xꎬ ^θ1 ꎬ ^θ2 ) = 0 是全局渐近 稳定的.但它的一个缺点是参数估计误差 ^θ - θ 的动 态变化过程无法调节ꎬ而这一估计误差有时会严重 影响到闭环系统的瞬态响应.而 I&I 自适应镇定可 以很好地解决这个问题. 考虑如下扩展系统: ̇x = θ1 x 2 + θ2 x + uꎬ ^θ 1 = ω1 ꎬ ^θ 2 = ω2 . ì î í ï ï ï ï ïï (10) 定义流形: M = (xꎬ ^θ1 ꎬ ^θ2 ) ∈ R 3 | ^θ1 - θ 1 { + β1(x) = 0ꎬ ^θ2 - θ 2 + β2(x) = 0} . 式中: β1(x) 和 β2(x) 是待选取的函数.若该流形能 够保持不变性ꎬ系统(10)的第 1 个式子可以表示为 ̇x = ( ^θ1 + β1(x))x 2 + ( ^θ2 + β2(x))x + u. (11) 第 5 期 刘振ꎬ等:浸入与不变方法原理及其在非线性自适应控制中的应用 403
·404 智能系统学报 第8卷 此时,系统(11)中的各个参数都是已知的,因 式中:r>0,代入式(16),有 此可以设计控制律: V=-r(z1x2+2x)2≤0 u=-cx-(01+B,(x))x2-(02+B2(x)x 至此,采用I&I自适应方法的控制律设计完毕 式中:c>0. 2种控制律的仿真结果如图5和图6.初始状态 现在只需设计自适应律ω1、ω2和额外项 为x=3,未知参数的真值为(01,02)=(5,3),但初 B,(x)、B2(x),使得M流形具有不变性和吸引性, 始估计值都选为零.基于确定等价原则的自适应控 就可以保证闭环系统在原点是渐近稳定的流形外 制律参数选为71=r2=1,c=2,1&I自适应控制律参 数选为r=1,c=2.从图中可以看出,I&I自适应控制 的方程为 器比传统的自适应控制器镇定效果更佳,而且对未 1=a-01+B,(x), 知参数的估计也更为准确.需要说明的是,&I自适 (12) a2=02-02+B2(x). 应控制中,参数估计值并不能绝对收敛到真值,有关 这个问题可参见文献[12,14] 对式(12)求导,得 那(x) 6 =0+ (0,+B,(x)-1)x2+ …传统自适应控制 Ox 18I自适应控制 (02+B,(x)-22)x+u), (13) aβ2(x) 2=w2+ ar(8,+B,()-)2+ 0 0.51.01.52.0 2.53.0 3.54.0 t/s (02+B2(x)-22)x+u) (a)状态x 选取 -50 …传统自适应控制 aB,(x) (a+B(x)x2+(a+B2(x)x+u), -100 一1&自适应控制 x -1505 B2(x) -200月 (色+B,(x)x2+(a,+B,(x)x+u). ax -250 0.51.01.52.02.53.03.54.0 (14) 11s 将式(14)代入式(13),得 (b)输人u aB (x) 图5状态x及输入u的变化曲线 21 Ox (ax2+2x), Fig.5 Time histories of the states x and the control input u (15) a那2(x) (z1x2+z2x). 15r 对于式(l5),考虑Lyapunov函数: 10 传统自适应控制 I&I自适应控制 1 V(z1,2)= 0 0.51.01.52.02.53.03.54.0 有 t/s =-9,(x) (a)参数估计0 (21x2+22x)a1- ax a那2(x (21x2+2x)22 (16) Ox …传统自适应控制 取 一1&1自适应控制 aB,(x) 0 0.51.01.52.02.53.03.54.0 =x2, t/s dx (b)参数估计a, aβ2(x) =rX. 图6参数估计曲线 ax Fig.6 Parameter estimate curves
此时ꎬ系统(11) 中的各个参数都是已知的ꎬ因 此可以设计控制律: u = - cx - ( ^θ1 + β1(x))x 2 - ( ^θ2 + β2(x))x. 式中: c > 0. 现在 只 需 设 计 自 适 应 律 ω1 、 ω2 和 额 外 项 β1(x)、 β2(x) ꎬ使得 M 流形具有不变性和吸引性ꎬ 就可以保证闭环系统在原点是渐近稳定的.流形外 的方程为 z1 = ^θ1 - θ1 + β1(x)ꎬ z2 = ^θ2 - θ2 { + β2(x). (12) 对式(12)求导ꎬ得 ̇ z1 = ω1 + ∂β1(x) ∂x ( ^θ1 + β1(x) - z1 )x 2 ( + ( ^θ2 + β2(x) - z2 )x + u)ꎬ ̇ z2 = ω2 + ∂β2(x) ∂x ( ^θ1 + β1(x) - z1 )x 2 ( + ( ^θ2 + β2(x) - z2 )x + u) . ì î í ï ï ï ïï ï ï ï ïï (13) 选取 ω1 = - ∂β1(x) ∂x ( ^θ1 + β1(x))x 2 ( + ( ^θ2 + β2(x))x + u) ꎬ ω2 = - ∂β2(x) ∂x ( ^θ1 + β1(x))x 2 ( + ( ^θ2 + β2(x))x + u) . ì î í ï ïï ï ï (14) 将式(14)代入式(13)ꎬ得 ̇ z1 = - ∂β1(x) ∂x z1 x 2 + z2 ( x) ꎬ ̇ z2 = - ∂β2(x) ∂x z1 x 2 + z2 ( x) . ì î í ï ïï ï ï (15) 对于式(15)ꎬ考虑 Lyapunov 函数: V(z1 ꎬz2 ) = 1 2 z 2 1 + 1 2 z 2 2 ꎬ 有 V = - ∂β1(x) ∂x z1 x 2 + z2 ( x) z1 - ∂β2(x) ∂x z1 x 2 + z2 ( x) z2 . (16) 取 ∂β1(x) ∂x = rx 2 ꎬ ∂β2(x) ∂x = rx. ì î í ï ïï ï ï 式中: r > 0ꎬ代入式(16)ꎬ有 V = - r (z1 x 2 + z2 x) 2 ≤ 0 至此ꎬ采用 I&I 自适应方法的控制律设计完毕. 2 种控制律的仿真结果如图 5 和图 6.初始状态 为 x = 3ꎬ未知参数的真值为 (θ 1 ꎬθ 2 ) = (5ꎬ3)ꎬ 但初 始估计值都选为零.基于确定等价原则的自适应控 制律参数选为 r1 = r2 = 1ꎬc = 2ꎬI&I 自适应控制律参 数选为 r = 1ꎬc = 2.从图中可以看出ꎬI&I 自适应控制 器比传统的自适应控制器镇定效果更佳ꎬ而且对未 知参数的估计也更为准确.需要说明的是ꎬI&I 自适 应控制中ꎬ参数估计值并不能绝对收敛到真值ꎬ有关 这个问题可参见文献[12ꎬ14]. 图 5 状态 x 及输入 u 的变化曲线 Fig.5 Time histories of the states x and the control input u 图 6 参数估计曲线 Fig.6 Parameter estimate curves 404 智 能 系 统 学 报 第 8 卷
第5期 刘振,等:浸入与不变方法原理及其在非线性自适应控制中的应用 ·405· 3 基于I&[的未知点质量系统非线性 对式(18)求导,整理得 自适应控制 之1=ω1+ p,+B(e0,+04w+w), 2+ 0x2 3.1模型描述 2,那 考虑一个水平放置的未知点质量系统m受到 22=w2+ x2+ (p'01+022v+v)+ dx 0, 控制输入力“、未知常值干扰力d、未知粘滞阻力 (23) kx以及未知弹性力k,x的作用按照牛顿定律,建立 取自适应律: 模型1]: m求=u+d-kx-kx. (17) B,-B(p'(0,+B,)+w), 式中:m、k。、k,都是未知正常数,d是未知常数控 制任务为设计反馈控制律,使x渐近跟踪参考信 02=- a那2 (e(0,+B)+u) 号x 2x2x 那 ax 二01 a01 3.2I&I自适应控制律设计 (24) 模型(17)可以表示成 将式(24)代入式(23),得 x1=x2, aB (g'z1-02w), dx x2=02u+p'0 (25) 式中:x=x,82=1/m,p=(-x1,-x2,1)T,01= 3- (pz1-8z) 0x2 (k,/m,k,/m,d/m)'.0,、02为未知参数,取自适应 取 律为 aB 8x2 =T1P, 01=01, aB 02=02 8x ,=-T2u. 并且令0、0的估计分别为01+B,(x)、02+ 式中:r1>0,12>0.整理得 B,(x,01),则未知参数的估计误差为 B=(-,-7) 21=01+B(x)-01, (18) + 32=02+B2(x,01)-021 B,=(-,-7)0+(c+A) 跟踪误差设为无=x1一x,·若存在 (-Cx,+c入x1-c入x,-元,-入x,)x2+ s=元+入元=0,入>0, 则跟踪误差渐近收敛到零.对上式求导,整理得 r22t8 + ) 2 s=(02u+p01)-元+A(x2-x,).(19) 将B,代入式(24)的第1个式子可以得到ω1, 取控制律 然后根据式(22)可以求出v,最后可以求出B2、w2: u=(02+B2(x,01))u. (20) 3.3稳定性分析 将式(18)和式(20)代入式(19),得 将式(21)和式(25)重新整理,得 $=022v+v+p'(01+B(x)-z1)- s=-cs-Φ(x,01)z, 元,+入(x2-x,) (21) E=-(x,01)(x,01)z 可选取 式中:z=(,2)T,(x,0)=(,-02v)T, v=-(p'(01+B(x))-龙,+入(x2-x,)+cs). I=diag(r3). (22) 取Lyapunov函数: 式中:c>0. 接下来需要设计参数自适应律ω,、ω2以及额 Ws=2+cr 外项B,(x)、B2(x,01). 求导整理得
3 基于 I&I 的未知点质量系统非线性 自适应控制 3.1 模型描述 考虑一个水平放置的未知点质量系统 m 受到 控制输入力 u 、未知常值干扰力 d 、未知粘滞阻力 kv ̇x 以及未知弹性力 kp x 的作用.按照牛顿定律ꎬ建立 模型[15] : mx¨ = u + d - kp x - kv ̇x. (17) 式中: m 、 kv 、 kp 都是未知正常数ꎬ d 是未知常数.控 制任务为设计反馈控制律ꎬ使 x 渐近跟踪参考信 号 xr . 3.2 I&I 自适应控制律设计 模型(17)可以表示成 ̇x1 = x2 ꎬ ̇x2 = θ2 u + φ T θ1 { . 式中: x1 = xꎬ θ2 = 1 / mꎬ φ = - x1 ꎬ - x ( 2 ꎬ1) T ꎬ θ1 = kp / mꎬkv ( / mꎬd / m) T . θ1 、 θ 2 为未知参数ꎬ取自适应 律为 θ ^ 1 = ω1 ꎬ θ ^ 2 = ω2 . ì î í ï ï ïï 并且令 θ1 、 θ -1 2 的估计分别为 θ ^ 1 + β1(x) 、 ^θ2 + β2(xꎬθ ^ 1 ) ꎬ则未知参数的估计误差为 z1 = θ ^ 1 + β1(x) - θ1 ꎬ z2 = ^θ2 + β2(xꎬθ ^ 1 ) - θ -1 2 . { (18) 跟踪误差设为 x ~ = x1 - xr . 若存在 s = x ~ + λx ~ = 0ꎬλ > 0ꎬ 则跟踪误差渐近收敛到零.对上式求导ꎬ整理得 s = (θ 2 u + φ T θ1 ) - x¨ r + λ(x2 - ̇xr). (19) 取控制律 u = ( ^θ2 + β2(xꎬθ ^ 1 ))υ. (20) 将式(18)和式(20)代入式(19)ꎬ得 s = θ 2 z2 υ + υ + φ T (θ ^ 1 + β1(x) - z1 ) - x¨ r + λ(x2 - ̇xr). (21) 可选取 υ = - (φ T (θ ^ 1 + β1(x)) - x¨ r + λ(x2 - ̇xr) + cs). (22) 式中: c > 0. 接下来需要设计参数自适应律 ω1 、 ω2 以及额 外项 β1(x) 、 β2(xꎬθ ^ 1 ) . 对式(18)求导ꎬ整理得 z1 = ω1 + ∂β1 ∂x1 x2 + ∂β1 ∂x2 (φ T θ1 + θ2 z2υ + υ)ꎬ z2 = ω2 + ∂β2 ∂x1 x2 + ∂β2 ∂x2 (φ T θ1 + θ2 z2υ + υ) + ∂β2 ∂θ ^ 1 ω1 . ì î í ï ï ï ï ïï (23) 取自适应律: θ ^ 1 = - ∂β1 ∂x1 x2 - ∂β1 ∂x2 (φ T (θ ^ 1 + β1 ) + υ)ꎬ ^θ 2 = - ∂β2 ∂x1 x2 - ∂β2 ∂x2 (φ T (θ ^ 1 + β1 ) + υ) - ∂β2 ∂θ ^ 1 ω1 . ì î í ï ï ï ï ïï (24) 将式(24)代入式(23)ꎬ得 z1 = - ∂β1 ∂x2 (φ T z1 - θ 2 z2 υ)ꎬ z2 = - ∂β2 ∂x2 (φ T z1 - θ 2 z2 υ). ì î í ï ïï ï ïï (25) 取 ∂β1 ∂x2 = r1φꎬ ∂β2 ∂x2 = - r2 υ. ì î í ï ïï ï ïï 式中: r1 > 0ꎬ r2 > 0.整理得 β1 = r1( - x1 x2 ꎬ - x 2 2 2 ꎬx2 ) T ꎬ β2 = r2(( - x1 x2 ꎬ - x 2 2 2 ꎬx2 ) θ ^ 1 + (c + λ) x 2 2 2 + ( - c ̇xr + cλx1 - cλxr - x¨ r - λ̇xr)x2 + r1 r2( x 2 1 x 2 2 2 + x 4 2 8 + x 2 2 2 )). ì î í ï ï ï ï ï ï ï ï ï ï 将 β1 代入式(24)的第 1 个式子可以得到 ω1 ꎬ 然后根据式(22)可以求出 υꎬ 最后可以求出 β2 、 ω2 . 3.3 稳定性分析 将式(21)和式(25)重新整理ꎬ得 s = - cs - Φ T (xꎬθ ^ 1 )zꎬ ̇ z = - ΓΦ(xꎬθ ^ 1 )Φ T (xꎬθ ^ 1 )z. { 式中: z = (z T 1 ꎬz2 ) T ꎬ Φ(xꎬ θ ^ 1 ) = φ T ꎬ - θ ( 2 υ ) T ꎬ Γ =diag(r1 I3×3 ꎬr2 θ -1 2 ). 取 Lyapunov 函数: V(sꎬz) = 1 2 s 2 + c -1 z TΓ -1 z. 求导整理得 第 5 期 刘振ꎬ等:浸入与不变方法原理及其在非线性自适应控制中的应用 405
·406· 智能系统学报 第8卷 ×10 V=-cs2-sΦ(x,0,)z-2c1((x,01)z)2≤ …传统自适应控制 2 一1&I自适应控制 -g+2+2ox0加P-2o.0,aP= 0 4 6 10 tis (C)输人4 因此,在选定c>0后,s、z在原点都是渐近稳 图7状态x和输入u变化曲线 定,进而可知跟踪误差limx(t)=0. Fig.7 Time histories of the states and the control input 3.4仿真分析 0 仿真实验采用文献[14]中所设计的基于确定 -5 等价原则的传统自适应控制器,与I&I自适应控制 -10 -15 器比较,仿真结果如图7~10.未知点质量模型的初 -20 0 6 10 始状态为(x1,x2)=(0,0),参数选为(m,k。,k,d)= 1s (a)s (10,1,1,1),但初始估计值都选为零,参考指令为 20 x,=10.文献[15]中自适应控制律参数选为k,=1, 0 k2=2,k3=1,I&I自适应控制律参数选为r1=1,c= 2,2=1,入=2. -20 图7(a)、(b)和(c)分别是状态x1、x2和输入u -40 0 46 10 在2种控制律下随时间的变化曲线.可以看出,在输 1/s 入允许的情况下,I&I自适应控制律使得状态x1更 b)Φ'(x,0)z 快地跟踪到参考值,显示出更好的控制效果.图8 图8s和(x,01)z的变化曲线 (a)和(b)分别是s和④(x,0,)z随时间的变化曲 Fig.8 Time histories ofs and (x,0 )z 线.曲线显示s和Φ(x,1)z最终都收敛于零,按照 上节推导过程可知,这是跟踪误差元趋于零的必要 40 条件.图9是1&1自适应控制方法的状态轨迹图,阴 20 影部分代表流形Φ(x,8)z=0,可以看出流形对状 态轨迹具有吸引性,并且当达到(x1,x2)=(10,0) -20 后,系统状态进入流形并维持不变,即流形不变.应 40 当说明的是,(x,01)z=0并不意味着z=0,也就 10 15 是说并不能保证参数估计到真值.图10进一步说明 0 5 10 X: 0 了这个问题,I&I自适应控制律的参数估计值收敛 -5 到某一个固定值,而并非一定是真实值同样,关于 图9状态轨迹 这个问题可参考文献[12,14]. Fig.9 Trajectory of the states 12f 10 …传统自适应控制 一&1自适应控制 8 一估计值 4 ……川真实值 6 810 1/s -…么估计值 (a)状态x A真实值 4 0 传统自适应控制 一I&1自适应控制 4 6 8 10 1s 4 6 810 1/s 图10参数估计曲线 (b)状态x2 Fig.10 Parameter estimate curves
V = - cs 2 - sΦ(xꎬθ ^ 1 )z - 2c -1 (Φ(xꎬθ ^ 1 )z) 2 ≤ - cs 2 + 1 2 cs 2 + 1 2 c -1 (Φ(xꎬθ ^ 1)z) 2 - 2c -1 (Φ(xꎬθ ^ 1)z] 2 = - 1 2 cs 2 - 3 2 c -1 (Φ(xꎬθ ^ 1)z) 2 . 因此ꎬ在选定 c > 0 后ꎬ s 、 z 在原点都是渐近稳 定ꎬ进而可知跟踪误差 lim t→¥ x ~ (t) = 0. 3.4 仿真分析 仿真实验采用文献[14] 中所设计的基于确定 等价原则的传统自适应控制器ꎬ与 I&I 自适应控制 器比较ꎬ仿真结果如图 7 ~ 10.未知点质量模型的初 始状态为(x1ꎬx2 ) = (0ꎬ0)ꎬ参数选为(mꎬkpꎬkvꎬd)= (10ꎬ1ꎬ1ꎬ1)ꎬ但初始估计值都选为零ꎬ参考指令为 xr = 10.文献[15]中自适应控制律参数选为 k1 = 1ꎬ k2 = 2ꎬk3 = 1ꎬI&I 自适应控制律参数选为 r1 = 1ꎬc = 2ꎬr2 = 1ꎬλ = 2. 图 7(a)、(b)和(c)分别是状态 x1 、 x2 和输入 u 在 2 种控制律下随时间的变化曲线.可以看出ꎬ在输 入允许的情况下ꎬI&I 自适应控制律使得状态 x1 更 快地跟踪到参考值ꎬ显示出更好的控制效果. 图 8 (a)和( b) 分别是 s 和 Φ(xꎬθ ^ 1 )z 随时间的变化曲 线.曲线显示 s 和 Φ(xꎬθ ^ 1 )z 最终都收敛于零ꎬ按照 上节推导过程可知ꎬ这是跟踪误差 x ~ 趋于零的必要 条件.图 9 是 I&I 自适应控制方法的状态轨迹图ꎬ阴 影部分代表流形 Φ(xꎬθ ^ 1 )z = 0ꎬ 可以看出流形对状 态轨迹具有吸引性ꎬ并且当达到 (x1 ꎬx2 ) = (10ꎬ0) 后ꎬ系统状态进入流形并维持不变ꎬ即流形不变.应 当说明的是ꎬ Φ(xꎬθ ^ 1 )z = 0 并不意味着 z = 0ꎬ 也就 是说并不能保证参数估计到真值.图 10 进一步说明 了这个问题ꎬI&I 自适应控制律的参数估计值收敛 到某一个固定值ꎬ而并非一定是真实值.同样ꎬ关于 这个问题可参考文献[12ꎬ14]. 图 7 状态 x 和输入 u 变化曲线 Fig. 7 Time histories of the states and the control input 图 8 s 和 Φ(xꎬθ ^ 1 )z 的变化曲线 Fig.8 Time histories of s and Φ(xꎬθ ^ 1 )z 图 10 参数估计曲线 Fig.10 Parameter estimate curves 图 9 状态轨迹 Fig.9 Trajectory of the states 406 智 能 系 统 学 报 第 8 卷
第5期 刘振,等:浸入与不变方法原理及其在非线性自适应控制中的应用 ·407. [10]LIU Xiangbin,ORTEGA R,SU Hongye,et al.Immersion 4 结束语 and invariance adaptive control of nonlinearly parameter- 浸入与流形不变方法在一定程度上解决了构造 ized nonlinear systems[J].IEEE Transactions on Automat- 控制Lyapunov函数的难题,非常适用于能够对降阶 ic Control,2010,55(9):2209-2214. 系统设计稳定控制器的情形.在自适应控制方面, [11]樊小红,巨永锋,高云霞.Markov跳变系统的稳定自适 I&I理论不依赖于确定等价原则,即参数的估计值 应控制研究[J].计算机工程与设计,2011,32(6): 并不完全由参数自适应律获得,而是引入一个额外 2104-2107. 非线性函数,提高了参数估计的有效性.另外,I&I自 FAN Xiaohong,JU Yongfeng,GAO Yunxia.Stable adap- tive control for class of Markov jump system[J].Computer 适应控制器包括控制律和参数估计器2个独立的模 Engineering and Design,2011,32(6):2104-2107. 块,可以分别进行设计,这样使得控制参数的调整也 [12]LEE K,SINGH S.Noncertainty-equivalent adaptive mis- 比基于Lyapunov设计理论容易许多.将该方法应用 sile control via immersion and invariance[].Journal of 于未知点质量系统,仿真结果表明了该方法能有效 Guidance,Control,and Dynamics,2010,33(3):655- 地处理模型的未知参数带来的不确定性.需要指出 665. 的是,该方法也可扩展用于非线性参数化模型及带 [13]KHALIL H K.Nonlinear systems M].3rd ed.[S.1.] 有其他不确定性的非线性系统中, Prentice Hall,2002:589-593. 参考文献: [14]SEO D,AKELLA M.High-performance spacecraft adap- tive attitude-tracking control through attracting-manifold [1]ISIDORI A.Nonlinear control systems:an introduction[M]. design[J].Journal of Guidance,Control,and Dynamics, Berlin:Springer,1985:II-IV. 2008,31(4):884-891. [2]ASTOLFI A,ORTEGA R.Immersion and invariance:a new [I5]MARINO R,TOMEI P.非线性系统设计—微分几何、 tool for stabilization and adaptive control of nonlinear sys- 自适应及鲁棒控制[M].姚郁,贺风华,译.北京:电子 temsJ.IEEE Transactions on Automatic Control,2003. 工业出版社,2006:108-109. 48(4):590-606. 作者简介: [3]ASTOLFI A,KARAGIANNIS D,ORTEGA R.Nonlinear 刘振,男,1987年生,博士研究生, and adaptive control with applications[M].London:Spring- 主要研究方向为自适应控制、智能控 er.2007:15-54. 制、非线性控制 [4]ASTOLFI A,KARAGIANNIS D,ORTEGA R.Tawards ap- plied nonlinear adaptive control [J].Annual Reviews in Control,2008,32(2):136-148. [5]尚安利,梁勇,顾文锦,等.导弹非线性控制系统设计方法 研究[J].飞行力学,2004,22(4):4144. SHANG Anli,LIANG Yong,GU Wenjin,et al.Study of 谭湘敏,男,1982年生,高级工程 missile nonlinear control system design[J].Flight Dynam- 师,主要研究方向为自适应控制、智能 ics,2004,22(4):41-44. 机器人技术,发表学术论文10余篇. [6]SARRAS I.On the stabilization of nonholonomie mechanical systems via immersion and invariance[C]//The 18th IFAC World Congress.Milano,Italy,2011:7227-7232. [7]ASTOLFI A,ORTEGA R,VENKATRAMAN A.A globally exponentially convergent immersion and invariance speed 易建强,男,1963年生,研究员,博 observer for mechanical systems with non-holonomic con- 士生导师,EEE高级会员,担任多个学 straints[J].Automatica,2010,46(1):182-189. 术期刊的编委,主要研究方向为智能控 [8]KOBAYASHI Y,TAKAHASHI M.Design of nonlinear a- 制方法、自适应控制方法、智能机器人 daptive flight control system based on immersion and invari- 技术等.承担与完成了国家“863”计划 ance[C]//AIAA Guidance,Navigation,and Control Con- 项目、国家自然科学基金项目、中科院 ference.Chicago,USA,2009:AIAA-2009-6174. 知识创新项目及企业合作项目等多项.发表学术论文300余 [9]SONNEVELDT L,OORT E,CHU Q,et al.Immersion and 篇,其中被SCI检索50余篇、EI检索200余篇,获授权国家 invariance based nonlinear adaptive flight control[C]/ 发明专利和实用新型专利30余项,合作出版专著1部. AlAA Guidance,Navigation,and Control Conference.To- ronto,Canada,2010:AIAA-2010-7690
4 结束语 浸入与流形不变方法在一定程度上解决了构造 控制 Lyapunov 函数的难题ꎬ非常适用于能够对降阶 系统设计稳定控制器的情形.在自适应控制方面ꎬ I&I 理论不依赖于确定等价原则ꎬ即参数的估计值 并不完全由参数自适应律获得ꎬ而是引入一个额外 非线性函数ꎬ提高了参数估计的有效性.另外ꎬI&I 自 适应控制器包括控制律和参数估计器 2 个独立的模 块ꎬ可以分别进行设计ꎬ这样使得控制参数的调整也 比基于 Lyapunov 设计理论容易许多.将该方法应用 于未知点质量系统ꎬ仿真结果表明了该方法能有效 地处理模型的未知参数带来的不确定性.需要指出 的是ꎬ该方法也可扩展用于非线性参数化模型及带 有其他不确定性的非线性系统中. 参考文献: [1]ISIDORI A. Nonlinear control systems: an introduction[M]. Berlin: Springerꎬ 1985: Ⅲ ̄Ⅳ. [2]ASTOLFI Aꎬ ORTEGA R. Immersion and invariance: a new tool for stabilization and adaptive control of nonlinear sys ̄ tems[ J]. IEEE Transactions on Automatic Controlꎬ 2003ꎬ 48(4): 590 ̄606. [3] ASTOLFI Aꎬ KARAGIANNIS Dꎬ ORTEGA R. Nonlinear and adaptive control with applications[M]. London: Spring ̄ erꎬ 2007: 15 ̄54. [4]ASTOLFI Aꎬ KARAGIANNIS Dꎬ ORTEGA R. Tawards ap ̄ plied nonlinear adaptive control [ J ]. Annual Reviews in Controlꎬ 2008ꎬ 32(2): 136 ̄148. [5]尚安利ꎬ梁勇ꎬ顾文锦ꎬ等.导弹非线性控制系统设计方法 研究[J].飞行力学ꎬ 2004ꎬ 22(4): 41 ̄44. SHANG Anliꎬ LIANG Yongꎬ GU Wenjinꎬ et al. Study of missile nonlinear control system design[ J]. Flight Dynam ̄ icsꎬ 2004ꎬ 22(4): 41 ̄44. [6]SARRAS I. On the stabilization of nonholonomic mechanical systems via immersion and invariance[C] / / The 18th IFAC World Congress. Milanoꎬ Italyꎬ 2011: 7227 ̄7232. [7]ASTOLFI Aꎬ ORTEGA Rꎬ VENKATRAMAN A. A globally exponentially convergent immersion and invariance speed observer for mechanical systems with non ̄holonomic con ̄ straints[J]. Automaticaꎬ 2010ꎬ 46(1): 182 ̄189. [8] KOBAYASHI Yꎬ TAKAHASHI M. Design of nonlinear a ̄ daptive flight control system based on immersion and invari ̄ ance[C] / / AIAA Guidanceꎬ Navigationꎬ and Control Con ̄ ference. Chicagoꎬ USAꎬ 2009: AIAA ̄2009 ̄6174. [9]SONNEVELDT Lꎬ OORT Eꎬ CHU Qꎬ et al. Immersion and invariance based nonlinear adaptive flight control[C] / / AIAA Guidanceꎬ Navigationꎬ and Control Conference. To ̄ rontoꎬ Canadaꎬ 2010: AIAA ̄2010 ̄7690. [10]LIU Xiangbinꎬ ORTEGA Rꎬ SU Hongyeꎬ et al. Immersion and invariance adaptive control of nonlinearly parameter ̄ ized nonlinear systems[J]. IEEE Transactions on Automat ̄ ic Controlꎬ 2010ꎬ 55(9): 2209 ̄2214. [11]樊小红ꎬ巨永锋ꎬ高云霞.Markov 跳变系统的稳定自适 应控制研究[ J]. 计算机工程与设计ꎬ 2011ꎬ 32 ( 6): 2104 ̄2107. FAN Xiaohongꎬ JU Yongfengꎬ GAO Yunxia. Stable adap ̄ tive control for class of Markov jump system[J]. Computer Engineering and Designꎬ 2011ꎬ 32(6): 2104 ̄2107. [12] LEE Kꎬ SINGH S. Noncertainty ̄equivalent adaptive mis ̄ sile control via immersion and invariance [ J]. Journal of Guidanceꎬ Controlꎬ and Dynamicsꎬ 2010ꎬ 33 ( 3): 655 ̄ 665. [13] KHALIL H K. Nonlinear systems [ M]. 3rd ed. [ S. l.]: Prentice Hallꎬ 2002: 589 ̄593. [14] SEO Dꎬ AKELLA M. High ̄performance spacecraft adap ̄ tive attitude ̄tracking control through attracting ̄manifold design[J]. Journal of Guidanceꎬ Controlꎬ and Dynamicsꎬ 2008ꎬ 31(4): 884 ̄891. [15]MARINO Rꎬ TOMEI P. 非线性系统设计———微分几何、 自适应及鲁棒控制[M]. 姚郁ꎬ贺风华ꎬ译.北京:电子 工业出版社ꎬ 2006: 108 ̄109. 作者简介: 刘振ꎬ男ꎬ1987 年生ꎬ博士研究生ꎬ 主要研究方向为自适应控制、智能控 制、非线性控制. 谭湘敏ꎬ男ꎬ1982 年生ꎬ高级工程 师ꎬ主要研究方向为自适应控制、智能 机器人技术ꎬ发表学术论文 10 余篇. 易建强ꎬ男ꎬ1963 年生ꎬ研究员ꎬ博 士生导师ꎬIEEE 高级会员ꎬ担任多个学 术期刊的编委ꎬ主要研究方向为智能控 制方法、自适应控制方法、智能机器人 技术等.承担与完成了国家“863” 计划 项目、国家自然科学基金项目、中科院 知识创新项目及企业合作项目等多项.发表学术论文 300 余 篇ꎬ其中被 SCI 检索 50 余篇、EI 检索 200 余篇ꎬ获授权国家 发明专利和实用新型专利 30 余项ꎬ合作出版专著 1 部. 第 5 期 刘振ꎬ等:浸入与不变方法原理及其在非线性自适应控制中的应用 407