D0I:10.13374/.issn1001-053x.2012.01.005 第34卷第1期 北京科技大学学报 Vol.34 No.1 2012年1月 Journal of University of Science and Technology Beijing Jan.2012 基于积分型Lyapunov函数的随机非线性系统的自适 应控制 王飞 张天平四 施枭铖 扬州大学信息工程学院自动化专业部,扬州225127 区通信作者,E-mail:pzhang(@yzu.cdu.cn 摘要针对一类带有未知虚拟控制增益的随机严格反馈非线性系统,基于后推设计,引入积分型Lyapunov函数,并利用 神经网络的逼近能力,提出了一种自适应神经网络控制方案.与现有研究结果相比,放宽了对控制系统的要求,取消了对于 未知函数的限制条件.通过Lyapunov方法证明了闭环系统的所有误差信号依概率有界.仿真结果验证了所给控制方案的有 效性. 关键词非线性系统:随机系统:自适应控制:神经网络:后推 分类号TP273·.2 Adaptive control for stochastic nonlinear systems based on the integral-type Lya- punov function WANG Fei,ZHANG Tian-ping,SHI Xiao-cheng Department of Automation,College of Information Engineering,Yangzhou University,Yanghou 225127,China Corresponding author,E-mail:tpzhang@yzu.edu.cn ABSTRACT Based on the backstepping technique,introducing the integral-type Lyapunov function and utilizing the approximation capability of neural networks,an adaptive neural network control scheme was proposed for a class of stochastic strict-feedback nonlinear systems with unknown virtual control gain.Compared with existing literatures,the proposed approach relaxes the requirements of the control system and cancels the restriction of the unknown function.By the Lyapunov method,it is shown that all error variables in the closed-loop system are bounded in probability.Simulation results illustrate the effectiveness of the proposed control scheme KEY WORDS nonlinear systems;stochastic systems:adaptive control;neural networks;backstepping 近年来,随机非线性系统己成为控制理论研究 题,但是其虚拟控制及控制律结构相对复杂.文献 的热点之一,如何将确定性系统的控制技术推广到 2]提出一种自适应神经网络控制方案来解决未 随机非线性系统已经成为一个公开的研究领域,并 知协方差噪声干扰的不确定非线性系统的输出跟踪 取得了一些研究成果-.随机系统Lyapunov函数 控制问题.文献3]解决了确定性系统中未知控制 设计的主要技术障碍在于伊藤随机微分不仅涉及梯 增益带来的问题,文献几4]针对一类带有未知虚拟 度项还涉及高阶Hessen矩阵项.文献l]应用后推 控制增益的随机非线性系统,提出了一种模糊自适 方法,首次解决了一类下三角型结构的随机非线性 应控制方法.但是其对未知函数条件要求比较 系统的镇定控制器设计问题.文献4-5]首次提出 严格. 采用四次型Lyapunov函数取代经典的二次函数进 本文基于后推设计方法和积分型Lyapunov函 行后推设计,并研究了输出反馈镇定问题.文献 数,并利用神经网络的逼近能力,提出一种自适应 控制方案,利用Lyapunov方法,证明闭环系统依概 ⑨一H0]研究了一类随机严格反馈非线性系统的自 率渐近稳定,跟踪误差收敛到一个小的残差集内 适应神经网络输出反馈镇定.文献1]研究了一类 与己有文献相比本文所研究的系统更一般,取消了 不确定随机非线性时滞系统的自适应有界镇定问 收稿日期:20110308 基金项目:国家自然科学基金资助项目(61174046:60904030)
第 34 卷 第 1 期 2012 年 1 月 北京科技大学学报 Journal of University of Science and Technology Beijing Vol. 34 No. 1 Jan. 2012 基于积分型 Lyapunov 函数的随机非线性系统的自适 应控制 王 飞 张天平 施枭铖 扬州大学信息工程学院自动化专业部,扬州 225127 通信作者,E-mail: tpzhang@ yzu. edu. cn 摘 要 针对一类带有未知虚拟控制增益的随机严格反馈非线性系统,基于后推设计,引入积分型 Lyapunov 函数,并利用 神经网络的逼近能力,提出了一种自适应神经网络控制方案. 与现有研究结果相比,放宽了对控制系统的要求,取消了对于 未知函数的限制条件. 通过 Lyapunov 方法证明了闭环系统的所有误差信号依概率有界. 仿真结果验证了所给控制方案的有 效性. 关键词 非线性系统; 随机系统; 自适应控制; 神经网络; 后推 分类号 TP273 + . 2 Adaptive control for stochastic nonlinear systems based on the integral-type Lyapunov function WANG Fei,ZHANG Tian-ping ,SHI Xiao-cheng Department of Automation,College of Information Engineering,Yangzhou University,Yangzhou 225127,China Corresponding author,E-mail: tpzhang@ yzu. edu. cn ABSTRACT Based on the backstepping technique,introducing the integral-type Lyapunov function and utilizing the approximation capability of neural networks,an adaptive neural network control scheme was proposed for a class of stochastic strict-feedback nonlinear systems with unknown virtual control gain. Compared with existing literatures,the proposed approach relaxes the requirements of the control system and cancels the restriction of the unknown function. By the Lyapunov method,it is shown that all error variables in the closed-loop system are bounded in probability. Simulation results illustrate the effectiveness of the proposed control scheme. KEY WORDS nonlinear systems; stochastic systems; adaptive control; neural networks; backstepping 收稿日期: 2011--03--08 基金项目: 国家自然科学基金资助项目( 61174046; 60904030) 近年来,随机非线性系统已成为控制理论研究 的热点之一,如何将确定性系统的控制技术推广到 随机非线性系统已经成为一个公开的研究领域,并 取得了一些研究成果[1--8]. 随机系统 Lyapunov 函数 设计的主要技术障碍在于伊藤随机微分不仅涉及梯 度项还涉及高阶 Hessen 矩阵项. 文献[1]应用后推 方法,首次解决了一类下三角型结构的随机非线性 系统的镇定控制器设计问题. 文献[4--5]首次提出 采用四次型 Lyapunov 函数取代经典的二次函数进 行后推设计,并研究了输出反馈镇定问题. 文献 [9--10]研究了一类随机严格反馈非线性系统的自 适应神经网络输出反馈镇定. 文献[11]研究了一类 不确定随机非线性时滞系统的自适应有界镇定问 题,但是其虚拟控制及控制律结构相对复杂. 文献 [12]提出一种自适应神经网络控制方案来解决未 知协方差噪声干扰的不确定非线性系统的输出跟踪 控制问题. 文献[13]解决了确定性系统中未知控制 增益带来的问题,文献[14]针对一类带有未知虚拟 控制增益的随机非线性系统,提出了一种模糊自适 应 控 制 方 法. 但是其对未知函数条件要求比较 严格. 本文基于后推设计方法和积分型 Lyapunov 函 数,并利用神经网络的逼近能力,提出一种自适应 控制方案,利用 Lyapunov 方法,证明闭环系统依概 率渐近稳定,跟踪误差收敛到一个小的残差集内. 与已有文献相比本文所研究的系统更一般,取消了 DOI:10.13374/j.issn1001-053x.2012.01.005
·22 北京科技大学学报 第34卷 文献5]对于未知函数在零点等于零的条件限制. 0)是二次可微的. 假设2期望的轨迹向量xa是连续的,且xa∈ 1问题描述及基本假设 CR,i=1,2,,n.其中xa=(ya,a…, 考虑如下随机非线性严格反馈系统: y)T,2是己知的有界闭集 dx;=(f()+g;)x)dt 本文中,未知光滑非线性函数业(x):R”→R将 h(x)dw,i=1,2,…,n-1; 在紧集2,上采用如下径向基函数神经网络进行 (1) dx=(f (+g (u)dt +h()dw; 逼近: y=x1- (x)=Wo(x)+s(x),YxEn .(4) 式中:x:∈R(i=1,2,,n)为系统的状态,并定义 式中:逼近误差Ie(x)I≤e,e为未知正常数; 无=(x1x2,,x,)'ueR为控制输入y为系统输 (x)=(p(r),,p,(x):一→R是已知光滑向 出f(E)5(正2),…f(En),g1(x),g2(E2),…, 量函数,神经网络节点数1>1,基函数p:(x),1≤ gn(xn),h,(c),h2(x2),…,hn(xn)都是未知连续函 i≤l取作通常形式的高斯函数,即 数;w是定义在完备概率空间(2,F,P)上的r维标 g.=ep(r=Ⅱi=1,2,,l 准布朗运动,其中2为样本空间,F为σ代数,P 为概率测度.本文的主要目的是设计一个自适应状 式中,山:门:分别是高斯函数的中心和宽度.理想权 态反馈控制律u,要求系统输出y尽可能的跟踪一 向量W=(01,02,…,心)T定义为 个指定的期望轨迹y,使得闭环系统依概率渐近稳 w-argin)-W()1). 定,跟踪误差依概率收敛到一个小的残差集内. 2自适应神经网络控制器设计 对于具有以下形式的系统: dx =f(x,t)dt +h'(x,t)dw. (2) 采用后推方法设计自适应状态反馈控制器,其 式中,x和w的定义与式(1)相同,而fR”×R+→ 步骤如下,定义如下坐标变换: R",h:R”×R→Rmxr对t一致地关于变量x满足 ∫3=x-a-1i=1,2,…,n; (5) 局部Lipschitz条件,且f(t,0)和h(t,0)关于t一致 Lao =ya- 有界.对二次可微函数V(t,x(t))定义如下微分 第一步(i=1),由系统(1)及式(5)可得 算子: dz=dx-dya =(f()+ Lv,xo)=yro》+aV@+ g x2 -ia)dt +h)dw. (6) at 定义积分型Lyapunov函数 ar0 (3) 03 ax'ax V.=enlathda (7) 式中,r(A)为A的迹. 由积分中值定理知,3入1∈(0,1),使得V= 定义1如果对任意ε:00,c2≥0,使得 -n小 3p1 u1(IxI)≤V(t,x)≤2(Ixl), LV≤-cV+c2, 3'(,)+国) 则系统(2)在(to,+∞)上存在唯一解,且解过程是 2 —h(G)h,(.(8) 依概率有界的. 由Young's不等式 假设1存在正常数g0和g1,使得0<gm≤ g:(x,)≤ga,x,eR,i=1,2,,n,且g:(c)(t≥ 3g()h(,)h(,)≤ 2
北 京 科 技 大 学 学 报 第 34 卷 文献[15]对于未知函数在零点等于零的条件限制. 1 问题描述及基本假设 考虑如下随机非线性严格反馈系统: dxi = ( fi ( xi ) + gi ( xi ) xi + 1 ) dt + hT i ( xi ) dw,i = 1,2,…,n - 1; dxn = ( fn ( xn ) + gn ( xn ) u) dt + hT n ( xn ) dw; y = x1 . ( 1) 式中: xi∈R( i = 1,2,…,n) 为系统的状态,并定义 xi = ( x1,x2,…,xi ) T ; u∈R 为控制输入; y 为系统输 出; f1 ( x1 ) ,f2 ( x2 ) ,…,fn ( xn ) ,g1 ( x1 ) ,g2 ( x2 ) ,…, gn ( xn ) ,h1 ( x1 ) ,h2 ( x2 ) ,…,hn ( xn ) 都是未知连续函 数; w 是定义在完备概率空间( Ω,F,P) 上的 r 维标 准布朗运动,其中 Ω 为样本空间,F 为 σ 代数,P 为概率测度. 本文的主要目的是设计一个自适应状 态反馈控制律 u,要求系统输出 y 尽可能的跟踪一 个指定的期望轨迹 yd,使得闭环系统依概率渐近稳 定,跟踪误差依概率收敛到一个小的残差集内. 对于具有以下形式的系统: dx = f( x,t) dt + hT ( x,t) dw. ( 2) 式中,x 和 w 的定义与式( 1) 相同,而 f∶ Rn × R + → Rn ,hT ∶ Rn × R + →Rn × r 对 t 一致地关于变量 x 满足 局部 Lipschitz 条件,且 f( t,0) 和 h( t,0) 关于 t 一致 有界. 对二次可微函数 V( t,x( t) ) 定义如下微分 算子: LV( t,x( t) ) = V( t,x( t) ) t + V( t,x( t) ) xT f + 1 2 tr { h 2 V( t,x( t) ) xT x h } T . ( 3) 式中,tr( A) 为 A 的迹. 定义 1 如果对任意 ε∶ 0 < ε < 1,对所有初值 x0∈S0 ( S0 为某个包含原点的紧集) ,存在紧集 S S0,有 inf x0∈S0 P{ x( t,t0,x0 ) ∈S,t≥t0 } ≥1 - ε,则称 随机系统( 2) 的解 x( t) 为半全局依概率有界. 引理 1 [6,15] 对于系统( 2) ,如果存在二次可微 函数 V( t,x( t) ) ,μ1,μ2∈κ∞ ( κ∞ 表示所有连续,严 格递增,在零点等于零的 R + →R + 的无界函数集 合) ,常数 c1 > 0,c2≥0,使得 μ1 ( | x | ) ≤V( t,x) ≤μ2 ( | x | ) , LV≤ - c1V + c2, 则系统( 2) 在( t0,+ ∞ ) 上存在唯一解,且解过程是 依概率有界的. 假设 1 存在正常数 gi0 和 gi1,使得 0 < gi0 ≤ gi ( xi ) ≤gi1,xi∈Ri ,i = 1,2,…,n,且 gi ( xi ) ( t≥ 0) 是二次可微的. 假设2 期望的轨迹向量 xid是连续的,且 xid∈ ΩxidRi + 1 ,i = 1,2,…,n. 其中 xid = ( yd,y · d,…, y ( i) d ) T ,Ωxid是已知的有界闭集. 本文中,未知光滑非线性函数 ψ( x) ∶ Rn →R 将 在紧集 Ωx 上采用如下径向基函数神经网络进行 逼近: ψ( x) = WT φ( x) + ε( x) ,x∈Ωx . ( 4) 式中: 逼 近 误 差 | ε ( x) | ≤ ε,ε 为 未 知 正 常 数; φ( x) = ( φ1 ( x) ,…,φl ( x) ) T ∶ Ωx→Rl 是已知光滑向 量函数,神经网络节点数 l > 1,基函数 φi ( x) ,1≤ i≤l 取作通常形式的高斯函数,即 φi ( x) = ( exp - ‖x - μi‖2 η2 ) i ,i = 1,2,…,l. 式中,μi、ηi 分别是高斯函数的中心和宽度. 理想权 向量 W = ( w1,w2,…,wl ) T 定义为 W = arg min ^ W∈Rl { sup x∈Ωx | ψ( x) - W^ T φ( x) |} . 2 自适应神经网络控制器设计 采用后推方法设计自适应状态反馈控制器,其 步骤如下,定义如下坐标变换: zi = xi - αi - 1,i = 1,2,…,n; α0 = yd { . ( 5) 第一步( i = 1) ,由系统( 1) 及式( 5) 可得 dz1 = dx1 - dyd = ( f1 ( x1 ) + g1 ( x1 ) x2 - y · d ) dt + hT 1 ( x1 ) dw. ( 6) 定义积分型 Lyapunov 函数 Vz1 = ∫ z1 0 σ3 g1 ( σ + yd ) dσ. ( 7) 由积分 中 值 定 理 知,λ1 ∈ ( 0,1 ) ,使 得 Vz1 = z 4 1 4g1 ( λ1 z1 + yd ) ,因为 0 < g10 ≤g1 ( x1 ) ≤g11,所以 z 4 1 4g11 ≤Vz1≤ z 4 1 4g10 ,故 Vz1是关于变量 z1 的正定函数, 由式( 3) 可得 LVz1 = z 3 1 g1 ( x1 ) [f1 ( x1 ) + g1 ( x1 ) ( z2 + α1 ) - y · d]+ y · d [ z 3 1 g1 ( x1 ) - z 3 1 ∫ 1 0 3ρ 2 1 g1 ( ρ1 z1 + yd ) dρ1 ] + 3z 2 1 g - 1 1 ( x1 ) + z 3 1 g - 1 1 ( x1 ) z1 2 hT 1 ( x1 ) h1 ( x1 ) . ( 8) 由 Young’s 不等式 3z 2 1 g - 1 1 ( x1 ) 2 hT ( x1 ) h( x1 ) ≤ ·22·
第1期 王飞等:基于积分型Lyapunov函数的随机非线性系统的自适应控制 ·23 9n1k,G,)1中 (9) 定义积分型Lyapunov函数 7116g(c1) V.= o3 (18) 油≤字材+ (10) Jog.(+)do 由式(3)可得 将式(9)、式(10)代入式(8)得 出+a,+,园》+ ,g国)+g,)--)+ (11) 式中, 茗室'医a山国 ax; 得-+ 与(e孟- A+号*1 3o2 元=(yaya)∈R3. 3国)+2照 取虚拟控制律 2 :x((c)- a1=-k11-1(1) (12) 式中,k1>0是设计常数,山,(乙)=WP1(乙,)是径 分ah,国))+ 国)a,- 向基函数神经网络在有界闭集2:,上对少()的逼 近,W,是理想权向量W,的估计,估计误差定义为 ()- 8xi-1 分a6国)) m1=W-W.令1()=Wp,(乞)+61(乞),则 1s,()1≤1,元1∈D于是式(11)可化为 荐国)星(G L,≤+[--所e,园)+ 豆团国)三中 6门+ (13) 子g(国p+a=h(,)h,,)dp:+ dp dx 考虑如下Lyapunov函数 =+号丽r, 三,"ta山或国 (14) axj dai-1 取自适应律 (三学国)+ W,=r(2,()-oW,) (15) 式中,工为正定常矩阵,σ1为设计常数.由式(3)、 aa-1 i-I 式(13)和式(15)可得 aah,()) 出≤-++a-a所成 71 (19) (16) 由Young's不等式 第i步(2≤i≤n-1),由系统(1)及式(5)可得 3g()-〉 2 d:=(x)+g(E)x+1-La-1]dt+ 因-三Gj加) 7: 式中, k-月wG a-1=a(国)+g,国)门+ (20) 专点国8… ≤A材+r (21) 将式(20)代入式(19)得 B-1=∑oi,+axa- 台W, aoi-1(i1). 以≤+a+,园D)+2)
第 1 期 王 飞等: 基于积分型 Lyapunov 函数的随机非线性系统的自适应控制 1 η1 + 9η1 16g2 1 ( x1 ) ‖h1 ( x1 ) ‖4 z 4 1, ( 9) z 3 1 z2≤ 3 4 λ 4 3 1 z 4 1 + 1 4λ4 1 z 4 2, ( 10) 将式( 9) 、式( 10) 代入式( 8) 得 LVz1≤ 1 η1 + z 3 1 ( α1 + ψ1 ( z1 ) ) + 1 4λ4 1 z 4 2 . ( 11) 式中, ψ1 ( z1 ) = f1 ( x1 ) g1 ( x1 ) + 3 4 λ 4 3 1 z1 - y · d ∫ 1 0 3ρ 2 1 g1 ( ρ1 z1 + yd ) dρ1 + 9η 16g2 1 ( x1 ) ‖h1 ( x1 ) ‖4 z1 + 1 2 g -1 1 ( x1 ) z1 ‖h1 ( x1 ) ‖2 , z1 = ( x1,yd,y · d ) ∈R3 . 取虚拟控制律 α1 = - k1 z1 - ^ ψ1 ( z1 ) ( 12) 式中,k1 > 0 是设计常数,^ ψ1 ( z1 ) = W^ T 1φ1 ( z1 ) 是径 向基函数神经网络在有界闭集 Ω z - 1上对 ψ1 ( z1 ) 的逼 近,W^ 1 是理想权向量 W1 的估计,估计误差定义为 W 槇1 = W^ 1 - W1 . 令 ψ1 ( z1 ) = WT 1φ1 ( z1 ) + ε1 ( z1 ) ,则 | ε1 ( z1 ) |≤ε1,z1∈Ωz1 . 于是式( 11) 可化为 LVz1≤ 1 η1 + z 3 1[- k1 z1 - W 槇T 1φ1 ( z1 ) + ε1 ( z1) ]+ 1 4λ4 1 z 4 2 . ( 13) 考虑如下 Lyapunov 函数 V1 = Vz1 + 1 2 W 槇T 1Γ- 1 1 W 槇1, ( 14) 取自适应律 W^ · 1 = Γ1 ( z 3 1φ1 ( z1 ) - σ1W^ 1 ) . ( 15) 式中,Γ1 为正定常矩阵,σ1 为设计常数. 由式( 3) 、 式( 13) 和式( 15) 可得 LV1≤ 1 η1 - k1 z 4 1 + 1 4λ4 1 z 4 2 + |z1 | 3 ε1 - σ1W 槇T 1W^ 1 . ( 16) 第 i 步( 2≤i≤n - 1) ,由系统( 1) 及式( 5) 可得 dzi =[fi ( xi ) + gi ( xi ) xi + 1 - Lαi - 1]dt ( + hT i ( xi ) - ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) ) dw. ( 17) 式中, Lαi - 1 = ∑ i-1 j = 1 αi - 1 xj [fj ( xj ) + gj ( xj ) xj + 1]+ 1 2 ∑ i-1 p,q = 1 2 αi - 1 xp xq hT p ( xp ) hq ( xq ) + βi - 1, βi - 1 = ∑ i-1 j = 1 αi - 1 ^ Wj ^ W · j + αi - 1 xT ( i - 1) ,d x · ( i - 1) ,d . 定义积分型 Lyapunov 函数 Vzi = ∫ zi 0 σ3 gi ( xi - 1,σ + αi - 1 ) dσ ( 18) 由式( 3) 可得 LVzi = z 3 i gi ( xi ) ( fi ( xi ) + gi ( xi ) xi + 1 - Lαi - 1 ) + ∫ 1 0 ∑ i-1 j = 1 z 4 i g - 1 i ( xi - 1,ρizi + αi - 1 ) xj ( fj ( xj ) + gj ( xj ) xj + 1 ) dρi + ( z 3 i gi ( xi ) - ∫ zi 0 3σ2 gi ( xi - 1,σ + αi - 1 ) dσ ) Lαi - 1 + 3z 2 i g - 1 i ( xi ) + z 3 i g - 1 i ( xi ) zi 2 × ( hT i ( xi ) - ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) ( ) hi ( xi ) - ∑ i-1 j = 1 αi - 1 xj hj ( xj ) ) + z 3 i g - 1 i ( xi ) αi ( - 1 hT i ( xi ) - ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) ( ) · ∑ i-1 j = 1 αi - 1 xj hj ( xj ) ) + z 3 i ∑ i-1 p = 1 g - 1 i ( xi ) x ( p hT i ( xi ) - ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) ) hp ( xp ) + 1 2 ∫ 1 0 ∑ i-1 p,q = 1 z 4 i · 2 g - 1 i ( xi - 1,ρizi + αi - 1 ) xp xq hT p ( xp ) hq ( xq ) dρi + ∫ zi 0 ∑ i-1 j = 1 σ3 2 g - 1 i ( xi - 1,σ + αi - 1 ) xj αi - 1 dσhT j ( xj ( )· ∑ i-1 j = 1 αi - 1 xj hj ( xj ) ) + 1 2 ∫ 1 0 z 4 i 2 g - 1 i ( xi - 1,ρizi + αi - 1 ) α2 i - 1 dρi ( · ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) ( ) ∑ i-1 j = 1 αi - 1 xj hj ( xj ) ) . ( 19) 由 Young’s 不等式 3z 2 i g - 1 i ( xi ) ( 2 hT i ( xi ) - ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) ( ) · hT i ( xi ) - ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) ) T ≤ 1 ηi + 9ηi 16g2 i ( xi ) hT i ( xi ) - ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) 4 z 4 i , ( 20) z 3 i zi + 1≤ 3 4 λ 4 3 i z 4 i + 1 4λ4 i z 4 i + 1 . ( 21) 将式( 20) 代入式( 19) 得 LVzi ≤ 1 ηi + z 3 i ( αi + ψi ( zi ) ) + 1 4λ4 i z 4 i + 1, ( 22) ·23·
·24· 北京科技大学学报 第34卷 成=r(.园,)-o). (26) 式中,T:为正定常矩阵,σ:为设计常数.由式(3)、 式(24)和式(26)可得 3pi g国))dp.-la-0gGp+ap+ 阿-言器小+ 名与g-名,m成 (27) 当i=n时,。+1=0,实际的控制器u及参数自适应 -广 律可构造如下: 2 (医-分小 “=--p.园, 1 (28) aQi-1 =r.(②.2)-m,). (29) 相应地,由式(28)、式(29)可得 县国)A)+三… Lv.≤ 子g区ep3+ah(,)h,(国,)p:+ 言与名啊呢 (30) axp ax 由Young's不等式 2G国 axj da;-1 -o,W,=-,前(+W,)≤ ax; -g止+w止, 2 2 山( 3 d0-1 子+欧 故式(30)可化为 ( 式中,元=(,a1 a,, aoi-1 , 此e动-4月含L, 2 dxi-1 axi 8ai-1 ax1 ax2 B)eR2an xi-1 取虚拟控制律 式中c肥{a可}d)为矩 -一-喻o园。 (23) 阵I厂的最大特征值μ=》 2 式中:k>0为设计常数:山(元)=m,(,)为径向 基函数神经网络在有界闭集2:,上对中:()的逼 名的由引理1可知,系统存在唯一解,且解 近;W为理想权向量W:的估计:估计误差定义为 过程是依概率有界的. =W-W令(2)=W,()+e:(2),则 3 仿真结果 1e:()1≤e,:∈2于是式(22)可化为 ≤克+(-好-丽,)+s,)+ 考虑如下随机非线性系统: 7: 4+1 dx e-0.s+(1+x)x2]dt +0.Isinx:dw, (24) dx2 =(3+cos(xx2))u]dt +xe"dw, 考虑如下Lyapunov函数 y=X1. =++2工, 控制目标是使输出y跟踪期望信号: (25) ya =0.5sin t+sin 0.5t. 取自适应律 选择虚拟控制律、控制律和参数自适应律如下:
北 京 科 技 大 学 学 报 第 34 卷 ψi ( zi ) = fi ( xi ) gi ( xi ) + 3 4 λ 4 3 i zi + ∫ 1 0 ∑ i-1 j = 1 zi g - 1 i ( xi - 1,ρizi + αi - 1 ) xj ( fj ( xj ) + gj ( xj ) xj + 1 ) dρi - Lαi - 1 ∫ 1 0 3ρ 2 i gi ( xi - 1,ρizi + αi - 1 ) dρi + 9ηi 16g2 i ( xi ) hT i ( xi ) - ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) 4 zi + 1 2 g - 1 i ( xi ) zi hT i ( xi ) - ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) 2 + g - 1 i ( xi ) αi ( - 1 hT i ( xi ) - ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) ( ) · ∑ i-1 j = 1 αi - 1 xj hj ( xj ) ) + ∑ i-1 p = 1 g - 1 i ( xi ) x ( p hT i ( xi ) - ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) ) hp ( xp ) + 1 2 ∫ 1 0 ∑ i-1 p,q = 1 zi · 2 g - 1 i ( xi - 1,ρizi + αi - 1 ) xp xq hT p ( xp ) hq ( xq ) dρi + ∫ 1 0 ∑ i-1 j = 1 zi 2 g - 1 i ( xi - 1,ρizi + αi - 1 ) xj αi - 1 dρihT j ( xj ( )· ∑ i-1 j = 1 αi - 1 xj hj ( xj ) ) + 1 2 ∫ 1 0 zi · 2 g - 1 i ( xi - 1,ρizi + αi - 1 ) α2 i - 1 dρi ( ∑ i-1 j = 1 αi - 1 xj hT j ( xj ) ( ) · ∑ i-1 j = 1 αi - 1 xj hj ( xj ) ) . 式 中,zi = ( xT i ,αi - 1,αi - 1 x1 ,…,αi - 1 xi - 1 , 2 αi - 1 x 2 1 , 2 αi - 1 x1 x2 ,…, 2 αi - 1 x 2 i - 1 ,βi - 1 ) T ∈R( t2 + 3i + 2) /2 . 取虚拟控制律 αi = - kizi - 1 4λ4 i - 1 zi - W^ T i φi ( zi ) . ( 23) 式中: ki > 0 为设计常数; ^ ψi ( zi ) = W^ T i φi ( zi ) 为径向 基函数神经网络在有界闭集 Ω z - i 上对 ψi ( zi ) 的逼 近; W^ i 为理想权向量 Wi 的估计; 估计误差定义为 W 槇i = W^ i - Wi . 令 ψi ( zi ) = WT i φi ( zi ) + εi ( zi ) ,则 | εi ( zi ) |≤εi,zi∈Ωzi . 于是式( 22) 可化为 LVzi ≤ 1 ηi + z 3 i ( - kizi - W 槇T i φi ( zi ) + εi ( zi ) ) + 1 4λ4 i z 4 i + 1 ( 24) 考虑如下 Lyapunov 函数 Vi = Vi - 1 + Vzi + 1 2 W 槇T i Γ- 1 i W 槇i, ( 25) 取自适应律 W^ · i = Γi ( z 3 i φi ( zi ) - σiW^ i ) . ( 26) 式中,Γi 为正定常矩阵,σi 为设计常数. 由式( 3) 、 式( 24) 和式( 26) 可得 LVi≤ ∑ i j = 1 1 ηj - ∑ i j = 1 - kj z 4 j + 1 4λ4 i z 4 i + 1 + ∑ i j = 1 |zj | 3 εj - ∑ i j = 1 σj W 槇T j W^ j . ( 27) 当 i = n 时,zn + 1 = 0,实际的控制器 u 及参数自适应 律可构造如下: u = - kn zn - 1 4λ4 n - 1 zn - W^ T nφn ( zn ) , ( 28) W^ · n = Γn ( z 3 nφn ( zn ) - σnW^ n ) . ( 29) 相应地,由式( 28) 、式( 29) 可得 LVn≤ ∑ n j = 1 1 ηj - ∑ n j = 1 kj z 4 j + ∑ n j = 1 |zj | 3 εj - ∑ n j = 1 σj W 槇T j W^ j . ( 30) 由 Young’s 不等式 - σj W 槇T j W^ j = - σj W 槇T j ( W 槇j + Wj ) ≤ - σj‖W 槇j‖2 2 + σj‖Wj‖2 2 , |zj | 3 εj≤ 3 4 kj z 4 j + 1 4k 3 j ε4 j . 故式( 30) 可化为 LVn≤ ∑ n j = 1 1 ηj - 1 4 ∑ n j = 1 kj z 4 j - ∑ n j = 1 σj‖W 槇j‖2 2 + ∑ n j = 1 σj‖Wj‖2 2 + ∑ n j = 1 1 4k 3 j ε4 j ≤ - cVn + μ. ( 31) 式中: c = min i = 1,…,n { kigi0, σi λmax ( Γ - 1 i } ) ,λmax ( Γ- 1 i ) 为矩 阵 Γ- 1 i 的最大特征值; μ = ∑ n j = 1 1 ηj + ∑ n j = 1 σj‖Wj‖2 2 + ∑ n j = 1 1 4k 3 j ε4 j . 由引理 1 可知,系统存在唯一解,且解 过程是依概率有界的. 3 仿真结果 考虑如下随机非线性系统: dx1 =[x1 e - 0. 5x1 + ( 1 + x 2 1 ) x2]dt + 0. 1sinx1 dw, dx2 =[x1 x 2 2 + ( 3 + cos( x1 x2 ) ) u]dt + x1 ex2 dw, y = x1 { . 控制目标是使输出 y 跟踪期望信号: yd = 0. 5sin t + sin 0. 5t. 选择虚拟控制律、控制律和参数自适应律如下: ·24·
第1期 王飞等:基于积分型Lyapunov函数的随机非线性系统的自适应控制 ·25· a1=-k11-m,(元), 参考文献 1 u=-4-府p:), [Pan Z C,Basar T.Backstepping controller design for nonlinear stochastic systems under a risksensitive cost criterion//Proceed- ings of American Control Conference,1997:1278 W,=r(e,()-om,),i=1,2 2]Pan Z C,Basar T.Adaptive controller design for tracking and dis- 式中,a1=x1-ya2=x2-a,1=(x1ya少)T, turbance attenuation in parametric strict-feedback nonlinear sys- tems.IEEE Trans Autom Control,1998,43(8):1066 =4尝a)八g0+ B]Liu Y G,Shi S J,Pan Z G.Backstepping robust adaptive feed- back control design for stochastic nonlinear systems.Acta Autom 心4+01,神经网络节点数4=50,h=60,基 Sin,2001,27(5):613 (刘允刚,施颂椒,潘子刚.随机非线性系统鲁棒自适应反馈 函数的宽度u1:=0.02(i-25),i=1,2,…,50,2:= 控制器的积分反推方法设计.自动化学报,2001,27(5): 613) 0.03(i-30),i=1,2,…,60,中心7:=72=1.初 [4]Deng H,Krstic M.Stochastic nonlinear stabilization:I.A back- 始条件为(x1(0),2(0)T=(0.1,-0.2)T, stepping design.Syst Control Lett,1997,32(3):143 ((0),d(0))T=(0,0)T,设计参数为k=k2= 5] Deng H,Krstic M.Output-feedback stochastic nonlinear stabiliza- 40,T1=T2=diag(10,10),o1=o2=0.01.仿真结 tion.IEEE Trans Autom Control,1999,44(2):328 果如图1和图2所示. [6]Deng H,Krstic M,Williams R J.Stabilization of stochastic non- linear systems driven by noise of unknown covariance.IEEE Trans 一输出y Autom Control,2001,46(8):1237 跟踪期望的 [7]Liu S J.Zhang J F.Output-feedback control of a class of stochas- 轨迹ya tic nonlinear systems with linearly bounded unmeasurable states. Int J Robust Nonlinear Control,2008,18(6):665 [8]Liu SJ.Ge SS,Zhang J F.Adaptive output-feedback control for a class of uncertain stochastic non-inear systems with time delays Int J Control,2008,81(8):1210 10 20 时间s Chen W S,Jiao LC,Li J,et al.Adaptive NN backstepping out- 图1输出y跟踪期望的轨迹y put-feedback control for stochastic nonlinear strict-feedback sys- Fig.1 Output y following the desired trajectory ya tems with timevarying delays.IEEE Trans Syst Man Cybern Part B,2010,40(3):939 [10]Li J,Li J M,Chen W S.Adaptive neural network output-feed- back stabilization for a class of stochastic nonlinear strict-feedback systems.Acta Autom Sin,2010,36(3):450 (李靖,李俊民,陈为胜。随机非线性严格反馈系统的自适 -100 应神经网络输出反馈镇定.自动化学报,2010,36(3):450) [11]Yu Z X,Du H B.Neural-network-based bounded adaptive stabi- -200 lization uncertain stochastic nonlinear systems with time-delay. 300% 10 15 20 Control Theory Appl,2010,27(7):855 时间/s (余昭旭,杜红彬.基于神经网络的不确定随机非线性时滞 系统自适应有界镇定.控制理论与应用,2010,27(7):855) 图2控制信号” Psillakis HE.Alexandridis AT.NN-based adaptive tracking control Fig.2 Control signal u of uncertain nonlinear systems disturbed by unknown covariance noise.IEEE Trans Neural Netuorks,2007,18(6):1830 4结论 [13]Zhang T P,Zhang H Y,Gu H J.Direct adaptive fuzzy control based on backstepping technique.Control Decis,2004,19(1) 讨论了一类随机严格反馈非线性系统的自适应 (张天平,张惠艳,顾海军.基于后推设计的直接自适应模糊 跟踪控制问题.通过引入积分型Lyapunov函数,并 控制.控制与决策,2004,19(1):22) 基于后推设计、Young's不等式以及径向基函数神 04] Wang Y C.Zhang H G,Wang Y Z.Fuzzy adaptive control of 经网络的逼近性质,提出了一种自适应神经网络跟 stochastic nonlinear systems with unknown virtual control gain function.Acta Autom Sin,2006,32 (2):170 踪控制策略.根据Lyapunov方法,在后推设计的每 [15]Liu S J,Zhang J F,Jiang Z P.A notion of stochastic input-to- 步确定了可调参数的自适应律.理论分析证明了 state stability and its application to stability of cascaded stochastic 闭环系统的所有信号依概率有界 nonlinear systems.Acta Math Appl Sin,2008,24(1):141
第 1 期 王 飞等: 基于积分型 Lyapunov 函数的随机非线性系统的自适应控制 α1 = - k1 z1 - W^ T 1φ1 ( z1 ) , u = - k2 z2 - 1 4λ4 1 z2 - W^ T 2φ2 ( z2 ) , W^ · i = Γi ( z 3 i φi ( zi ) - σiW^ i ) , i = 1,2. 式中,z1 = x1 - yd,z2 = x2 - α1,z1 = ( x1,yd,y · d ) T , z2 = ( x1,x2,α1,α1 x1 , 2 α1 x 2 1 ,β1 ) T ,β1 = α1 yd y · d + α1 y · d y ·· d + α1 w^ 1 w^ · 1,神经网络节点数 l1 = 50,l2 = 60,基 函数的宽度 μ1i = 0. 02( i - 25) ,i = 1,2,…,50,μ2i = 0. 03( i - 30) ,i = 1,2,…,60,中心 η1i = η2i = 1. 初 始条 件 为 ( x1 ( 0 ) ,x2 ( 0 ) ) T = ( 0. 1,- 0. 2 ) T , ( w^ T 1 ( 0) ,w^ T 2 ( 0) ) T = ( 0,0) T ,设计参数为 k1 = k2 = 40,Γ1 = Γ2 = diag( 10,10) ,σ1 = σ2 = 0. 01. 仿真结 果如图 1 和图 2 所示. 图 1 输出 y 跟踪期望的轨迹 yd Fig. 1 Output y following the desired trajectory yd 图 2 控制信号 u Fig. 2 Control signal u 4 结论 讨论了一类随机严格反馈非线性系统的自适应 跟踪控制问题. 通过引入积分型 Lyapunov 函数,并 基于后推设计、Young’s 不等式以及径向基函数神 经网络的逼近性质,提出了一种自适应神经网络跟 踪控制策略. 根据 Lyapunov 方法,在后推设计的每 一步确定了可调参数的自适应律. 理论分析证明了 闭环系统的所有信号依概率有界. 参 考 文 献 [1] Pan Z G,Basar T. Backstepping controller design for nonlinear stochastic systems under a risk-sensitive cost criterion / / Proceedings of American Control Conference,1997: 1278 [2] Pan Z G,Basar T. Adaptive controller design for tracking and disturbance attenuation in parametric strict-feedback nonlinear systems. IEEE Trans Autom Control,1998,43( 8) : 1066 [3] Liu Y G,Shi S J,Pan Z G. Backstepping robust adaptive feedback control design for stochastic nonlinear systems. Acta Autom Sin,2001,27( 5) : 613 ( 刘允刚,施颂椒,潘子刚. 随机非线性系统鲁棒自适应反馈 控制器的积分反推方 法 设 计. 自 动 化 学 报,2001,27 ( 5 ) : 613) [4] Deng H,Krstic' M. Stochastic nonlinear stabilization: Ⅰ. A backstepping design. Syst Control Lett,1997,32( 3) : 143 [5] Deng H,Krstic' M. Output-feedback stochastic nonlinear stabilization. IEEE Trans Autom Control,1999,44( 2) : 328 [6] Deng H,Krstic' M,Williams R J. Stabilization of stochastic nonlinear systems driven by noise of unknown covariance. IEEE Trans Autom Control,2001,46( 8) : 1237 [7] Liu S J,Zhang J F. Output-feedback control of a class of stochastic nonlinear systems with linearly bounded unmeasurable states. Int J Robust Nonlinear Control,2008,18( 6) : 665 [8] Liu S J,Ge S S,Zhang J F. Adaptive output-feedback control for a class of uncertain stochastic non-linear systems with time delays. Int J Control,2008,81( 8) : 1210 [9] Chen W S,Jiao L C,Li J,et al. Adaptive NN backstepping output-feedback control for stochastic nonlinear strict-feedback systems with time-varying delays. IEEE Trans Syst Man Cybern Part B,2010,40( 3) : 939 [10] Li J,Li J M,Chen W S. Adaptive neural network output-feedback stabilization for a class of stochastic nonlinear strict-feedback systems. Acta Autom Sin,2010,36( 3) : 450 ( 李靖,李俊民,陈为胜. 随机非线性严格反馈系统的自适 应神经网络输出反馈镇定. 自动化学报,2010,36( 3) : 450) [11] Yu Z X,Du H B. Neural-network-based bounded adaptive stabilization uncertain stochastic nonlinear systems with time-delay. Control Theory Appl,2010,27( 7) : 855 ( 余昭旭,杜红彬. 基于神经网络的不确定随机非线性时滞 系统自适应有界镇定. 控制理论与应用,2010,27( 7) : 855) [12] Psillakis H E,Alexandridis A T. NN-based adaptive tracking control of uncertain nonlinear systems disturbed by unknown covariance noise. IEEE Trans Neural Networks,2007,18( 6) : 1830 [13] Zhang T P,Zhang H Y,Gu H J. Direct adaptive fuzzy control based on backstepping technique. Control Decis,2004,19( 1) : 22 ( 张天平,张惠艳,顾海军. 基于后推设计的直接自适应模糊 控制. 控制与决策,2004,19( 1) : 22) [14] Wang Y C,Zhang H G,Wang Y Z. Fuzzy adaptive control of stochastic nonlinear systems with unknown virtual control gain function. Acta Autom Sin,2006,32( 2) : 170 [15] Liu S J,Zhang J F,Jiang Z P. A notion of stochastic input-tostate stability and its application to stability of cascaded stochastic nonlinear systems. Acta Math Appl Sin,2008,24( 1) : 141 ·25·