第4卷第4期 智能系统学报 Vol.4 No.4 2009年8月 CAAI Transactions on Intelligent Systems Ag.2009 doi:10.3969/j.issn.16734785.2009.04.010 一种新型自适应RBF神经网络滑模制导律 章钱,李士勇 (哈尔滨工业大学航天学院,黑龙江哈尔滨150001) 摘要:针对导弹拦截问题,提出一种自适应RBF神经网络滑模制导律.首先根据准平行接近原理和变结构控制理 论设计滑模面,然后将滑模面作为RBF神经网络的输入变量,输出量即为导弹的加速度.为了使得导弹系统能够到 达滑模面,采用自适应算法实时在线调整RBF神经网络的连接权值.该导引律将目标机动视为干扰量,在拦截过程 中不需要测量目标加速度,因此该导引律对目标机动具有较强的鲁棒性.在执行上,只用到了视线角速率,因而实现 简单.仿真结果表明,所提出的导引律和比例导引相比在脱靶量、拦截时间等方面有了很大的提高. 关键词:自适应控制;RBF神经网络;导弹拦截;滑模控制:比例导引律 中图分类号:T叮765.3文献标识码:A文章编号:16734785(2009)04033906 A new adaptive RBFNN sliding mode guidance law for intercepting maneuvering targets ZHANG Qian,LI Shi-yong (School of Astronautics,Harbin Institute of Technology,Harbin 150001,China) Abstract:A new adaptive radial basis function neural network (RBFNN)sliding mode guidance law was proposed for intercepting maneuvering targets.First of all,we designed a sliding-surface using a quasi-parallel approach principle and variable structure control theory.We then used the sliding surface to input variables to the RBF neu- ral network.In this case,the output was missile acceleration.In order to place the missile system on the sliding surface,we employed an adaptive algorithm that adjusts in real-time the connection weights of the RBF neural net- work.The missile acceleration in a given direction was determined by considering the targets acceleration as a dis- turbance,and thus it was not necessary to measure the targets acceleration directly.Therefore,this guidance law has strong robustness to target maneuvering.The new guidance law,which utilizes line-of-sight (LOS)measure- ment only,is simple to implement.Numerical simulations showed that the proposed guidance law yields better per- formance than proportional navigation. Keywords:adaptive control;RBFNN;missile intercept;sliding model control;proportional navigation 自从20世纪50年代提出比例导引律后,由于较复杂,不利于工程实现. 其实现简单,能有效对付低速小机动目标,因而获得 变结构控制(sliding model control)理论对外部 了较快的发展,先后出现了纯比例导引(PPN)、真比 干扰和参数摄动具有较强的鲁棒性,因此采用滑模 例导引(TPN)以及扩展比例导引(APN)等.但到了 变结构控制是解决导弹制导问题较好的途径.近几 20世纪80年代,高速、大机动目标的出现使得传统 年在该方面的研究较多,设计出了很多制导律.针对 的比例导引律不能达到满意的拦截效果。 线性时变系统的滑动模态运动对于扰动和参数摄动 自适应控制对参数不确定或未知的系统具有较 具有鲁棒性的特点,D.Zou等提出了一种自适应滑 好的控制效果.近年来,基于自适应控制的制导 模制导律ASMG4;文献[5]在非线性系统的基础 律131得到较快发展,它们在对付高速大机动目标 上,应用变结构控制,推导出一种非线性变结构制导 时的拦截精度优于传统制导律.但它们的形式都比 律.虽然上述文献中的变结构制导律在制导过程中 无需测量目标机动的精确值,但无一例外,都需要知 收稿日期:200904-15, 基金项目:国家自然科学基金资助项目(60773065). 道目标机动的上限值.而在实际导弹拦截系统中,目 通信作者:章钱.E-mai:qz50306@163.com. 标机动的上界值一般很难预先测量,且由于存在抖
·340 智能系统学报 第4卷 振6,因此限制了其应用 sin g(t)=ja(t)/R(t). (1) RBF神经网络(RBFNN)由于具有良好的逼近 式中:R(t)为导弹与目标之间的相对距离;少3(t)为 非线性光滑函数以及快速运算的能力而被广泛应用 △t时间内y3方向上的相对位移.若△t足够小,则 到控制系统设计中?1.Abedi等人8]考虑了目标机 ()为小量,故可近似为 动和导弹动态不确定性,使用RBF神经网络来自适 g(t)=y3(t)/R(t): (2) 应地补偿模型的非线性.RBF网络的权值采用Lya- 将式(2)对时间3次微分,得到 punov理论来设计,另外还采用了自适应补偿器来 9=-2(t)-(k1+石2))(t)-系9+ 测量误差和外界干扰.胡云安等1o]使用RBF神经 3(t)+353(t). (3) 网络在线辨识和补偿系统中存在的不确定性,并采 式中: 用自适应律来调节RBF网络的权重.Gu等人)提 R(t) 出了基于RBF神经网络的三维纯比例制导律 h=R(t)' (PNGLRBF),由于传统的比例导引律的导航比系数 固定,因此会造成较大脱靶量,针对这个问题,文中 6智, 提出利用RBF神经网络在线实时调整导航比系数, 1 产生最优的加速度指令.仿真结果表明作者提出的 店=R(G)' 制导律能够显著地减小脱靶量. 3(t)=-aa(t)+a3(t). (4) 本文设计了一种新的自适应RBF滑模控制器 式中:am3(t)与a3(t)分别为导弹和目标机动加速 adaptive RBFNN sliding model controller,ARBF- 度在y3方向上的分量.将式(4)代入式(3)可得: SM),综合了变结构控制、自适应算法以及RBFNN (t)=a19(t)+a2(t)+ 的优点,并将其应用于导弹制导中.控制策略是设计 a3q as +u(t)ua(t). (5) 特定的滑模面,然后将滑模面作为RBFNN的输入 式中: 变量,输出量即为导弹控制量加速度.自适应算法根 a1=-k2,a2=-(k1+2), 据可达条件实时在线调整RBF神经网络的连接权 a3=-无1,a4=-k3dm3(t), 值,从而使得系统最终到达滑模面,完成制导.仿真 ua(t)=ka(aca(t)+aga(t)), 结果表明了该制导律的有效性, u(t)=3am3(t). 1导弹一目标运动方程 选取状态变量x1=9,x2=9,则式(5)可表示为 「1=2, 为了研究导引规律,选取某一时间区间△:起始 (6) =f(t)-u(t)+u(t) 时刻的视线坐标系(x3y)作为末制导过程中目 标一导弹相对运动的参考坐标系),如图1所示. 式中:f()=a1(t)+a2(t)+a39+a4,是知时变函 原点o取为导弹当前时刻的质心,x3轴取为导弹初 数;u(t)为控制量,uu(t)视为外界干扰. 始视线角方向,y3轴与3轴垂直且指向上为正,3 2 制导律设计 轴由右手定则确定.在△内,此参考系仅随导弹平 动,这样末制导过程中的相对运动可以解耦成纵向 根据准平行接近原理希望(t)在制导过程中 平面0xy3内的运动和侧向平面x3内的运动. 趋于零,因此可选取滑模面415] s(t)=g(t)+入9(t). (7) 式中:A=const>O,ARBFSM的原理是将滑模面s作 为RBFNN的输入量,RBFNN的输出为控制量u(t). 在制导过程中,通过自适应算法不断调整RBFNN o(M 隐含层神经元与输出层神经元之间的连接权重,产 生的控制量使得系统逐渐趋向滑模面并最终停留在 滑模面上,最终完成拦截任务。 图1视线坐标系 设RBF网络的径向基向量h=[h,h2…hm]T, Fig.1 The LOS coordinate system 其中为高斯基函数16] 以纵向平面内的运动为例,设在△:内,视线倾 6=c(-1X-)=ep(-1-5), 角的增量为(t)(为简化,用(t)表示g,(t),则
第4期 章钱,等:一种新型自适应RBF神经网络滑模制导律 ·341· j=1,2,…,m (8) 上述分析,可得出ARBFSM制导律的系统方框图如 式中:m为隐含层神经元个数,c;=[ccn 图2所示.另外,一般应用中,高斯函数中的参数σ c]T为RBFNN的第j个隐含层单元的中心向量; 和c,可以固定为常数, 0=[σ102…0m],0为第j个隐含层单元的 3稳定性分析 基宽参数,且大于零,即为高斯型函数的基宽 设RBFNN的权向量为 Lyapunov稳定性分析方法较广泛地应用于证 w=[0102 …0n] (9) 明非线性系统的收敛中,下面利用Lyapunov法来检 故RBF网络的输出为 验提出的ARBFSM控制器的稳定性, 4=w,ep(--9). 若式(6)中时变函数f(t)精确已知,则理想的 (10) 控制律可以写为 由Lyapunov理论可知,滑模面可达的条件是ss0,故必有s(t)s(t)/入,则V<0.这意味着Lya 通过式(15)可以使得隐含层神经元与输出层 punov函数将逐渐减小,滑模面s将会收敛于s=O 神经元之间的连接权值w实时调整,以实现 的界限层/入内.从上述分析可知,提出的ARBFSM RBFNN的在线学习,因此,的初始值可以为O.由 控制器是稳定的,由滑模面的定义可知,I(t)I会
342. 智能系统学报 第4卷 收敛于一小的界限/入内.随着RBFNN非线性映 需的加速度较小,因此有利于导弹实现全向攻击;而 射精度的增加,I(t)1的稳态值将减小 SMG和PN需要较大的法向加速度,特别是当a3= 由于制导过程中,并不需要(t)=0,只需要 -7g时,PN的输出法向加速度出现饱和现象,因此 ()在维持在一个在0附近小的范围内即可,因此 造成了其较大的脱靶量.由图7~8可知,采用PN制 RBFNN隐含层只需要很少的神经元个数就可以使 导律时,当目标机动较大时,视线角速率会出现发散 得假设成立.本文在考虑计算量与控制精度之间的 现象;采用SMG时,视线角速率在经过0点时,变结 平衡后,选取15个隐含层神经元,这样可以增加采 构项εsg(q)的符号发生切换,从而使得控制量w= 样频率,有利于实际应用,本文RBFNN为1-15-1结 (k+1)川R19+6g(q)的值发生大的跳跃,因而会引 构,σ和℃值固定,只需要更新0值,因此计算量 起视线角速率发生抖振,在拦截末端抖振最大,过大 小,速度快.仿真中的采样时间为1ms. 的抖振会对弹体产生危害;而采用ARBFSM制导律, 4 仿真分析 控制量为连续量,不会产生大的跳跃,视线角速率收 敛于0附近较小值.由图9可知,当目标机动一定时, 假设目标法向加速度a分别为3g、-7g机动, 入取值越大,滑模面的误差界限层/入的值越小,稳 导弹初始位值(o,h)=(0,0),导弹初始速度o= 态时越趋向于0,与式(23)的分析一致.当入=0.8 500m/s;目标初始速度vo=400m/s,目标初始位 或0.5时,视线角速率在0值上下切换时,不会发 (xo,ho)=(7,l0)km;控制量加速度输出界限为± 生抖动现象,克服了变结构控制存在的抖动.这是因 13g.入=0.25,y=1.5,c=[151210-8-6-4 为ARBFSM制导律的输出控制量为一连续值,不存 -202468101215],0=[111111111111 在切换.由图10可知,SMG的滑模面s=R4在0上下 111],RBF隐含层神经元初始权值取为0,权值更 发生较大的抖振,图11是将图10的纵坐标限制在 新按式(15)进行.将本文的自适应RBF滑模控制律 [-8,8]范围内的效果图.图12是ARBFSM的滑模 (ARBFSM)与变结构制导律2I(SMG)u=(k+1)I 面s(t)=g+()随时间变化的曲线,它在零附近较 R1g+88g(9)(k=3,8分别取45、75)、比例导引律 小值范围内,并不发生抖振 (PN)u=kIR1g(k1取为4)相比较,结果如图3~12 所示 14*10 ×10 10 12 10 8 6 2 4 6 8×10 X/m 4 8×10 图4a=-7g时的拦截轨迹 X/m Fig.4 The pursuit trajectories when a=-7g 图3a=3g时的拦截轨迹 150r Fig.3 The pursuit trajectories when a=3g 100 由图3可知,ag=3g时采用PN制导律的拦截 时间为8.849s,脱靶量为0.61808m;采用SMG制导 50八 ARBFSM 律的拦截时间为8.685s,脱靶量为0.08123m;采用 0 ARBFSM制导律的拦截时间为8.675s,脱靶量为 -50 SMG 0.088585m.由图4可知,当aa=-7g时,采用PN -100 PN 脱靶量为69.8714m,已不满足拦截要求,而采用 -150 6 R SMG、ARBFSM的脱靶量分别为0.87478m、 t/s 0.3389m;拦截时间分别为10.884s、10.9298.SMG 图5a=3g时的导弹加速度变化曲线 与ARBFSM在对付大机动目标时,在脱靶量与拦截 Fig.5 The missile acceration commands when a=3g 时间上性能相当.由图5~6可知,ARBFSM制导律所
第4期 章钱,等:一种新型自适应RBF神经网络滑模制导律 343. 150 500 100 400 50 300 ARBFSM 0 200 SMG -50 100 PN -100 -100 6 810 4 6 8 tis t/s 图6 a=-7g时的导弹加速度变化曲线 图10a=3g时SMG的滑模面 Fig.6 The missile acceration commands when a =-7g Fig.10 The sliding surface of SMG when a=3g 0.05 f 6 ARBFSM SMG-S 2 0 0 S-DWS -2 PN -4 SMG -6 0.056 -8 0 6 4 tis t/s 图11a=3g时SMG的滑模面放大图 图7a=3g时的视线角速率变化曲线 Fig.11 The enlarged sliding surface of SMG when a=3g Fig.7 The LOS rate when a=3g 0.06 0.05 0.04 ARBFSM 0.02 0 ARBFSM-S SMG PN -0.02 68 ts -0.0 0 2 4 6 810 图12a=3g时ARBFSM的滑模面 Fig.12 The sliding surface of ARBFSM when a=3g 图8α=-7g时的视线角速率变化曲线 Fig.8 The LOS rate when a=-7g 0.05 5结束语 0.05 本文首先建立了导弹一目标运动方程,接着结 合导弹拦截要求和变结构控制理论设计合适的滑模 - 面,并将其作为RBF神经网络的输入变量,输出量 即为导弹加速度.为了使得导弹系统能够到达滑模 0.8 0.5 面,采用自适应算法实时在线调整RBF神经网络的 连接权值.因此与一般的神经网络控制相比,本文中 -0.05 0 4 6 RBFNN的连接权值初始值可以为O,简化了系统设 dis 计.该导引律只用到了视线角速率,在拦截过程中不 图9入取值不同时视线角速率的变化曲线(a=-7g) 需要测量目标加速度,因此该导引律对机动目标具 Fig.9 The LOS rate when A have different values(a =-7g) 有较强的鲁棒性,且实现简单.仿真结果表明,所提
344。 智能系统学报 第4卷 出的导引律和其他导引律相比拦截性能方面有了很良 on strip flatness and thickness control based on dynamic 大的提高, RBF neural networks[J]..CAAI Transaction on Intelligent Systems,2007,2(2)6568. 参考文献: ]]胡云安,晋玉强.BTT导弹神经自适应控制器设计[J]. [1]CHAW D,CHOI J Y.Adaptive nonlinear guidance law 航天控制,2003,21(1):37-41. considering control loop dynamics[J]IEEE Trans on Aero- HU Yunan,JIN Yugiang.Design of nonlinear adaptive space and Electronic Systems,2003,39(4)):1134-1143.. control system for BTT missile based on RBF neural net- works[J].Aerospace Control,2003,21(1)):37-41. 2.LIANG H W,MA B L.A nonliner adaptive guidance law for missile interceptions[C]//Proceedings of the 27th Chi- [12]GU W J,ZHAO H C,ZHANG R C.A three-dimensional proportional guidance law based on RBF neural network nese Control Conference.Kunming,China,2008:342-344. [C]//Proceedings of the 7th World Congress on Intelligent [3]CHWA DK,CHOI J Y.Observer-based adaptive guidance Control and Automation.Chongqing,China,2008::6978- law considering target uncertainties and control loop dynam- 6982. ics[J].IEEE Trans on Control System Technology,2006,14 ù:112-123. [3).周荻.寻地导弹新型导引律[M],北京:国防工业出 版社,2002:10-35. DI Z,CHUNDI M,WENLI X.Adaptive sliding mode guid- 4高为炳.变结构控制理论基础[M北京:中国科学技: ance of a homing missile[J].Journal of Guidance,Control and Dynamics,1999,22(4)):589-594. 术出版社,1990:105-125. [5]MOON J K,KKIM K,KIM Y.Design of misie guidance [15]刘金琨.滑模变结构控制MATLAB仿真[M]l北惊:清 华大学出版社,2005::7595. law via variable structure control[J].Journal of Guidance. Control and Dynamics,2001,24(4))659-664. ]李士勇.模糊控制一神经控制和智能控制论[M]】.哈尔 [⑥)金鸿章,罗延明.抑制滑模抖振的新型饱和函数法研究 滨哈尔滨工业大学出版社,2006:216-227. 0.智能系统学报,2007,28(3):288-291. 作者简介: 章钱,男,1984年生,硕士研究 JIN Hongzhang,LUO Yanming.Investigation of a novel 生,主要研究方向为导航制导与控制、 method of saturation function for chattering reduction of slid- ing mode control[J].CAAI Transcations on Inteligent Sys- 智能制。 tems,2007,28(3)288-291. [CHEN F C,KHALILI H K.Adaptive control of non-linear ystems using neural networks[J].International Journal of Control,199155(6⑤:12991317. LIU CC,CHEN F C.Adaptive control of non-linear contin- 李士勇,男,1943年生,教授、博士 生导师,国家模糊控制技术生产力促进 uous-time systems using neural networks general relative de- gree and MIMO cases[J].International Journal of Control, 中心专业组专家,中国自动化学会智能 自动化专业委员会委员,《计算机测量 1993,58(2)3317-335.. 与控制》杂志编委,哈尔滨工业大学 9 ].ABEDI M.BOLANDI H.An adaptive RBF neural guidance 学术委员会控制科学与工程分评委 law for a surface to air missile considering target maneuver and control lop uncertainties[J].IEEE International Sym- 会委员.主要研究方向为模糊控制、智能控制、智能优化 posium on Industrial Electronics,2007,11(5)):257-262. 算法.主持和参加了国家自然科学基金、“973“项目等10 项科研项目.获国家星火奖三等奖1项、获部级二等奖2项 [10们张秀玲,张志强.基于动态RBF神经网络的板形板厚综合 ,三、四等奖共2项.近五年来,在国内外发表学术论文120 控制仿真研究[川.智能系统学报,2007,2②)1668 余篇,其中多篇被SCI、EI和ISTP检索, ZHANG Xiuling ,ZHANG Zhiqiang.Simulation research
智 能 系 统 学 报 作者简介: [8] LIU C C,CHEN F C. Adaptive control of non-linear continuous-time systems using neural networks general relative degree and MIMO cases[J] . International Journal of Control, 1993,58(2) :317-335. [4] DI Z, CHUNDI M,WENLI X. Adaptive sliding mode guidance of a homing missile[J].Journal of Guidance,Control and Dynamics,1999,22(4) :589-594. [15] 刘金琨.滑模变结构控制MATLAB仿真[M] .北京: 清 华大学出版社,2005: 75-95. [3] CHWA D K,CHOI J Y. Observer-based adaptive guidance law considering target uncertainties and control loop dynamics[J].IEEE Trans on Control System Technology,2006,14 (1) :112-123. on strip flatness and thickness control based on dynamic RBF neural networks[J] .CAAI Transaction on Intelligent Systems,2007,2(2) :65-68. [5] MOON J K,KKIM K,KIM Y. Design of misie guidance law via variable structure control[ J]. Journal of Guidance, Control and Dynamics,2001,24(4) :659-664. [7] CHEN F C,KHALILl H K. Adaptive control of non-linear ystems using neural networks[J]. International Journal of Control,1991: 55(6) :1299-1317. 李士勇,男,1943年生,教授、博士 自动化专业委员会委员, 生导师,国家模糊控制技术生产力促进 中心专业组专家,中国自动化学会智能 《计算机测量 与控制》杂志编委,哈尔滨工业大学 学术委员会控制科学与工程分评委 航天控制,2003,21(1) :37-41. HU Yunan,JIN Yuqiang. Design of nonlinear adaptive control system for BTT missile based on RBF neural networks[J] . Aerospace Control,2003,21(1) :37-41. [11] 胡云安,晋玉强.BTT导弹神经自适应控制器设计[J] 项科研项目.获国家星火奖三等奖1项、获部级二等奖2项 ,三、四等奖共2项.近五年来,在国内外发表学术论文120 余篇,其中多篇被SCI、EI和ISTP检索. . [2] LIANG H W,MA B L. A nonliner adaptive guidance law for missile interceptions[C]//Proceedings of the 27th Chinese Control Conference.Kunming,China,2008: 342-344. 第4卷 [13] 周 荻.寻地导弹新型导引律[M] .北京:国防工业出 版社,2002: 10-35. [16] 李士勇.模糊控制一神经控制和智能控制论[M]】.哈尔 滨:哈尔滨工业大学出版社,2006: 216-227. 9 ] ABEDI M,BOLANDI H. An adaptive RBF neural guidance law for a surface to air missile considering target maneuver and control lop uncertainties[J]. IEEE International Symposium on Industrial Electronics,2007,11(5) :257-262. [12] GU W J,ZHAO H C,ZHANG R C.A three-dimensional proportional guidance law based on RBF neural network [C] //Proceedings of the 7th World Congress on Intelligent Control and Automation. Chongqing,China,2008: 6978- 6982. 出的导引律和其他导引律相比拦截性能方面有了很 大的提高. [10]张秀玲,张志强.基于动态RBF神经网络的板形板厚综合 控制仿真研究[J] .智能系统学报,2007,2(2) :65-68. ZHANG Xiuling ,ZHANG Zhiqiang. Simulation research [6] 金鸿章,罗延明.抑制滑模抖振的新型饱和函数法研究 [J] .智能系统学报,2007,28(3) :288-291. JIN Hongzhang,LUO Yanming. Investigation of a novel method of saturation function for chattering reduction of sliding mode control[J]. CAAI Transcations on Inteligent Systems,2007,28(3) :288-291. 参考文献: 344。 [1] CHAW D,CHOI J Y. Adaptive nonlinear guidance law considering control loop dynamics[J].IEEE Trans on Aerospace and Electronic Systems,2003,39(4) :1134-1143. [14] 高为炳.变结构控制理论基础[M] .北京: 中国科学技 术出版社,1990:105-125. 章 钱,男,1984年生,硕士研究 生,主要研究方向为导航制导与控制、 智能控制。 会委员.主要研究方向为模糊控制、智能控制、智能优化 算法.主持和参加了国家自然科学基金、"973"项目等10