机器学习：一种新型自适应RBF神经网络滑模制导律.pdf_大学文库

第4卷第4期智能系统学报 Vol.4 No.4 2009年8月 CAAI Transactions on Intelligent Systems Ag.2009 doi:10.3969/j.issn.16734785.2009.04.010 一种新型自适应RBF神经网络滑模制导律章钱，李士勇 (哈尔滨工业大学航天学院，黑龙江哈尔滨150001) 摘要：针对导弹拦截问题，提出一种自适应RBF神经网络滑模制导律.首先根据准平行接近原理和变结构控制理论设计滑模面，然后将滑模面作为RBF神经网络的输入变量，输出量即为导弹的加速度.为了使得导弹系统能够到达滑模面，采用自适应算法实时在线调整RBF神经网络的连接权值.该导引律将目标机动视为干扰量，在拦截过程中不需要测量目标加速度，因此该导引律对目标机动具有较强的鲁棒性.在执行上，只用到了视线角速率，因而实现简单.仿真结果表明，所提出的导引律和比例导引相比在脱靶量、拦截时间等方面有了很大的提高. 关键词：自适应控制；RBF神经网络；导弹拦截；滑模控制：比例导引律中图分类号：T叮765.3文献标识码：A文章编号：16734785(2009)04033906 A new adaptive RBFNN sliding mode guidance law for intercepting maneuvering targets ZHANG Qian,LI Shi-yong (School of Astronautics,Harbin Institute of Technology,Harbin 150001,China) Abstract:A new adaptive radial basis function neural network (RBFNN)sliding mode guidance law was proposed for intercepting maneuvering targets.First of all,we designed a sliding-surface using a quasi-parallel approach principle and variable structure control theory.We then used the sliding surface to input variables to the RBF neu- ral network.In this case,the output was missile acceleration.In order to place the missile system on the sliding surface,we employed an adaptive algorithm that adjusts in real-time the connection weights of the RBF neural net- work.The missile acceleration in a given direction was determined by considering the targets acceleration as a dis- turbance,and thus it was not necessary to measure the targets acceleration directly.Therefore,this guidance law has strong robustness to target maneuvering.The new guidance law,which utilizes line-of-sight (LOS)measure- ment only,is simple to implement.Numerical simulations showed that the proposed guidance law yields better per- formance than proportional navigation. Keywords:adaptive control;RBFNN;missile intercept;sliding model control;proportional navigation 自从20世纪50年代提出比例导引律后，由于较复杂，不利于工程实现. 其实现简单，能有效对付低速小机动目标，因而获得变结构控制(sliding model control)理论对外部了较快的发展，先后出现了纯比例导引(PPN)、真比干扰和参数摄动具有较强的鲁棒性，因此采用滑模例导引(TPN)以及扩展比例导引(APN)等.但到了变结构控制是解决导弹制导问题较好的途径.近几 20世纪80年代，高速、大机动目标的出现使得传统年在该方面的研究较多，设计出了很多制导律.针对的比例导引律不能达到满意的拦截效果。线性时变系统的滑动模态运动对于扰动和参数摄动自适应控制对参数不确定或未知的系统具有较具有鲁棒性的特点，D.Zou等提出了一种自适应滑好的控制效果.近年来，基于自适应控制的制导模制导律ASMG4;文献[5]在非线性系统的基础律131得到较快发展，它们在对付高速大机动目标上，应用变结构控制，推导出一种非线性变结构制导时的拦截精度优于传统制导律.但它们的形式都比律.虽然上述文献中的变结构制导律在制导过程中无需测量目标机动的精确值，但无一例外，都需要知收稿日期：200904-15，基金项目：国家自然科学基金资助项目(60773065). 道目标机动的上限值.而在实际导弹拦截系统中，目通信作者：章钱.E-mai:qz50306@163.com. 标机动的上界值一般很难预先测量，且由于存在抖

·340 智能系统学报第4卷振6，因此限制了其应用 sin g(t)=ja(t)/R(t). (1) RBF神经网络(RBFNN)由于具有良好的逼近式中：R(t)为导弹与目标之间的相对距离；少3(t)为非线性光滑函数以及快速运算的能力而被广泛应用 △t时间内y3方向上的相对位移.若△t足够小，则到控制系统设计中？1.Abedi等人8]考虑了目标机 ()为小量，故可近似为动和导弹动态不确定性，使用RBF神经网络来自适 g(t)=y3(t)/R(t): (2) 应地补偿模型的非线性.RBF网络的权值采用Lya- 将式(2)对时间3次微分，得到 punov理论来设计，另外还采用了自适应补偿器来 9=-2(t)-(k1+石2))(t)-系9+ 测量误差和外界干扰.胡云安等1o]使用RBF神经 3(t)+353(t). (3) 网络在线辨识和补偿系统中存在的不确定性，并采式中：用自适应律来调节RBF网络的权重.Gu等人)提 R(t) 出了基于RBF神经网络的三维纯比例制导律 h=R(t)' (PNGLRBF),由于传统的比例导引律的导航比系数固定，因此会造成较大脱靶量，针对这个问题，文中 6智，提出利用RBF神经网络在线实时调整导航比系数， 1 产生最优的加速度指令.仿真结果表明作者提出的店=R(G)' 制导律能够显著地减小脱靶量. 3(t)=-aa(t)+a3(t). (4) 本文设计了一种新的自适应RBF滑模控制器式中：am3(t)与a3(t)分别为导弹和目标机动加速 adaptive RBFNN sliding model controller,ARBF- 度在y3方向上的分量.将式(4)代入式(3)可得： SM),综合了变结构控制、自适应算法以及RBFNN (t)=a19(t)+a2(t)+ 的优点，并将其应用于导弹制导中.控制策略是设计 a3q as +u(t)ua(t). (5) 特定的滑模面，然后将滑模面作为RBFNN的输入式中：变量，输出量即为导弹控制量加速度.自适应算法根 a1=-k2,a2=-（k1+2), 据可达条件实时在线调整RBF神经网络的连接权 a3=-无1，a4=-k3dm3(t), 值，从而使得系统最终到达滑模面，完成制导.仿真 ua(t)=ka(aca(t)+aga(t)), 结果表明了该制导律的有效性， u(t)=3am3(t). 1导弹一目标运动方程选取状态变量x1=9,x2=9,则式(5)可表示为「1=2，为了研究导引规律，选取某一时间区间△：起始 (6) =f(t)-u(t)+u(t) 时刻的视线坐标系(x3y)作为末制导过程中目标一导弹相对运动的参考坐标系)，如图1所示. 式中：f()=a1(t)+a2(t)+a39+a4,是知时变函原点o取为导弹当前时刻的质心，x3轴取为导弹初数；u(t)为控制量，uu(t)视为外界干扰. 始视线角方向，y3轴与3轴垂直且指向上为正，3 2 制导律设计轴由右手定则确定.在△内，此参考系仅随导弹平动，这样末制导过程中的相对运动可以解耦成纵向根据准平行接近原理希望(t)在制导过程中平面0xy3内的运动和侧向平面x3内的运动. 趋于零，因此可选取滑模面415] s(t)=g(t)+入9(t). (7) 式中：A=const>O,ARBFSM的原理是将滑模面s作为RBFNN的输入量，RBFNN的输出为控制量u(t). 在制导过程中，通过自适应算法不断调整RBFNN o(M 隐含层神经元与输出层神经元之间的连接权重，产生的控制量使得系统逐渐趋向滑模面并最终停留在滑模面上，最终完成拦截任务。图1视线坐标系设RBF网络的径向基向量h=[h,h2…hm]T, Fig.1 The LOS coordinate system 其中为高斯基函数16] 以纵向平面内的运动为例，设在△：内，视线倾 6=c(-1X-)=ep(-1-5), 角的增量为(t)(为简化，用(t)表示g,(t),则

342. 智能系统学报第4卷收敛于一小的界限/入内.随着RBFNN非线性映需的加速度较小，因此有利于导弹实现全向攻击；而射精度的增加，I(t)1的稳态值将减小 SMG和PN需要较大的法向加速度，特别是当a3= 由于制导过程中，并不需要(t)=0,只需要 -7g时，PN的输出法向加速度出现饱和现象，因此 ()在维持在一个在0附近小的范围内即可，因此造成了其较大的脱靶量.由图7~8可知，采用PN制 RBFNN隐含层只需要很少的神经元个数就可以使导律时，当目标机动较大时，视线角速率会出现发散得假设成立.本文在考虑计算量与控制精度之间的现象；采用SMG时，视线角速率在经过0点时，变结平衡后，选取15个隐含层神经元，这样可以增加采构项εsg(q)的符号发生切换，从而使得控制量w= 样频率，有利于实际应用，本文RBFNN为1-15-1结 (k+1)川R19+6g(q)的值发生大的跳跃，因而会引构，σ和℃值固定，只需要更新0值，因此计算量起视线角速率发生抖振，在拦截末端抖振最大，过大小，速度快.仿真中的采样时间为1ms. 的抖振会对弹体产生危害；而采用ARBFSM制导律， 4 仿真分析控制量为连续量，不会产生大的跳跃，视线角速率收敛于0附近较小值.由图9可知，当目标机动一定时，假设目标法向加速度a分别为3g、-7g机动，入取值越大，滑模面的误差界限层/入的值越小，稳导弹初始位值(o,h)=(0,0),导弹初始速度o= 态时越趋向于0，与式(23)的分析一致.当入=0.8 500m/s;目标初始速度vo=400m/s,目标初始位或0.5时，视线角速率在0值上下切换时，不会发 (xo,ho)=（7,l0)km;控制量加速度输出界限为± 生抖动现象，克服了变结构控制存在的抖动.这是因 13g.入=0.25，y=1.5,c=[151210-8-6-4 为ARBFSM制导律的输出控制量为一连续值，不存 -202468101215],0=[111111111111 在切换.由图10可知，SMG的滑模面s=R4在0上下 111],RBF隐含层神经元初始权值取为0，权值更发生较大的抖振，图11是将图10的纵坐标限制在新按式(15)进行.将本文的自适应RBF滑模控制律 [-8,8]范围内的效果图.图12是ARBFSM的滑模 (ARBFSM)与变结构制导律2I(SMG)u=(k+1)I 面s(t)=g+()随时间变化的曲线，它在零附近较 R1g+88g(9)(k=3,8分别取45、75)、比例导引律小值范围内，并不发生抖振 (PN)u=kIR1g(k1取为4)相比较，结果如图3~12 所示 14*10 ×10 10 12 10 8 6 2 4 6 8×10 X/m 4 8×10 图4a=-7g时的拦截轨迹 X/m Fig.4 The pursuit trajectories when a=-7g 图3a=3g时的拦截轨迹 150r Fig.3 The pursuit trajectories when a=3g 100 由图3可知，ag=3g时采用PN制导律的拦截时间为8.849s,脱靶量为0.61808m;采用SMG制导 50八 ARBFSM 律的拦截时间为8.685s,脱靶量为0.08123m;采用 0 ARBFSM制导律的拦截时间为8.675s,脱靶量为 -50 SMG 0.088585m.由图4可知，当aa=-7g时，采用PN -100 PN 脱靶量为69.8714m,已不满足拦截要求，而采用 -150 6 R SMG、ARBFSM的脱靶量分别为0.87478m、 t/s 0.3389m;拦截时间分别为10.884s、10.9298.SMG 图5a=3g时的导弹加速度变化曲线与ARBFSM在对付大机动目标时，在脱靶量与拦截 Fig.5 The missile acceration commands when a=3g 时间上性能相当.由图5~6可知，ARBFSM制导律所

344。智能系统学报第4卷出的导引律和其他导引律相比拦截性能方面有了很良 on strip flatness and thickness control based on dynamic 大的提高， RBF neural networks[J]..CAAI Transaction on Intelligent Systems,2007,2(2)6568. 参考文献： ]]胡云安，晋玉强.BTT导弹神经自适应控制器设计[J]. [1]CHAW D,CHOI J Y.Adaptive nonlinear guidance law 航天控制，2003,21(1)：37-41. considering control loop dynamics[J]IEEE Trans on Aero- HU Yunan,JIN Yugiang.Design of nonlinear adaptive space and Electronic Systems,2003,39(4)):1134-1143.. control system for BTT missile based on RBF neural net- works[J].Aerospace Control,2003,21(1)):37-41. 2.LIANG H W,MA B L.A nonliner adaptive guidance law for missile interceptions[C]//Proceedings of the 27th Chi- [12]GU W J,ZHAO H C,ZHANG R C.A three-dimensional proportional guidance law based on RBF neural network nese Control Conference.Kunming,China,2008:342-344. [C]//Proceedings of the 7th World Congress on Intelligent [3]CHWA DK,CHOI J Y.Observer-based adaptive guidance Control and Automation.Chongqing,China,2008::6978- law considering target uncertainties and control loop dynam- 6982. ics[J].IEEE Trans on Control System Technology,2006,14 ù：112-123. [3).周荻.寻地导弹新型导引律[M],北京：国防工业出版社，2002：10-35. DI Z,CHUNDI M,WENLI X.Adaptive sliding mode guid- 4高为炳.变结构控制理论基础[M北京：中国科学技： ance of a homing missile[J].Journal of Guidance,Control and Dynamics,1999,22(4)):589-594. 术出版社，1990：105-125. [5]MOON J K,KKIM K,KIM Y.Design of misie guidance [15]刘金琨.滑模变结构控制MATLAB仿真[M]l北惊：清华大学出版社，2005：：7595. law via variable structure control[J].Journal of Guidance. Control and Dynamics,2001,24(4))659-664. ]李士勇.模糊控制一神经控制和智能控制论[M]】.哈尔 [⑥)金鸿章，罗延明.抑制滑模抖振的新型饱和函数法研究滨哈尔滨工业大学出版社，2006：216-227. 0.智能系统学报，2007,28(3)：288-291. 作者简介：章钱，男，1984年生，硕士研究 JIN Hongzhang,LUO Yanming.Investigation of a novel 生，主要研究方向为导航制导与控制、 method of saturation function for chattering reduction of slid- ing mode control[J].CAAI Transcations on Inteligent Sys- 智能制。 tems,2007,28(3)288-291. [CHEN F C,KHALILI H K.Adaptive control of non-linear ystems using neural networks[J].International Journal of Control,199155(6⑤：12991317. LIU CC,CHEN F C.Adaptive control of non-linear contin- 李士勇，男，1943年生，教授、博士生导师，国家模糊控制技术生产力促进 uous-time systems using neural networks general relative de- gree and MIMO cases[J].International Journal of Control, 中心专业组专家，中国自动化学会智能自动化专业委员会委员，《计算机测量 1993,58(2)3317-335.. 与控制》杂志编委，哈尔滨工业大学 9 ].ABEDI M.BOLANDI H.An adaptive RBF neural guidance 学术委员会控制科学与工程分评委 law for a surface to air missile considering target maneuver and control lop uncertainties[J].IEEE International Sym- 会委员.主要研究方向为模糊控制、智能控制、智能优化 posium on Industrial Electronics,2007,11(5)):257-262. 算法.主持和参加了国家自然科学基金、“973“项目等10 项科研项目.获国家星火奖三等奖1项、获部级二等奖2项 [10们张秀玲，张志强.基于动态RBF神经网络的板形板厚综合 ,三、四等奖共2项.近五年来，在国内外发表学术论文120 控制仿真研究[川.智能系统学报，2007,2②)1668 余篇，其中多篇被SCI、EI和ISTP检索， ZHANG Xiuling ,ZHANG Zhiqiang.Simulation research

智能系统学报作者简介: [8] LIU C C,CHEN F C. Adaptive control of non-linear continuous-time systems using neural networks general relative degree and MIMO cases[J] . International Journal of Control, 1993,58(2) :317-335. [4] DI Z, CHUNDI M,WENLI X. Adaptive sliding mode guidance of a homing missile[J].Journal of Guidance,Control and Dynamics,1999,22(4) :589-594. [15] 刘金琨.滑模变结构控制MATLAB仿真[M] .北京: 清华大学出版社,2005: 75-95. [3] CHWA D K,CHOI J Y. Observer-based adaptive guidance law considering target uncertainties and control loop dynamics[J].IEEE Trans on Control System Technology,2006,14 (1) :112-123. on strip flatness and thickness control based on dynamic RBF neural networks[J] .CAAI Transaction on Intelligent Systems,2007,2(2) :65-68. [5] MOON J K,KKIM K,KIM Y. Design of misie guidance law via variable structure control[ J]. Journal of Guidance, Control and Dynamics,2001,24(4) :659-664. [7] CHEN F C,KHALILl H K. Adaptive control of non-linear ystems using neural networks[J]. International Journal of Control,1991: 55(6) :1299-1317. 李士勇,男,1943年生,教授、博士自动化专业委员会委员, 生导师,国家模糊控制技术生产力促进中心专业组专家,中国自动化学会智能《计算机测量与控制》杂志编委,哈尔滨工业大学学术委员会控制科学与工程分评委航天控制,2003,21(1) :37-41. HU Yunan,JIN Yuqiang. Design of nonlinear adaptive control system for BTT missile based on RBF neural networks[J] . Aerospace Control,2003,21(1) :37-41. [11] 胡云安,晋玉强.BTT导弹神经自适应控制器设计[J] 项科研项目.获国家星火奖三等奖1项、获部级二等奖2项 ,三、四等奖共2项.近五年来,在国内外发表学术论文120 余篇,其中多篇被SCI、EI和ISTP检索. . [2] LIANG H W,MA B L. A nonliner adaptive guidance law for missile interceptions[C]//Proceedings of the 27th Chinese Control Conference.Kunming,China,2008: 342-344. 第4卷 [13] 周荻.寻地导弹新型导引律[M] .北京:国防工业出版社,2002: 10-35. [16] 李士勇.模糊控制一神经控制和智能控制论[M]】.哈尔滨:哈尔滨工业大学出版社,2006: 216-227. 9 ] ABEDI M,BOLANDI H. An adaptive RBF neural guidance law for a surface to air missile considering target maneuver and control lop uncertainties[J]. IEEE International Symposium on Industrial Electronics,2007,11(5) :257-262. [12] GU W J,ZHAO H C,ZHANG R C.A three-dimensional proportional guidance law based on RBF neural network [C] //Proceedings of the 7th World Congress on Intelligent Control and Automation. Chongqing,China,2008: 6978- 6982. 出的导引律和其他导引律相比拦截性能方面有了很大的提高. [10]张秀玲,张志强.基于动态RBF神经网络的板形板厚综合控制仿真研究[J] .智能系统学报,2007,2(2) :65-68. ZHANG Xiuling ,ZHANG Zhiqiang. Simulation research [6] 金鸿章,罗延明.抑制滑模抖振的新型饱和函数法研究 [J] .智能系统学报,2007,28(3) :288-291. JIN Hongzhang,LUO Yanming. Investigation of a novel method of saturation function for chattering reduction of sliding mode control[J]. CAAI Transcations on Inteligent Systems,2007,28(3) :288-291. 参考文献: 344。 [1] CHAW D,CHOI J Y. Adaptive nonlinear guidance law considering control loop dynamics[J].IEEE Trans on Aerospace and Electronic Systems,2003,39(4) :1134-1143. [14] 高为炳.变结构控制理论基础[M] .北京: 中国科学技术出版社,1990:105-125. 章钱,男,1984年生,硕士研究生,主要研究方向为导航制导与控制、智能控制。会委员.主要研究方向为模糊控制、智能控制、智能优化算法.主持和参加了国家自然科学基金、"973"项目等10