正在加载图片...
·1746· 工程科学学报,第39卷,第11期 式中,w2为第二层即隐含层的网络权值矩阵w②的各 系数的求解需要考虑到控制器结构以及被控对象的动 个元素,na由n,2组成是第二层的中间量,f(x)为作 力学特性 用于隐含层中间量的传递函数,。②为隐含层的输出 在对角速率反馈控制参数优化中,使用横/纵向角 量,由o2组成。神经网络的输出量等于被整定的参数 速率计算参数优化目标函数E(k).以纵向运动为例, 量,其输出层的输入与输出形式分别为 其目标函数E()形式如下: n9(h)=∑gg0(k),m=1,2,j=1,,5. E因=7(g,(因-g(因)只 (20) (13) 其中,9,和q分别为参考模型和实际被控对象的纵向 o(k)=gn(k)],m=1,2. (14) 角速率值 式中,g(X)为输出层的传递函数,和②为隐含层到输出 神经网络输出层为控制器待优化的控制参数: 层的权值矩阵w的各个元素,0)为输出层的输出, o(k)=1/r,o9()=Cn/r (21) 包含各元素.根据非线性特性和输出参数的特点,隐 隐含层权值的敏感系数求解如下: 含层和输出层传递函数分别选用双极性的Sigmoid函 数和Purlin函数,形式如下: s"(k)=E(A(月6()a4p() (r)=exp(r)-exp(-x) 「a(a6(因a4p(G)o(☆= (15) expr)+exp(-x)' (q()-9,()aK4() exp(r) A do(k) gX)= (16) exp (x)exp(-x) 当m=1时,上式可以用来优化r,具体形式为 设E(k)为选定的目标函数,使用MOBP算法计算 a=(g因-9.()西人(-p》. aE (k) 网络权值调整量的计算方法如下: 0aAo An(k)=yAv (1)-a(1-)aE(k) (23) an (k' 式中,.为离散化的计算步长,p(k)为离散化的内环控 4e(=ya,9k-1)-a1-aE 'c2(k)' 制器的中间变量.(ag/a8)描述了直升机操纵功效,其 m=1,2,j=1,2,,5,i=1,2,3,4.(17) 大小无法通过直接测量和简单计算获得.由于(q/6) 式中,y为动量系数,a∈O,1]为权值调整系数, 的值只与达到最终优化结果的迭代次数有关,因此这 △m(k)和△Da()为网络权值的调整量.MOBP 里定义(q/8)的值为一常数,从而降低控制器的计 算法通过使用带动量系数y的低通滤波,提高神经网 算量.横向通道的参数优化方法与纵向通道相同. 络的收敛速率,通过选取合适的动量系数y可以解决 2ADRC自适应混合控制 传统BP算法无法收敛到全局最小点的问题四.通过 通过使用自抗扰控制(ADRC),对直升机的水平 使用低通滤波器对网络权值的调整量进行滤波,使得 神经网络权值优化过程中能够在一定程度上排除噪声 速度进行控制.自抗扰控制器由跟踪微分器(tracking 和数据异常的影响并降低网络权值整定过程中的振 differentiator,TD)、扩张状态观测器(extended state 荡,从而提高神经网络权值优化的鲁棒性叨 observer,ESO)以及非线性反馈控制(nonlinear state er- 由链式法则,公式(17)中的偏微分求解方式 ror feedback,NLSEF)三部分组成(图3). 如下: aE(k)aE(k)ao (k)an ((k) wg西aoo(内n图ng(内 8n(h]o(因="()o(). aE(k) (18) 扩张 观测器 aE() aE (h)in (k)ao (k)an(k) aw (k)an (k)ao (an (k)au (k) 图3自抗扰控制结构框图 s(k)w (k)f[n((k). (19) Fig.3 Block diagram of the ADRC controller 式中,s()为神经网络隐含层权值的敏感度系数,可 通过使用跟踪微分器将单一的控制目标K扩张为 用于描述网络权值改变对目标误差函数值的影响.该 K,~K.个控制目标,使用扩张观测器估计得到被控对工程科学学报,第 39 卷,第 11 期 式中,w( 2) ji 为第二层即隐含层的网络权值矩阵 w( 2) 的各 个元素,n( 2) 由 n( 2) j 组成是第二层的中间量,f( χ) 为作 用于隐含层中间量的传递函数,o( 2) 为隐含层的输出 量,由 o( 2) j 组成. 神经网络的输出量等于被整定的参数 量,其输出层的输入与输出形式分别为 n( 3) m ( k) = ∑ 5 j = 1 w( 3) mj o( 2) j ( k) ,m = 1,2,j = 1,…,5. ( 13) o( 3) m ( k) = g[n( 3) m ( k) ],m = 1,2. ( 14) 式中,g( χ) 为输出层的传递函数,w( 3) mj 为隐含层到输出 层的权值矩阵 w( 3) 的各个元素,o( 3) 为输出层的输出, 包含各元素. 根据非线性特性和输出参数的特点,隐 含层和输出层传递函数分别选用双极性的 Sigmoid 函 数和 Purlin 函数,形式如下: f( χ) = exp( χ) - exp( - χ) exp( χ) + exp( - χ) , ( 15) g( χ) = exp( χ) exp( χ) + exp( - χ) . ( 16) 设 E( k) 为选定的目标函数,使用 MOBP 算法计算 网络权值调整量的计算方法如下: Δw( 3) mj ( k) = γΔw( 3) mj ( k - 1) - α( 1 - γ) E( k) w( 3) mj ( k) , Δw( 2) ji ( k) = γΔw( 2) ji ( k - 1) - α( 1 - γ) E( k) w( 2) ji ( k) , m = 1,2,j = 1,2,…,5,i = 1,2,3,4. ( 17) 式中,γ 为 动 量 系 数,α ∈[0,1]为 权 值 调 整 系 数, Δw( 3) mj ( k) 和 Δ( 3) wji ( k) 为网络权值的调整量. MOBP 算法通过使用带动量系数 γ 的低通滤波,提高神经网 络的收敛速率,通过选取合适的动量系数 γ 可以解决 传统 BP 算法无法收敛到全局最小点的问题[21]. 通过 使用低通滤波器对网络权值的调整量进行滤波,使得 神经网络权值优化过程中能够在一定程度上排除噪声 和数据异常的影响并降低网络权值整定过程中的振 荡,从而提高神经网络权值优化的鲁棒性[17]. 由链 式 法 则,公 式 ( 17 ) 中 的 偏 微 分 求 解 方 式 如下: E( k) w( 3) mj ( k) = E( k) o( 3) m ( k) o( 3) m ( k) n( 3) m ( k) n( 3) m ( k) w( 3) mj ( k) = E( k) o( 3) m ( k) g' n( 3) m [ ( k) ]o( 2) j ( k) = s ( 3) m ( k) o( 2) j ( k) . ( 18) E( k) w( 2) ji ( k) = E( k) n( 3) m ( k) n( 3) m ( k) o( 2) j ( k) o( 2) j ( k) n( 2) j ( k) n( 2) j ( k) w( 2) ji ( k) = s ( 3) m ( k) w( 3) mj ( k) f'[n( 2) j ( k) ]o( 1) i ( k) . ( 19) 式中,s ( 3) m ( k) 为神经网络隐含层权值的敏感度系数,可 用于描述网络权值改变对目标误差函数值的影响. 该 系数的求解需要考虑到控制器结构以及被控对象的动 力学特性. 在对角速率反馈控制参数优化中,使用横/纵向角 速率计算参数优化目标函数 E( k) . 以纵向运动为例, 其目标函数 E( k) 形式如下: E( k) = 1 2 ( qr ( k) - q( k) ) 2 . ( 20) 其中,qr和 q 分别为参考模型和实际被控对象的纵向 角速率值. 神经网络输出层为控制器待优化的控制参数: o( 3) 1 ( k) = 1 /τsb,o( 3) 2 ( k) = Clon /τsb . ( 21) 隐含层权值的敏感系数求解如下: s ( 3) m ( k) = E( k) q( k) q( k) δlon ( k) δlon ( k) Δp( k) Δp( k) o( 3) m ( k) = ( q( k) - qr ( k) ) q δlon Ksb Alon Δp( k) o( 3) m ( k) . 当 m = 1 时,上式可以用来优化 τsb,具体形式为 E( k) [1 /τsb]( k) = ( q( k) - qr ( k) ) q δlon Ksb Alon ( - tsp( k) ) . ( 23) 式中,ts为离散化的计算步长,p( k) 为离散化的内环控 制器的中间变量. ( q/ δ) 描述了直升机操纵功效,其 大小无法通过直接测量和简单计算获得. 由于( q/ δ) 的值只与达到最终优化结果的迭代次数有关,因此这 里定义( q / δ) 的值为一常数,从而降低控制器的计 算量. 横向通道的参数优化方法与纵向通道相同. 2 ADRC 自适应混合控制 通过使用自抗扰控制( ADRC) ,对直升机的水平 速度进行控制. 自抗扰控制器由跟踪微分器( tracking differentiator,TD) 、扩 张 状 态 观 测 器 ( extended state observer,ESO) 以及非线性反馈控制( nonlinear state er￾ror feedback,NLSEF) 三部分组成[9]( 图 3) . 图 3 自抗扰控制结构框图 Fig. 3 Block diagram of the ADRC controller 通过使用跟踪微分器将单一的控制目标 κ 扩张为 κ1 ~ κn个控制目标,使用扩张观测器估计得到被控对 · 6471 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有