第15卷第2期 智能系统学报 Vol.15 No.2 2020年3月 CAAI Transactions on Intelligent Systems Mar.2020 D0:10.11992tis.201809047 网络出版地址:http:/kns.cnki.net/kcms/detail/23.1538.TP.20190828.1821.014.html 基于自适应神经模糊推理系统的船舶航向自抗扰控制 秦贝贝,陈增强2,孙明玮,孙青林 (1.南开大学人工智能学院,天津300350,2.天津市智能机器人重点实验室,天津300350) 摘要:在实际的船舶航向控制中,航向系统在受到外界风浪干扰时表现出的模型非线性和参数不确定性,为 航向控制器的设计带来了困难。针对该问题,设计了常规的线性自抗扰控制器和两种在线学习的自抗扰控制 器。利用自适应神经模糊推理系统(ANFIS)实现自抗扰控制器参数的在线调整,设计了自适应PD的自抗扰控 制器和自适应扩张状态观测器(E$O)的自抗扰控制器:分别在船舶受到外界扰动和参数摄动的两种情况下进 行了仿真,仿真表明自适应自抗扰控制器控制效果更好,抗扰能力更强,表现出较强的鲁棒性。 关键词:航向控制:自适应神经模糊推理系统(ANFIS):自适应自抗扰控制器:野本Nomoto)模型:线性自抗扰 控制(LADRC):非线性系统:梯度下降法;参数学习 中图分类号:TP272文献标志码:A文章编号:1673-4785(2020)02-0255-09 中文引用格式:秦贝贝,陈增强,孙明玮,等.基于自适应神经模糊推理系统的船舶航向自抗扰控制J智能系统学报,2020, 15(2):255-263. 英文引用格式:QIN Beibei,.CHEN Zengqiang,SUN Mingwei,etal.Active disturbance rejection control of ship course based on ad- aptive-network-based fuzzy inference system CAAl transactions on intelligent systems,2020,15(2):255-263. Active disturbance rejection control of ship course based on adaptive-net- work-based fuzzy inference system QIN Beibei',CHEN Zengqiang,SUN Mingwei',SUN Qinglin' (1.College of Artificial Intelligence,Nankai University,Tianjin 300350,China;2.Key Laboratory of Intelligent Robotics of Tianjin, Tianjin 300350,China) Abstract:In actual ship course control,the model nonlinearity and parameter uncertainty of the course system when dis- turbed by external wind and waves bring difficulties to the design of a course controller.To solve this problem,we de- signed a conventional linear active disturbance rejection controller(ADRC)and two online learning ADRCs.The adapt- ive-network-based fuzzy inference system is used to achieve the online adjustment of the parameters of the ADRC. Moreover,the ADRCs for adaptive PD and adaptive extended state observer are designed.The simulation results show that the adaptive ADRCs have a good control effect,strong anti-interference capability,and strong robustness when the ship is subjected to external disturbance and parameter perturbation. Keywords:course control;adaptive-network-based fuzzy inference system(ANFIS);adaptive active disturbance rejec- tion controller;Nomoto model;linear active disturbance rejection control (LADRC);nonlinear system;gradient descent method;parameter learning 自20世纪20年代PID控制律应用于船舶航 重视。航运业承担着约90%的国际贸易数额,人 向控制以来,出于航行安全、节能,进一步解放船 们对于其经济性和安全性关注度越来越高,因此 员劳动力的考虑,航向控制一直受到人们的高度 对大型船舶航向控制的研究和分析有非常重要的 意义山。船舶的系统参数会受到船舶装载状态、 收稿日期:2018-10-09.网络出版日期:2019-08-29. 基金项目:国家自然科学基金项目(61973175,61973172). 船速、外界干扰等的影响,使船舶运动表现出系 通信作者:陈增强.E-mail:chenzq@nankai.edu.cn, 统参数不确定性和外部扰动不确定性,因此,研
DOI: 10.11992/tis.201809047 网络出版地址: http://kns.cnki.net/kcms/detail/23.1538.TP.20190828.1821.014.html 基于自适应神经模糊推理系统的船舶航向自抗扰控制 秦贝贝1 ,陈增强1,2,孙明玮1 ,孙青林1 (1. 南开大学 人工智能学院,天津 300350; 2. 天津市智能机器人重点实验室,天津 300350) 摘 要:在实际的船舶航向控制中,航向系统在受到外界风浪干扰时表现出的模型非线性和参数不确定性,为 航向控制器的设计带来了困难。针对该问题,设计了常规的线性自抗扰控制器和两种在线学习的自抗扰控制 器。利用自适应神经模糊推理系统 (ANFIS) 实现自抗扰控制器参数的在线调整,设计了自适应 PD 的自抗扰控 制器和自适应扩张状态观测器 (ESO) 的自抗扰控制器;分别在船舶受到外界扰动和参数摄动的两种情况下进 行了仿真,仿真表明自适应自抗扰控制器控制效果更好,抗扰能力更强,表现出较强的鲁棒性。 关键词:航向控制;自适应神经模糊推理系统 (ANFIS);自适应自抗扰控制器;野本 (Nomoto) 模型;线性自抗扰 控制 (LADRC);非线性系统;梯度下降法;参数学习 中图分类号:TP272 文献标志码:A 文章编号:1673−4785(2020)02−0255−09 中文引用格式:秦贝贝, 陈增强, 孙明玮, 等. 基于自适应神经模糊推理系统的船舶航向自抗扰控制 [J]. 智能系统学报, 2020, 15(2): 255–263. 英文引用格式:QIN Beibei, CHEN Zengqiang, SUN Mingwei, et al. Active disturbance rejection control of ship course based on adaptive-network-based fuzzy inference system[J]. CAAI transactions on intelligent systems, 2020, 15(2): 255–263. Active disturbance rejection control of ship course based on adaptive-network-based fuzzy inference system QIN Beibei1 ,CHEN Zengqiang1,2 ,SUN Mingwei1 ,SUN Qinglin1 (1. College of Artificial Intelligence, Nankai University, Tianjin 300350, China; 2. Key Laboratory of Intelligent Robotics of Tianjin, Tianjin 300350, China) Abstract: In actual ship course control, the model nonlinearity and parameter uncertainty of the course system when disturbed by external wind and waves bring difficulties to the design of a course controller. To solve this problem, we designed a conventional linear active disturbance rejection controller (ADRC) and two online learning ADRCs. The adaptive-network-based fuzzy inference system is used to achieve the online adjustment of the parameters of the ADRC. Moreover, the ADRCs for adaptive PD and adaptive extended state observer are designed. The simulation results show that the adaptive ADRCs have a good control effect, strong anti-interference capability, and strong robustness when the ship is subjected to external disturbance and parameter perturbation. Keywords: course control; adaptive-network-based fuzzy inference system (ANFIS); adaptive active disturbance rejection controller; Nomoto model; linear active disturbance rejection control (LADRC); nonlinear system; gradient descent method; parameter learning 自 20 世纪 20 年代 PID 控制律应用于船舶航 向控制以来,出于航行安全、节能,进一步解放船 员劳动力的考虑,航向控制一直受到人们的高度 重视。航运业承担着约 90% 的国际贸易数额,人 们对于其经济性和安全性关注度越来越高,因此 对大型船舶航向控制的研究和分析有非常重要的 意义[1]。船舶的系统参数会受到船舶装载状态、 船速、外界干扰等的影响,使船舶运动表现出系 统参数不确定性和外部扰动不确定性,因此,研 收稿日期:2018−10−09. 网络出版日期:2019−08−29. 基金项目:国家自然科学基金项目 (61973175,61973172). 通信作者:陈增强. E-mail: chenzq@nankai.edu.cn. 第 15 卷第 2 期 智 能 系 统 学 报 Vol.15 No.2 2020 年 3 月 CAAI Transactions on Intelligent Systems Mar. 2020
·256· 智能系统学报 第15卷 究船舶航向的控制具有重要的意义冈。 应新型航向控制器,与固定参数的控制器进行对 船舶航向的控制问题即令船舶航向跟踪上设 比,观察其在风、浪等环境扰动和载重变化等引 定值实质上包含两部分内容:一是当船舶在目标 起的参数摄动下的控制效果。 航向上受到扰动时,舵角改变量应尽量小以减少 燃料损耗;二是当航向设定值改变时,船舶航向 1船舶航向控制模型 可以快速准确地跟踪上新的设定值。为了达到 常规水面船舶的主要操纵设备为螺旋桨和舵 这两个目标,近年来国内外的研究者们提出了众 机,螺旋桨产生推进力用来控制船舶的前进速 多的控制方法应用到船舶自动舵的设计中,大致 可以分为3类:早期的经典PID控制,上世纪 度,舵机产生舵角来保持和改变船首方向。 70年代出现的自适应控制和现在应用较多的智 图1中,船舶的实时航向山可以通过设备直 能控制。文献[4]针对船舶运动模型中的参数不 接测得,航向的设定值少,由用户给出,船舶航向控 确定性和外扰不确定性的问题,将PD与补偿控 制即设计控制器跟踪航向设定值。船舶受到的风 制相结合,提出了一种船舶航向鲁棒PD型自动 浪扰动作用可折合成等效舵角进行数学模拟,考 舵;文献[3,5]借鉴反步法的思想,设计了船舶航 虑舵机特性,与实际舵角6一同进入船舶模型。 向控制器;文献[6]考虑到船舶所受外扰的不确 其中船舶航行过程中受到的浪、流干扰及产生的 定性和舵机舵角的实际物理约束,设计了自适应 参数摄动都会为控制器的设计带来一定的困难。 鲁棒控制器,引人动态面简化控制器计算;文献 浪、流 参数 [7]首次将系统状态和控制输入由平面输出和它 干扰 摄动 的导数表示,结合滑模控制和微分平坦的特点设 计了有效的航向控制器;文献[8]对于船舶航向 控制器 舵机模型 船舶模型 保持问题提出了基于特征值分解的自适应滑模控 制器;文献[9]将模糊神经网络与内模控制相结 图1船舶航向控制示意 合设计了航向控制器。到目前为止,已经有多种 Fig.1 Schematic diagram of ship course control 方法用于航向控制,并且取得了不错的控制效 1.1 航向控制的简化模型 果;但由于上述大多数算法结构复杂,计算量大, 船舶模型具有大惯性、大时滞的特点,且其 对模型要求较高等原因,不易于工程实现。 操舵机构能量有限,可提供的舵角变化速度通常 韩京清教授提出自抗扰控制后,自抗扰控 较低,为同≤3~6(°)/s,因此船舶运动具有低频 制技术凭借其鲁棒性强、易于理解、结构简单且 特性。在船舶自动舵的设计中,一阶响应模型即 不依赖于模型等特点受到了国内外学者的广泛关 注山,理论证明的结果也层出不穷。ADRC凭 野本Nomoto)方程被广泛采用,它最早是由野 本采用类比建模法从简单力学意义上得出的。为 借其结构简单、鲁棒性强也被应用于船舶控制 Ti+r=K6 (1) 中。文献[13]将自抗扰控制技术应用于航向控 式中:r=山为船舶转首角速度;山为航向角;6为 制,仿真表明该控制器具有良好的适应能力;文 舵机舵角:K和T为船舶操纵性指数。 献[14]基于船舶非线性Bech模型设计了高阶 实际航向中,船舶纵向速度的变化和流体动 ADRC控制器。通过对已有自抗扰控制航向的相 力的非线性特性都会使船舶的操舵响应呈现出非 关文献学习发现,目前在船舶自动舵设计中的参 线性,非线性的影响通过引入非线性项r3实 数大多都是在初始设计时给定,因此当船舶受到 现,即 较大的扰动或者船舶航行状态发生较大改变时, Ti+r+ar=K 难以达到较好的控制效果。 (2) 其中,α为非线性系数。 受到上述不同控制方法所具有的不同特点的 从而可得船舶航向的非线性响应模型为 启发,考虑到船舶航向系统具有不确定性和非线 地=r 性的特点,本文针对船舶模型非线性、时变的特 (3) 点设计了一个线性自抗扰(LADRC)控制器。为 了解决被控对象受到环境等影响变化范围大从而 为了更具一般性,同时考虑外部扰动,通常将 恶化控制效果的问题,进一步提高控制器的鲁棒 式(3)写为 性,引入了自适应ESO和自适应PD的概念,利 山=r i=f(r)+w(t)+bo (4) 用ANFIS实现参数的在线调整,设计了一种自适
究船舶航向的控制具有重要的意义[2]。 船舶航向的控制问题即令船舶航向跟踪上设 定值实质上包含两部分内容:一是当船舶在目标 航向上受到扰动时,舵角改变量应尽量小以减少 燃料损耗;二是当航向设定值改变时,船舶航向 可以快速准确地跟踪上新的设定值[3]。为了达到 这两个目标,近年来国内外的研究者们提出了众 多的控制方法应用到船舶自动舵的设计中,大致 可以分为 3 类:早期的经典 PID 控制,上世纪 70 年代出现的自适应控制和现在应用较多的智 能控制。文献 [4] 针对船舶运动模型中的参数不 确定性和外扰不确定性的问题,将 PID 与补偿控 制相结合,提出了一种船舶航向鲁棒 PID 型自动 舵;文献 [3,5] 借鉴反步法的思想,设计了船舶航 向控制器;文献 [6] 考虑到船舶所受外扰的不确 定性和舵机舵角的实际物理约束,设计了自适应 鲁棒控制器,引入动态面简化控制器计算;文献 [7] 首次将系统状态和控制输入由平面输出和它 的导数表示,结合滑模控制和微分平坦的特点设 计了有效的航向控制器;文献 [8] 对于船舶航向 保持问题提出了基于特征值分解的自适应滑模控 制器;文献 [9] 将模糊神经网络与内模控制相结 合设计了航向控制器。到目前为止,已经有多种 方法用于航向控制,并且取得了不错的控制效 果;但由于上述大多数算法结构复杂,计算量大, 对模型要求较高等原因,不易于工程实现。 韩京清教授提出自抗扰控制后[10] ,自抗扰控 制技术凭借其鲁棒性强、易于理解、结构简单且 不依赖于模型等特点受到了国内外学者的广泛关 注 [11] ,理论证明的结果也层出不穷[12]。ADRC 凭 借其结构简单、鲁棒性强也被应用于船舶控制 中。文献 [13] 将自抗扰控制技术应用于航向控 制,仿真表明该控制器具有良好的适应能力;文 献 [14] 基于船舶非线性 Bech 模型设计了高阶 ADRC 控制器。通过对已有自抗扰控制航向的相 关文献学习发现,目前在船舶自动舵设计中的参 数大多都是在初始设计时给定,因此当船舶受到 较大的扰动或者船舶航行状态发生较大改变时, 难以达到较好的控制效果。 受到上述不同控制方法所具有的不同特点的 启发,考虑到船舶航向系统具有不确定性和非线 性的特点,本文针对船舶模型非线性、时变的特 点设计了一个线性自抗扰 (LADRC) 控制器。为 了解决被控对象受到环境等影响变化范围大从而 恶化控制效果的问题,进一步提高控制器的鲁棒 性,引入了自适应 ESO 和自适应 PD 的概念,利 用 ANFIS 实现参数的在线调整,设计了一种自适 应新型航向控制器,与固定参数的控制器进行对 比,观察其在风、浪等环境扰动和载重变化等引 起的参数摄动下的控制效果。 1 船舶航向控制模型 常规水面船舶的主要操纵设备为螺旋桨和舵 机,螺旋桨产生推进力用来控制船舶的前进速 度,舵机产生舵角来保持和改变船首方向。 ψ ψr δ 图 1 中,船舶的实时航向 可以通过设备直 接测得,航向的设定值 由用户给出,船舶航向控 制即设计控制器跟踪航向设定值。船舶受到的风 浪扰动作用可折合成等效舵角进行数学模拟,考 虑舵机特性,与实际舵角 一同进入船舶模型。 其中船舶航行过程中受到的浪、流干扰及产生的 参数摄动都会为控制器的设计带来一定的困难。 控制器 舵机模型 船舶模型 浪、流 干扰 参数 摄动 ψr δr δ ψ 图 1 船舶航向控制示意 Fig. 1 Schematic diagram of ship course control 1.1 航向控制的简化模型 δ˙ ⩽ 3 ∼ 6 (°)/s 船舶模型具有大惯性、大时滞的特点,且其 操舵机构能量有限,可提供的舵角变化速度通常 较低,为 ,因此船舶运动具有低频 特性。在船舶自动舵的设计中,一阶响应模型即 野本 (Nomoto) 方程[15] 被广泛采用,它最早是由野 本采用类比建模法从简单力学意义上得出的。为 Tr˙ +r = Kδ (1) 式中:r = ψ˙ 为船舶转首角速度; ψ 为航向角; δ 为 舵机舵角;K 和 T 为船舶操纵性指数。 αr 3 实际航向中,船舶纵向速度的变化和流体动 力的非线性特性都会使船舶的操舵响应呈现出非 线性,非线性的影响通过引入非线性项 实 现,即 Tr˙ +r +αr 3 = Kδ (2) 其中,α 为非线性系数。 从而可得船舶航向的非线性响应模型为 ψ˙ = r r˙ = − 1 T r − α T r 3 + K T δ (3) 为了更具一般性,同时考虑外部扰动,通常将 式 (3) 写为 { ψ˙ = r r˙ = f(r)+w(t)+bδ (4) ·256· 智 能 系 统 学 报 第 15 卷
第2期 秦贝贝,等:基于自适应神经模糊推理系统的船舶航向自抗扰控制 ·257· 式中:b为控制增益;w()为外部扰动;fr)为系统 的内部扰动,即未建模动态。 1.2舵机特性 船艏方向的保持和改变主要是通过合理操作 舵机实现的。舵机是一个动态系统,受实际物理 条件的制约,有最大操舵角和最大操舵角速度的 ESO 限制,目前应用较多的为一阶惯性模型,表达式为 6=KE(6,-)/TE (5) 图2船舶航向自抗扰控制结构 式中:Kε为舵机控制增益,一般取为1;TE为舵机 Fig.2 Structure of ADRC control for ship course 时间常数:6为实际舵角:6为命令舵角。 控制目标是求得控制舵角6,使山→山。在航 结合式(4)和式(⑤),考虑舵机特性的船舶航 向改变过程中,使用二阶滤波器进行柔化,用滤 向控制系统的非线性响应数学模型可以表示为 波后的期望航向山代替变化剧烈的设定信号少,有 山=r 4=。 w员 产=f(r)+w(r)+b6 (6) 少,s2+250ns+w (7) δ=KE(6,-6)/TE 式中:、wm为设计参数;越大,妇变化越平缓。 1.3船舶运动干扰 当期望的航向角信号少未被噪声污染时,可 船舶在运动中会受到多种环境干扰,大致可 以省略跟踪微分器,把对系统的跟踪控制改变为 分为3类: 系统的镇定控制问题。为了直观,将系统写为 1)船舶航行时的载重、航行速度、吃水深度 y=山-山a 等的变化,会造成船舶的水动力系数发生改变, y=yI 这种扰动为系统内部不确定性,表现为系统的参 乃=f+bu (8) 1 数摄动,很难计算。 f=7r--b=u=6 K 2)船舶在航行过程中总是存在风、浪、流等 控制器的控制目标为:y→0,)→0。 外界干扰,表现为干扰力和干扰力矩,是不可测 则式(⑧)的线性ESO可设计为 的,但可以通过一些器件进行模拟,设计控制器 eo=Z1-y 时应予以考虑。 i1=2-f01e0 i2=73-Bozeo+bou (9) 3)船舶航行时电源和油源的波动和测量噪声 3=-fo3e0 的存在,其属于低频干扰,影响相对小得多,设计 控制器时不予考虑。 式中:Bo1,B2,B]=[3wo,3w2,w引,w。为ES0带宽。 带宽越大,观测器的估计能力就越强,但对输入 2基于ADRC的船舶航向控制器设计 噪声也更为敏感。因此在实际控制应用中,观测 器带宽需要根据实际“总扰动”的大小合理选择。 高志强教授与韩京清研究员长期合作,在深 误差反馈律采用线性PD组合,得到误差反 刻理解抗扰思想、深入分析和思考控制问题本质 馈控制律为 的基础上,提出了频率尺度这一与工程应用紧密 uo=-(kpe+kae)=-kpz-kaz2 相关的概念,将ADRC参数与控制器和观测器的 u=Mo-2 (10) 带宽相关联,解决了传统ADRC技术参数整定困 bo 难的问题,简化了参数的整定过程1。线性AD 式中:[k,ka=[w2,2w],we为控制器带宽。 RC由3部分组成,分别为跟踪微分器(TD)、线性 2.2自适应神经模糊推理系统 扩张状态观测器(LE$O)和线性误差反馈控制律 自适应神经模糊推理系统(ANFIS)是由J-SR (LSEF)。其中,在某些情况下,TD的设计步骤可 Jang提出的一种基于T-S模型的自适应神经模糊 以省略,更加简化了LADRC的控制结构。 推理系统。该系统将神经网络与模糊推理结合, 2.1船舶航向控制器设计 根据输入一输出对的信息,采用混合算法可以自 为了使设计简单,设计控制器时把船舶和舵 动产生if-then规则,实现隶属度函数的在线调整。 机看作一个整体,将舵机特性作为航向控制系统 ANFIS通过对未知函数训练集样本的聚类分 的扰动,利用线性扩张状态观测器(LESO)进行观 析可近似未知函数,还可用于模式识别,分类问 测,控制系统的结构框图如图2所示。 题,过程控制等。ANFIS的典型结构如图31
式中: b 为控制增益; w(t) 为外部扰动; f(r) 为系统 的内部扰动,即未建模动态。 1.2 舵机特性 船艏方向的保持和改变主要是通过合理操作 舵机实现的。舵机是一个动态系统,受实际物理 条件的制约,有最大操舵角和最大操舵角速度的 限制,目前应用较多的为一阶惯性模型,表达式为 δ˙ = KE(δr −δ)/TE (5) KE TE δ δr 式中: 为舵机控制增益,一般取为 1; 为舵机 时间常数; 为实际舵角; 为命令舵角。 结合式 (4) 和式 (5),考虑舵机特性的船舶航 向控制系统的非线性响应数学模型可以表示为 ψ˙ = r r˙ = f(r)+w(r)+bδ δ˙ = KE(δr −δ)/TE (6) 1.3 船舶运动干扰 船舶在运动中会受到多种环境干扰,大致可 分为 3 类: 1) 船舶航行时的载重、航行速度、吃水深度 等的变化,会造成船舶的水动力系数发生改变, 这种扰动为系统内部不确定性,表现为系统的参 数摄动,很难计算。 2) 船舶在航行过程中总是存在风、浪、流等 外界干扰,表现为干扰力和干扰力矩,是不可测 的,但可以通过一些器件进行模拟,设计控制器 时应予以考虑。 3) 船舶航行时电源和油源的波动和测量噪声 的存在,其属于低频干扰,影响相对小得多,设计 控制器时不予考虑。 2 基于 ADRC 的船舶航向控制器设计 高志强教授与韩京清研究员长期合作,在深 刻理解抗扰思想、深入分析和思考控制问题本质 的基础上,提出了频率尺度这一与工程应用紧密 相关的概念,将 ADRC 参数与控制器和观测器的 带宽相关联,解决了传统 ADRC 技术参数整定困 难的问题,简化了参数的整定过程[16]。线性 ADRC 由 3 部分组成,分别为跟踪微分器 (TD)、线性 扩张状态观测器 (LESO) 和线性误差反馈控制律 (LSEF)。其中,在某些情况下,TD 的设计步骤可 以省略,更加简化了 LADRC 的控制结构。 2.1 船舶航向控制器设计 为了使设计简单,设计控制器时把船舶和舵 机看作一个整体,将舵机特性作为航向控制系统 的扰动,利用线性扩张状态观测器 (LESO) 进行观 测,控制系统的结构框图如图 2 所示。 舵 机 船 舶 ψd ψ kp kd z3 z2 z1 b0 w(t) 1 − − − − u δ LESO 图 2 船舶航向自抗扰控制结构 Fig. 2 Structure of ADRC control for ship course δ ψ → ψr ψd ψr 控制目标是求得控制舵角 ,使 。在航 向改变过程中,使用二阶滤波器进行柔化,用滤 波后的期望航向 代替变化剧烈的设定信号 ,有 ψd ψr = ω 2 n s 2 +2ξωn s+ω2 n (7) 式中: ξ、ωn 为设计参数; ξ 越大, ψd 变化越平缓。 当期望的航向角信号 ψd 未被噪声污染时,可 以省略跟踪微分器,把对系统的跟踪控制改变为 系统的镇定控制问题。为了直观,将系统写为 y = ψ−ψd y˙ = y1 y˙1 = f +bu f = − 1 T r − α T r 3 −ψ¨ d ;b = K T ;u = δ (8) 控制器的控制目标为: y → 0, y˙ → 0。 则式 (8) 的线性 ESO 可设计为 e0 = z1 −y z˙1 = z2 −β01e0 z˙2 = z3 −β02e0 +b0u z˙3 = −β03e0 (9) [ β01, β02, β03] = [ 3ωo,3ω 2 o ,ω3 o ] 式中: ,ωo 为 ESO 带宽。 带宽越大,观测器的估计能力就越强,但对输入 噪声也更为敏感。因此在实际控制应用中,观测 器带宽需要根据实际“总扰动”的大小合理选择。 误差反馈律采用线性 PD 组合,得到误差反 馈控制律为 u0 = −(kpe+kde˙) = −kpz1 −kdz2 u = u0 −z3 b0 (10) [ kp, kd ] = [ ω 2 c ,2ωc ] 式中: ,ωc 为控制器带宽。 2.2 自适应神经模糊推理系统 自适应神经模糊推理系统 (ANFIS) 是由 J-S R Jang 提出的一种基于 T-S 模型的自适应神经模糊 推理系统。该系统将神经网络与模糊推理结合, 根据输入−输出对的信息,采用混合算法可以自 动产生 if-then 规则,实现隶属度函数的在线调整。 ANFIS 通过对未知函数训练集样本的聚类分 析可近似未知函数,还可用于模式识别,分类问 题,过程控制等。ANFIS 的典型结构如图 3 [17-18]。 第 2 期 秦贝贝,等:基于自适应神经模糊推理系统的船舶航向自抗扰控制 ·257·
·258· 智能系统学报 第15卷 的准确性。为了提高状态估计精度,改善控制性 能,根据图5设计了一个双入单出的网络实现w。 的在线调整(无需考虑图5的点划线部分)从而 实现ESO增益的在线调整。 B, X1 X2 输 第 第 第 第 输 航向角 层 层 层 出 误差 wk) 图3 ANFIS的典型结构 Fig.3 Typical structure of ANFIS 误差 图3中给出的是一个MIS0系统,其中x1, 变化率 是系统的输人,y为推理输出。该系统可被视为 一个5层的网络,其中方形结点表示自适应结点, 图5 ANFIS网络结构 该结点内包含参数并且参数是可变的;圆形结点 Fig.5 Network structure diagram of ANFIS 代表固定结点,不包含参数。对整个系统来说, ANFIS的参数优化算法分为正向计算和反向 可调整参数集是自适应结点参数集的并集,其中 计算两个过程。 第1层参数被称为前提参数,第4层参数被称为 I)ANFIS的正向计算: 结论参数。网络参数的学习根据实际工作的需要 第1层隶属度选择高斯函数: 可以采取不同的方法:梯度下降与最小二乘的混 合算法、递推最小二乘、仅使用梯度下降法等。 4=ew;i=1,2:j=1,…,5 (11) 在本文的设计中,采用第3种方法实现参数的学习。 第2层计算每一条规则的适应度: 2.3基于ANFIS的自适应ADRC控制器设计 we=:ji,j2∈{1,2,…,5:k=1,2,…,25 (12) 为了解决被控对象变化范围大而快使得控制 第3层对每一个适应度进行归一化: 效果变差的问题,进一步提高ADRC的鲁棒性, Wk = (13) 利用ANFIS网络分别实现ESO带宽w。和线性误 差反馈律PD参数[k,k]的在线调整,设计了改 进的ADRC控制策略19,控制结构图如图4所示。 第4层为模糊规则的输出,每条规则的输出 是输入变量的线性组合,即 ·BP算法 ANFIS结构 R:ifxis x is thenf is 模糊化模糊推理 w() fi=puxr+pax2+por (14) o kt kg 第5层是网络的输出层,有 ADRC 5 -de/dr .=y- (15) = 图4 ANFIS-ADRC结构 2)ANFIS的反向计算: Fig.4 Diagram of ANFIS-ADRC ANFIS的反向计算选择BP算法进行参数调 为了实现控制器所期望的功能,设计了两个 整,性能指标函数为 ANFIS系统,每一个系统都是一个5层的前馈神 =因-r= (16) 经网络:输人层变量都选为2个,分别为航向误差 e=山-u和航向误差变化率de=e;每个变量语言 该网络中可以调整的参数包括式(11)中的前 值个数为5,为{NB,NS,ZE,PS,PB};隶属度函数选 提参数σ,c和式(14)中的结论参数p,对于每一 择高斯函数;设计模糊规则个数为5×5=25个;输 参数均沿其负梯度方向调整得: 出层有所不同,Adaptive-ESO输出变量个数为1, w0-器恶胎 (17) 为w;Adaptive-PD输出变量个数为2,为[k,kao 根据上述规则,设计出如下ANFIS参数调整网络: 其中,2表示可调整参数集合,2={σ,c,p以。 2.3.1AESO-ADRC控制器设计 由于心未知,采用符号函数近似代替,由 由式(9)可知,ESO有3个重要参数:B1、 近似带来的数值上的误差可以通过合理选择学习 B2、B,这3个参数直接影响观测器对状态估计 步长刀进行补偿。用来近似的符号函数为
x1 x1 x2 x2 x1 x2 A1 A2 w1 w2 w1 w2 y B1 B2 输 入 输 出 图 3 ANFIS 的典型结构 Fig. 3 Typical structure of ANFIS x1, x2 y 图 3 中给出的是一个 MISO 系统,其中 是系统的输入, 为推理输出。该系统可被视为 一个 5 层的网络,其中方形结点表示自适应结点, 该结点内包含参数并且参数是可变的;圆形结点 代表固定结点,不包含参数。对整个系统来说, 可调整参数集是自适应结点参数集的并集,其中 第 1 层参数被称为前提参数,第 4 层参数被称为 结论参数。网络参数的学习根据实际工作的需要 可以采取不同的方法:梯度下降与最小二乘的混 合算法、递推最小二乘、仅使用梯度下降法等。 在本文的设计中,采用第 3 种方法实现参数的学习。 2.3 基于 ANFIS 的自适应 ADRC 控制器设计 ωo [ kp, kd ] 为了解决被控对象变化范围大而快使得控制 效果变差的问题,进一步提高 ADRC 的鲁棒性, 利用 ANFIS 网络分别实现 ESO 带宽 和线性误 差反馈律 PD 参数 的在线调整,设计了改 进的 ADRC 控制策略[19] ,控制结构图如图 4 所示。 ψr ωo kp kd ADRC w(t) e u δ ψ − ec de/dt ANFIS结构 模糊化 模糊推理 BP算法 舵 机 船 舶 图 4 ANFIS-ADRC 结构 Fig. 4 Diagram of ANFIS-ADRC e = ψ−ψd de = e˙ ωo [ kp, kd ] 为了实现控制器所期望的功能,设计了两个 ANFIS 系统,每一个系统都是一个 5 层的前馈神 经网络:输入层变量都选为 2 个,分别为航向误差 和航向误差变化率 ;每个变量语言 值个数为 5,为{NB,NS,ZE,PS,PB};隶属度函数选 择高斯函数;设计模糊规则个数为 5×5=25 个;输 出层有所不同,Adaptive-ESO 输出变量个数为 1, 为 ;Adaptive-PD 输出变量个数为 2,为 。 根据上述规则,设计出如下 ANFIS 参数调整网络: 2.3.1 AESO-ADRC 控制器设计 β01 β02 β03 由式 (9) 可知, ESO 有 3 个重要参数: 、 、 ,这 3 个参数直接影响观测器对状态估计 ωo 的准确性。为了提高状态估计精度,改善控制性 能,根据图 5 设计了一个双入单出的网络实现 的在线调整 (无需考虑图 5 的点划线部分),从而 实现 ESO 增益的在线调整。 μ 5 1 μ 5 2 μ 1 2 f 1 1 f 1 2 f 2 2 f 2 1 f 1 25 f 2 25 w25 w25 w2 w2 w1 w1 ... ... 航向角 误差 误差 变化率 ... ... ωo (kp ) kd 图 5 ANFIS 网络结构 Fig. 5 Network structure diagram of ANFIS ANFIS 的参数优化算法分为正向计算和反向 计算两个过程。 1) ANFIS 的正向计算: 第 1 层隶属度选择高斯函数: µ j i = e − (xi−ci j) 2 σ 2 i j ;i = 1,2; j = 1,··· ,5 (11) 第 2 层计算每一条规则的适应度: wk = µ j1 1 µ j2 2 ; j1, j2 ∈ {1,2,··· ,5}; k = 1,2,··· ,25 (12) 第 3 层对每一个适应度进行归一化: w¯ k = wk ∑25 k=1 wk (13) 第 4 层为模糊规则的输出,每条规则的输出 是输入变量的线性组合,即 Rk x1 µ j 1 x2 µ j 2 f :if is , is , then k is fk = p1k x1 + p2k x2 + p0k (14) 第 5 层是网络的输出层,有 ωo = y = ∑25 k=1 w¯ k fk (15) 2) ANFIS 的反向计算: ANFIS 的反向计算选择 BP 算法进行参数调 整,性能指标函数为 J(k) = 1 2 (ψ(k)−ψd(k))2 = 1 2 e(k) 2 (16) σ,c p 该网络中可以调整的参数包括式 (11) 中的前 提参数 和式 (14) 中的结论参数 ,对于每一 参数均沿其负梯度方向调整得: ∆Ω = − ∂J ∂Ω = − ∂J ∂e · ∂e ∂ψ · ∂ψ ∂ωo · ∂ωo ∂Ω (17) 其中, Ω 表示可调整参数集合, Ω = {σ, c, p}。 ∂ψ ∂ωo η 由于 未知,采用符号函数近似代替,由 近似带来的数值上的误差可以通过合理选择学习 步长 进行补偿。用来近似的符号函数为 ·258· 智 能 系 统 学 报 第 15 卷
第2期 秦贝贝,等:基于自适应神经模糊推理系统的船舶航向自抗扰控制 ·259· u(k) yB=3w(k ≈sign(a(k)/a△w.(k)= 3仿真分析 (k)-(k-1) (18) 本文以“育龙”轮为仿真对象,选择航速为 sign A(k)-A(k-1) wk)≠△w(k-1) 7.2m/s的状态进行控制,操纵性指数K=0.478s, sign(w(k-(k-1),△w(k)=△w(k-1) T=216s,a=30,舵机时间常数为2.5s,船舶舵角 式(18)代入式(17),并化简得 的极限值为352o。分别采用LADRC和自适应 0- dw =-eg02 (19) ADRC进行控制,观察其控制效果。设定的航向 82 指令信号为周期为600s、幅值为30°的方波。 网络输出分别对各参数求偏导得 3.1仿真参数 0w。 Wk i=0 Pik mxi≠0 选取仿真参数为:h=0.01,b。=0.0022;w=0.7, w。=0.04;5=0.95,wn=0.045。 Wk- w AESO控制器:n=0.5,a=0.1;ANFIS网络先 dw. 1 2(x-c 进行标称模型下的100次离线优化,将优化后的 i (20) ANFIS作为初始网络,再利用式(21)和式(22)对 2 -∑w 系统进行在线微调,以期达到更好的控制效果。 8wo 2(-c)月 APD-ADRC控制器:7=0.007,a=0.01;将 Ooi ∑ 2 LADRC中的PD增益作为网络期望输出,对AN- FIS网络进行10次离线训练,将训练后的参数作 式中m表示所有与c、σ有关的模糊规则数。 为网络的初值,再利用式(24)进行在线微调。 采用改进BP算法,附加一个加快搜索速度 3.2仿真结果与分析 的惯性项,则参数的学习算法为 利用MATLAB进行仿真实验,分别进行了理 2(k+1)=2(k)+7△2(k)+a△2(k-1) (21) 想状态下和有扰动情况下的仿真;扰动表现为参 2.3.2APD-ADRC控制器设计 数摄动和外界扰动;参数摄动为随机参数摄动; 与自适应ESO的设计方法类似,PD参数的 外界扰动包括恒值干扰和低频正弦干扰两种情 在线调整也利用ANFIS网络实现。除网络第 况。各控制器的仿真结果如下。 5层变为两个输出变量(考虑图中的点划线部分) 3.2.1理想状态 之外,网络其他部分结构与上一节相同。 图6~8分别为在不考虑外界扰动和参数摄动 由于网络结构细微的不同,网络正向计算和 时,设定航向为幅值30°,周期600s的方波信号 反向的公式略有改变。 时,所设计的不同控制器下的仿真结果。 正向计算: 30 第4层: 20 fu Puxr+paxz+pofa Pix+pixz+Poe (22) 第5层: 0 (23) --LADRC k=为=∑m房 0 200 4006008001000 你 性能指标仍为式(16),类似地,采用符号函数 图6无干扰时LADRC的航向曲线 代替难求解的偏导项,可得 Fig.6 Heading curve of LADRC without interference kp 30 =-e.y-Z1. +(-22): (24) 02 02 02 d(k) 20 yu= ≈sign(0(k)/0△4o(k)= 8w(k) k)-k-1) ()-△ok-△因≠A(k-1) sign- sign((k)-(k-1),△o(k)=△o(k-1) ----AES0 0 2004006008001000 驰驰的计算方式与式(20)类似,此处不再赘述。 (a)无干扰时航向曲线(AESO)
yβ = ∂ψ(k) ∂ωo(k) ≈ sign( ∂ψ(k)/ ∂∆ωo(k)) = sign ψ(k)−ψ(k−1) ∆ωo(k)−∆ωo(k−1) ,∆ωo(k) , ∆ωo(k−1) sign(ψ(k)−ψ(k−1)),∆ωo(k) = ∆ωo(k−1) (18) 式 (18) 代入式 (17),并化简得 ∆Ω = − ∂J ∂Ω = −e · yβ · ∂ωo ∂Ω (19) 网络输出分别对各参数求偏导得 ∂ωo ∂pik = { w¯ k i = 0 w¯ k xi i , 0 ∂ωo ∂ci j = ∑25 k=1 wk − ∑nl l=1 wl · ∑nl l=1 wl fl ∑ wk 2 · 2 ( xi −ci j) σ 2 i j ∂ωo ∂σi j = ∑25 k=1 wk − ∑nl l=1 wl · ∑nl l=1 wl fl ∑ wk 2 · 2 ( xi −ci j)2 σ 3 i j (20) 式中nl 表示所有与 ci j、σi j 有关的模糊规则数。 采用改进 BP 算法,附加一个加快搜索速度 的惯性项,则参数的学习算法为 Ω(k+1) = Ω(k)+η∆Ω(k)+α∆Ω(k−1) (21) 2.3.2 APD-ADRC 控制器设计 与自适应 ESO 的设计方法类似,PD 参数的 在线调整也利用 ANFIS 网络实现。除网络第 5 层变为两个输出变量 (考虑图中的点划线部分) 之外,网络其他部分结构与上一节相同。 由于网络结构细微的不同,网络正向计算和 反向的公式略有改变。 正向计算: 第 4 层: f1k = p 1 1k x1 + p 1 2k x2 + p 1 0k f2k = p 2 1k x1 + p 2 2k x2 + p 2 0k (22) 第 5 层: kp = y1 = ∑25 k=1 w¯ k f 1 k kd = y2 = ∑25 k=1 w¯ k f 2 k (23) 性能指标仍为式 (16),类似地,采用符号函数 代替难求解的偏导项,可得 ∆Ω = − ∂J ∂Ω = −e · yu · ( −z1 · ∂kp ∂Ω +(−z2)· ∂kd ∂Ω ) (24) yu = ∂ψ(k) ∂ωo(k) ≈ sign( ∂ψ(k)/ ∂∆u0(k)) = sign ψ(k)−ψ(k−1) ∆u0(k)−∆u0(k−1) ,∆u0(k) , ∆u0(k−1) sign(ψ(k)−ψ(k−1)),∆u0(k) = ∆u0(k−1) ∂kp ∂Ω , ∂kd ∂Ω 的计算方式与式 (20) 类似,此处不再赘述。 3 仿真分析 K = 0.478 s−1 T = 216 s,α = 3035◦ 本文以“育龙”轮为仿真对象,选择航速为 7.2 m/s 的状态进行控制,操纵性指数 , ,舵机时间常数为 2.5 s,船舶舵角 的极限值为 [20]。分别采用 LADRC 和自适应 ADRC 进行控制,观察其控制效果。设定的航向 指令信号为周期为 600 s、幅值为 30°的方波。 3.1 仿真参数 ωo = 0.7 ωc = 0.04 ξ = 0.95,ωn = 0.045 选取仿真参数为:h=0.01, b0=0.002 2; , ; 。 AESO 控制器: η = 0.5,α = 0.1 ;ANFIS 网络先 进行标称模型下的 100 次离线优化,将优化后的 ANFIS 作为初始网络,再利用式 (21) 和式 (22) 对 系统进行在线微调,以期达到更好的控制效果。 APD-ADRC 控制器: η = 0.007,α = 0.01 ; 将 LADRC 中的 PD 增益作为网络期望输出,对 ANFIS 网络进行 10 次离线训练,将训练后的参数作 为网络的初值,再利用式 (24) 进行在线微调。 3.2 仿真结果与分析 利用 MATLAB 进行仿真实验,分别进行了理 想状态下和有扰动情况下的仿真;扰动表现为参 数摄动和外界扰动;参数摄动为随机参数摄动; 外界扰动包括恒值干扰和低频正弦干扰两种情 况。各控制器的仿真结果如下。 3.2.1 理想状态 30◦ 图 6~8 分别为在不考虑外界扰动和参数摄动 时,设定航向为幅值 ,周期 600 s 的方波信号 时,所设计的不同控制器下的仿真结果。 0 200 400 600 800 t/s 0 10 20 30 ψ/(°) ψd LADRC 1 000 图 6 无干扰时 LADRC 的航向曲线 Fig. 6 Heading curve of LADRC without interference (a) 无干扰时航向曲线(AESO) 0 200 400 600 800 1 000 t/s 0 10 20 30 ψ/(°) ψd AESO 第 2 期 秦贝贝,等:基于自适应神经模糊推理系统的船舶航向自抗扰控制 ·259·
·260· 智能系统学报 第15卷 1.0 参数的在线调整曲线,由于APD-ANFIS的离线训 练以LADRC的PD增益作为期望输出,所以在线 参数调整时,其控制器增益的值在{0.08,0.0016} 80.5 上下波动。 3.2.2存在外部扰动时的仿真结果 1)恒值干扰。 0 200 400 600 8001000 s 在200s时施加幅值为7°的等效恒值扰动时, (b)ESO带宽训练曲线 控制器的仿真结果如图9。 120 100 IAE 40 一 30 -LADRC 60 Q20 10 00 20 40 60 80100 0 180220260 次数 (c)IAE指标随学习次数的变化 0 200400600 8001000 (a)LADRC 图7无干扰时AESO的航向和参数曲线 Fig.7 Heading and parameter curves of AESO without in- 40 terference 30 -AESO 40 20 30 10 20 200,250 0 10 200400.6008001000 s (b)AESO 0 ---APD 40 0 200 400 6008001000 30 a (a)控制器增益自适应的航向曲线 -APD 0.10 10 翼005 0 10 240 一k 0 200 400 60 8001000 (C)自适应PD 0 200400,6008001000 图9恒值干扰时的航向曲线 (b)控制器增益训练曲线 Fig.9 Heading of constant interference 图8无干扰时自适应PD的航向和参数曲线 观察图9可以看出,基于ANFIS的在线参数 Fig.8 Heading and parameter curves of APD without in- 调整控制器在受到扰动时仍旧可以很好的跟踪目 terference 标航向,并且不会产生大的超调;比较图9(b)和 观察无扰动标称模型情况下的仿真结果可 图9(C)可知,自适应ESO-ADRC控制器在受到恒 知,3种控制器都可以实现不错的控制效果,表明 值干扰时的控制性能优于自适应PD-ADRC控制 自抗扰控制器可以用于船舶航向的控制,并且在 器;而由图9(a)可知,当系统受到扰动时,船舶航 不受扰动的情况下,可以达到良好的控制效果。 向产生了明显超调,这是在实际控制中不希望看 由图7(c)可知,随着网络离线学习次数的增大, 到的。 误差绝对值积分性能指标①AE)减小,说明网络 设定值不变,在200~800s施加一个幅值为 参数在朝着好的方向变化;图7(b)和图8(b)均为 4°,频率为0.1rad/s的等效舵角干扰,仿真如图10
(b) ESO带宽训练曲线 (c) IAE指标随学习次数的变化 次数 0 20 40 60 80 100 20 40 60 80 100 120 IAE 0 200 400 600 800 t/s 0.5 1.0 1 000 ωo IAE 图 7 无干扰时 AESO 的航向和参数曲线 Fig. 7 Heading and parameter curves of AESO without interference 1 000 1 000 0 200 400 600 800 t/s 0 10 20 30 40 ψ/(°) ψd APD (a) 控制器增益自适应的航向曲线 200 400 600 800 t/s 0 0.05 0.10 增益 (b) 控制器增益训练曲线 kp kd 图 8 无干扰时自适应 PD 的航向和参数曲线 Fig. 8 Heading and parameter curves of APD without interference 观察无扰动标称模型情况下的仿真结果可 知,3 种控制器都可以实现不错的控制效果,表明 自抗扰控制器可以用于船舶航向的控制,并且在 不受扰动的情况下,可以达到良好的控制效果。 由图 7(c) 可知,随着网络离线学习次数的增大, 误差绝对值积分性能指标 (IAE) 减小,说明网络 参数在朝着好的方向变化;图 7(b) 和图 8(b) 均为 参数的在线调整曲线,由于 APD-ANFIS 的离线训 练以 LADRC 的 PD 增益作为期望输出,所以在线 参数调整时,其控制器增益的值在{0.08,0.001 6} 上下波动。 3.2.2 存在外部扰动时的仿真结果 1) 恒值干扰。 在 200 s 时施加幅值为 7°的等效恒值扰动时, 控制器的仿真结果如图 9。 0 200 400 600 800 t/s 0 10 20 30 ψ/(°) ψd LADRC (a) LADRC 0 200 400 600 800 t/s 0 10 20 30 40 40 40 ψ/(°) (b) AESO 0 200 400 600 800 t/s 0 10 20 30 ψ/(°) ψd APD 180 240 28 30 32 (c) 自适应PD ψd AESO 200 250 28 30 32 1 000 1 000 180 220 260 28 30 32 1 000 图 9 恒值干扰时的航向曲线 Fig. 9 Heading of constant interference 观察图 9 可以看出,基于 ANFIS 的在线参数 调整控制器在受到扰动时仍旧可以很好的跟踪目 标航向,并且不会产生大的超调;比较图 9(b) 和 图 9(c) 可知,自适应 ESO-ADRC 控制器在受到恒 值干扰时的控制性能优于自适应 PD-ADRC 控制 器;而由图 9(a) 可知,当系统受到扰动时,船舶航 向产生了明显超调,这是在实际控制中不希望看 到的。 0.1 rad/s 设定值不变,在 200~800 s 施加一个幅值为 4°,频率为 的等效舵角干扰,仿真如图 10。 ·260· 智 能 系 统 学 报 第 15 卷
第2期 秦贝贝,等:基于自适应神经模糊推理系统的船舶航向自抗扰控制 ·261· 40m a RC控制器的IAE值最小,APD-ADRC次之,LAD 30 -LADRC RC最大,也就是说在同等情况下,AESO-AD RC控制器的控制效果最好。 20 表1各控制器在不同条件下的AE值 10 Table 1 IAE of controllers under different conditions ( 220 240 仿真条件 LADRC AESO APD-ADRC 200400.600 8001000 无干扰 1824.3 1386.9 1812.2 (a)LADRC 恒值干扰 2237.7 1736.7 2205.8 40 正弦干扰 2980.1 2187.6 2947.7 30 AESO 3.2.4参数摄动下的蒙特卡罗仿真结果 20 为了比较3种控制器的鲁棒性,在控制器参 数不变的情况下,令船舶参数K、T、α产生一个 10 ±50%的随机摄动,进行100次蒙特卡罗实验,比 0 较不同控制器的控制性能。 210 230 0 200 400 600 8001000 观察仿真结果图11~13可以发现,当系统存 t 在参数摄动时,3种控制器都可以实现不错的控 (b)AESO 制效果,且自适应ESO与自适应PD控制器的控 40 制效果优于LADRC控制器。 30 40 PD 。20 30 10 6 20 0 0 29 20022020 0 200400 6008001000 (C)自适应PD 50 100150200250 图10低频干扰时的航向曲线 图11参数摄动时LADRC的航向角曲线 Fig.10 Heading of low frequency interference Fig.11 Heading of LADRC with parameter perturbation 由图10可以看出,当系统受到低频正弦扰 40 动时,自适应参数的控制器的鲁棒性和跟踪性能 30 优于常规LADRC控制器;其中,AESO-ADRC控 制器的控制效果最好,在受到扰动时航向曲线的 20 上下波动幅值最小;由于APD-ADRC控制器中 10 的ANFIS网络离线学习时间是以LADRC的PD 增益作为期望输出进行训练得到的初始参数,因 50 100,150200250 此其控制性能虽然优于LADRC控制器,但其优 s 势性不够明显,还有很大的提升空间。这就意味 图12参数摄动时AES0的航向角曲线 着对于APD的初始ANFIS参数的选择可以考虑 Fig.12 Heading of AESO with parameter perturbation 40r 更好的策略,这也是之后可以进行深入研究的 方向。 30 3.2.3控制器的IAE指标对比 20 为了对控制器的控制性能进行更清晰的比 10 较,记录了在不同状况下的IAE的值,如表1。 由表1可知,对同一控制器来说,随着扰动的 50 100,150200250 变化,IAE的值在逐渐变大。其中,无干扰的情况 下IAE的值最小,正弦干扰下的IAE值最大;横 图13参数摄动时APD的航向角曲线 向读表1可知,在同种情况的干扰下,AESO-AD- Fig.13 Heading of APD with parameter perturbation
t/s ψd LADRC t/s t/s ψd APD 0 200 400 600 800 0 10 20 30 40 ψ/(°) 220 240 29 30 31 (a) LADRC 0 200 400 600 800 0 10 20 30 40 ψ/(°) 210 230 29.0 29.5 30.0 30.5 (b) AESO 0 200 400 600 800 0 10 20 30 40 ψ/(°) 200 220 240 29 30 31 (c) 自适应PD ψd AESO 1 000 1 000 1 000 图 10 低频干扰时的航向曲线 Fig. 10 Heading of low frequency interference 由图 10 可以看出,当系统受到低频正弦扰 动时,自适应参数的控制器的鲁棒性和跟踪性能 优于常规 LADRC 控制器;其中,AESO-ADRC 控 制器的控制效果最好,在受到扰动时航向曲线的 上下波动幅值最小;由于 APD-ADRC 控制器中 的 ANFIS 网络离线学习时间是以 LADRC 的 PD 增益作为期望输出进行训练得到的初始参数,因 此其控制性能虽然优于 LADRC 控制器,但其优 势性不够明显,还有很大的提升空间。这就意味 着对于 APD 的初始 ANFIS 参数的选择可以考虑 更好的策略,这也是之后可以进行深入研究的 方向。 3.2.3 控制器的 IAE 指标对比 为了对控制器的控制性能进行更清晰的比 较,记录了在不同状况下的 IAE 的值,如表 1。 由表 1 可知,对同一控制器来说,随着扰动的 变化,IAE 的值在逐渐变大。其中,无干扰的情况 下 IAE 的值最小,正弦干扰下的 IAE 值最大;横 向读表 1 可知,在同种情况的干扰下,AESO-ADRC 控制器的 IAE 值最小,APD-ADRC 次之,LADRC 最大,也就是说在同等情况下,AESO-ADRC 控制器的控制效果最好。 表 1 各控制器在不同条件下的 IAE 值 Table 1 IAE of controllers under different conditions (°) 仿真条件 LADRC AESO APD-ADRC 无干扰 1 824.3 1 386.9 1 812.2 恒值干扰 2 237.7 1 736.7 2 205.8 正弦干扰 2 980.1 2 187.6 2 947.7 3.2.4 参数摄动下的蒙特卡罗仿真结果 K、T、α ± 为了比较 3 种控制器的鲁棒性,在控制器参 数不变的情况下,令船舶参数 产生一个 50% 的随机摄动,进行 100 次蒙特卡罗实验,比 较不同控制器的控制性能。 观察仿真结果图 11~13 可以发现,当系统存 在参数摄动时,3 种控制器都可以实现不错的控 制效果,且自适应 ESO 与自适应 PD 控制器的控 制效果优于 LADRC 控制器。 50 100 150 200 250 t/s 0 10 20 30 40 ψ/(°) 图 11 参数摄动时 LADRC 的航向角曲线 Fig. 11 Heading of LADRC with parameter perturbation 0 50 100 150 200 250 10 20 30 40 t/s ψ/(°) 图 12 参数摄动时 AESO 的航向角曲线 Fig. 12 Heading of AESO with parameter perturbation 0 50 100 150 200 250 10 20 30 40 t/s ψ/(°) 图 13 参数摄动时 APD 的航向角曲线 Fig. 13 Heading of APD with parameter perturbation 第 2 期 秦贝贝,等:基于自适应神经模糊推理系统的船舶航向自抗扰控制 ·261·
·262· 智能系统学报 第15卷 为了更清晰地比较不同控制器对于参数摄动 事大学.2014:1-2 的控制效果,选用表征系统暂态性能的性能指标 XI Qingchao.Research on ship course control based on the 进行评判:最大超调量M、调整时间t,和积分性 ADRC[D].Dalian:Dalian Maritime University,2014:1-2. 能指标ITAE,并绘制出散点图。其中“*”为LAD [2]邱峰.船舶航向与航迹积分滑模自抗扰保持控制D]大 RC控制;“o”为自适应ESO的ADRC控制;“+”代 连:大连海事大学,2018:1-4 表自适应PD的ADRC控制。 QIU Feng.Ship course and track sliding mode keeping 图14表明在发生参数摄动的情况下,两种自 control based on auto disturbance rejection control[D] 适应控制器均具有较小的最大超调量,并且点的 Dalian:Dalian Maritime University,2018:1-4. [3]WITKOWSKA A,TOMERA M,SMIERZCHALSKI R.A 分布更为密集;3种控制器的调节时间1,相差不 backstepping approach to ship course control[J].Interna- 大。总而言之,3种控制器的点集分布都较为集 tional journal of applied mathematics and computer sci- 中,说明3种控制器对于参数摄动都具有一定的 ence,2007,171)y73-85. 鲁棒性,但两种自适应自抗扰控制器的点集较于 [4]杨盐生,于晓利,贾欣乐.船舶航向鲁棒PID自动舵设 LADRC控制器更为集中,说明在发生参数摄动 计).大连海事大学学报,1999,25(4):11-15. 时,基于ANFIS的自适应ADRC控制器具有更好 YANG Yansheng,YU Xiaoli,JIA Xinle.Robust PID auto- 的鲁棒性,表现出更优越的控制性能。 pilot for ships[J].Journal of Dalian Maritime University, 米LADRC 1999,25(4):11-15. ×105 OAESO [5]DU Jialu,GUO Chen.Nonlinear adaptive ship course APD tracking control based on backstepping and Nussbaum gain[C]//Proceedings of 2004 American Control Confer- 米 ence.Boston.MA.USA:IEEE.2005:3845-3850 [6]DU Jialu,HU Xin,SUN Yuqing.Adaptive robust nonlin- ×10-3 超调量 ear control design for course tracking of ships subject to 03 103 external disturbances and input saturation[J].IEEE transac- 图14蒙特卡罗实验结果 tions on systems,man,and cybernetics:systems,2017. Fig.14 Monte Carlo experimental result [7]YU Renhai,LI Tieshan,LI Wei.Ship course control based on differential flatness and sliding mode[C]//Proceedings 4结束语 of the 4th International Conference on Information,Cyber- netics and Computational Social Systems (ICCSS).Dalian, 本文给出了两种基于ANFIS网络的自适应 China:IEEE,2017:648-652 ADRC设计方法,仿真结果表明自适应ADRC控 [8]LIU Zhiquan,GU Wei,GAO Diju.Ship course keeping 制器在系统受到扰动时自适应策略具有更好的控 using eigenvalue decomposition adaptive sliding mode 制性能。当船舶受到扰动时,自适应ADRC可以 control[Cl//Proceedings of 2016 Techno-Ocean.Kobe,Ja- 较高精度地保持船舶航向;当航向设定值改变 pan:IEEE,2016:687-691. 时,该类控制算法可以快速、平滑地跟上新的设 定值,并且不会产生很大的操舵角,参数的适应 [9]ZHAO Jin,ZHANG Huajun.The application of fuzzy neural network in ship course control system[C//Proceed- 性广,对于船舶航向的控制效果较为理想。在船 ings of 7th International Conference on Fuzzy Systems and 舶参数发生摄动时,蒙特卡罗实验表明,基于AN Knowledge Discovery.Yantai,China:IEEE,2010: FIS网络的自适应ADRC具有更强的鲁棒性。综 338-342 上所述,基于ANFIS网络的自适应ADRC控制器 [10]韩京清.自抗扰控制技术:估计补偿不确定因素的控制 具有更好的控制性能,鲁棒性更强。 技术M.北京:国防工业出版社,2008:255-263 本文所设计的自适应ADRC没有同时实现 [11]陈增强,刘俊杰,孙明玮.一种新型控制方法一自抗 ADRC3个参数同时在线调整,这将是未来研究 扰控制技术及其工程应用综述「J].智能系统学报 的方向。另外,采用智能算法,例如粒子群算法、 2018,136):865-877. 强化学习等进行控制参数的选择,也是未来需要 CHEN Zengqiang,LIU Junjie,SUN Mingwei.Overview 进行探索的内容。 of a novel control method:active disturbance rejection 参考文献: control technology and its practical applications[J].CAAl transactions on intelligent systems,2018,13(6):865-877. [1]奚庆潮.船舶航向自抗扰控制的研究D].大连:大连海 [12]王永帅,陈增强,孙明玮,等.一阶惯性大时滞系统
MP ts 为了更清晰地比较不同控制器对于参数摄动 的控制效果,选用表征系统暂态性能的性能指标 进行评判:最大超调量 、调整时间 和积分性 能指标 ITAE,并绘制出散点图。其中“*”为 LADRC 控制;“o”为自适应 ESO 的 ADRC 控制;“+”代 表自适应 PD 的 ADRC 控制。 ts 图 14 表明在发生参数摄动的情况下,两种自 适应控制器均具有较小的最大超调量,并且点的 分布更为密集;3 种控制器的调节时间 相差不 大。总而言之,3 种控制器的点集分布都较为集 中,说明 3 种控制器对于参数摄动都具有一定的 鲁棒性,但两种自适应自抗扰控制器的点集较于 LADRC 控制器更为集中,说明在发生参数摄动 时,基于 ANFIS 的自适应 ADRC 控制器具有更好 的鲁棒性,表现出更优越的控制性能。 超调量 0 2 2 6 ITAE ×106 ×10−3 ×103 1 5 ts 4 4 0 3 LADRC AESO APD 图 14 蒙特卡罗实验结果 Fig. 14 Monte Carlo experimental result 4 结束语 本文给出了两种基于 ANFIS 网络的自适应 ADRC 设计方法,仿真结果表明自适应 ADRC 控 制器在系统受到扰动时自适应策略具有更好的控 制性能。当船舶受到扰动时,自适应 ADRC 可以 较高精度地保持船舶航向;当航向设定值改变 时,该类控制算法可以快速、平滑地跟上新的设 定值,并且不会产生很大的操舵角,参数的适应 性广,对于船舶航向的控制效果较为理想。在船 舶参数发生摄动时,蒙特卡罗实验表明,基于 ANFIS 网络的自适应 ADRC 具有更强的鲁棒性。综 上所述,基于 ANFIS 网络的自适应 ADRC 控制器 具有更好的控制性能,鲁棒性更强。 本文所设计的自适应 ADRC 没有同时实现 ADRC 3 个参数同时在线调整,这将是未来研究 的方向。另外,采用智能算法,例如粒子群算法、 强化学习等进行控制参数的选择,也是未来需要 进行探索的内容。 参考文献: [1] 奚庆潮. 船舶航向自抗扰控制的研究 [D]. 大连: 大连海 事大学, 2014: 1-2. XI Qingchao. Research on ship course control based on the ADRC[D]. Dalian: Dalian Maritime University, 2014: 1–2. 邱峰. 船舶航向与航迹积分滑模自抗扰保持控制 [D]. 大 连: 大连海事大学, 2018: 1–4. QIU Feng. Ship course and track sliding mode keeping control based on auto disturbance rejection control[D]. Dalian: Dalian Maritime University, 2018: 1–4. [2] WITKOWSKA A, TOMERA M, ŚMIERZCHALSKI R. A backstepping approach to ship course control[J]. International journal of applied mathematics and computer science, 2007, 17(1): 73–85. [3] 杨盐生, 于晓利, 贾欣乐. 船舶航向鲁棒 PID 自动舵设 计 [J]. 大连海事大学学报, 1999, 25(4): 11–15. YANG Yansheng, YU Xiaoli, JIA Xinle. Robust PID autopilot for ships[J]. Journal of Dalian Maritime University, 1999, 25(4): 11–15. [4] DU Jialu, GUO Chen. Nonlinear adaptive ship course tracking control based on backstepping and Nussbaum gain[C]//Proceedings of 2004 American Control Conference. Boston, MA, USA: IEEE, 2005: 3845–3850. [5] DU Jialu, HU Xin, SUN Yuqing. Adaptive robust nonlinear control design for course tracking of ships subject to external disturbances and input saturation[J]. IEEE transactions on systems, man, and cybernetics: systems, 2017. [6] YU Renhai, LI Tieshan, LI Wei. Ship course control based on differential flatness and sliding mode[C]//Proceedings of the 4th International Conference on Information, Cybernetics and Computational Social Systems (ICCSS). Dalian, China: IEEE, 2017: 648–652. [7] LIU Zhiquan, GU Wei, GAO Diju. Ship course keeping using eigenvalue decomposition adaptive sliding mode control[C]//Proceedings of 2016 Techno-Ocean. Kobe, Japan: IEEE, 2016: 687–691. [8] ZHAO Jin, ZHANG Huajun. The application of fuzzy neural network in ship course control system[C]//Proceedings of 7th International Conference on Fuzzy Systems and Knowledge Discovery. Yantai, China: IEEE, 2010: 338–342. [9] 韩京清. 自抗扰控制技术: 估计补偿不确定因素的控制 技术 [M]. 北京: 国防工业出版社, 2008: 255–263. [10] 陈增强, 刘俊杰, 孙明玮. 一种新型控制方法——自抗 扰控制技术及其工程应用综述 [J]. 智能系统学报, 2018, 13(6): 865–877. CHEN Zengqiang, LIU Junjie, SUN Mingwei. Overview of a novel control method: active disturbance rejection control technology and its practical applications[J]. CAAI transactions on intelligent systems, 2018, 13(6): 865–877. [11] [12] 王永帅, 陈增强, 孙明玮, 等. 一阶惯性大时滞系统 ·262· 智 能 系 统 学 报 第 15 卷
第2期 秦贝贝,等:基于自适应神经模糊推理系统的船舶航向自抗扰控制 ·263· Smith预估自抗扰控制U.智能系统学报,2018,13(4) [18]BURAGOHAIN M,MAHANTA C.A novel approach for 500-508. ANFIS modelling based on full factorial design[J].Ap- WANG Yongshuai,CHEN Zenggiang,SUN Mingwei,et plied soft computing,2008,8(1):609-625. al.Smith prediction and active disturbance rejection con- [19]PREMKUMAR K,MANIKANDAN B V.Adaptive trol for first-order inertial systems with long time- neuro-fuzzy inference system based speed controller for delay[J].CAAI transactions on intelligent systems,2018, brushless DC motor[J].Neurocomputing,2014,138: 13(4):500-508. 260-270. [13]HAN Yaozhen,XIAO Hairong,WANG Changshun,et al. [20]李荣辉.欠驱动水面船舶航迹自抗扰控制研究[D].大 Design and simulation of ship course controller based on 连:大连海事大学,2013:32-34. auto disturbance rejection control technique[C]//Proceed- LI Ronghui.Active disturbance rejction based tracking ings of 2009 IEEE International Conference on Automa- control of underactuated surface ships[D].Dalian:Dalian tion and Logistics.Shenyang,China:IEEE,2009: Maritime University,2013:29-34. 686-691. 作者简介: [14]刘文江,隋青美,周风余,等.基于Bech模型的船舶航 秦贝贝,硕士研究生,主要研究方 向自抗扰控制器设计与仿真船舶工程,2011,33(6): 向为自抗扰控制、预测控制。 61-64 LIU Wenjiang,SUI Qingmei,ZHOU Fengyu,et al.Act- ive disturbance rejection controller design and simulation for ship course based on Bech's equation[J].Ship engin- eering,2011,33(6):61-64. [15]贾欣乐,杨盐生.船舶运动数学模型一机理建模与辨 陈增强,教授,博士生导师,中国 识建模[M).大连:大连海事大学出版社,1999: 系统仿真学会理事,中国人工智能学 234250. 会智能空天专业委员会副主任,天津 JIA Xinle,YANG Yansheng.Ship motion mathematical 市自动化学会理事,主要研究方向为 智能控制、预测控制、自抗扰控制。主 model:the mechanism modeling and identification mod- 持完成国家863项目和国家自然科学 eling[M].Dalian:Dalian Maritime University Press, 基金项目6项,获得省部级科技进步 1999:234250. 奖4次。发表学术论文300余篇。 [16]GAO Zhiqiang.Scaling and bandwidth-parameterization based controller tuning[C]//Proceedings of 2003 Americ- 孙明玮,教授,主要研究方向为飞 行器制导与控制、自抗扰控制。中国 an Control Conference.Denver,USA:IEEE,2003: 自动化学会数据驱动控制、学习与优 4989-4996. 化专业委员会委员。主持国防科技攻 [17]JANG J S R.ANFIS:adaptive-network-based fuzzy infer- 关基金和国家自然科学基金项目 ence system[J].IEEE transactions on systems,man,and 4项,获得国防科技进步奖3次。发 cybernetics,1993,23(3):665-685. 表学术论文50余篇
Smith 预估自抗扰控制 [J]. 智能系统学报, 2018, 13(4): 500–508. WANG Yongshuai, CHEN Zengqiang, SUN Mingwei, et al. Smith prediction and active disturbance rejection control for first-order inertial systems with long timedelay[J]. CAAI transactions on intelligent systems, 2018, 13(4): 500–508. HAN Yaozhen, XIAO Hairong, WANG Changshun, et al. Design and simulation of ship course controller based on auto disturbance rejection control technique[C]//Proceedings of 2009 IEEE International Conference on Automation and Logistics. Shenyang, China: IEEE, 2009: 686–691. [13] 刘文江, 隋青美, 周风余, 等. 基于 Bech 模型的船舶航 向自抗扰控制器设计与仿真 [J]. 船舶工程, 2011, 33(6): 61–64. LIU Wenjiang, SUI Qingmei, ZHOU Fengyu, et al. Active disturbance rejection controller design and simulation for ship course based on Bech’s equation[J]. Ship engineering, 2011, 33(6): 61–64. [14] 贾欣乐, 杨盐生. 船舶运动数学模型——机理建模与辨 识建模 [M]. 大连: 大连海事大学出版社, 1999: 234–250. JIA Xinle, YANG Yansheng. Ship motion mathematical model: the mechanism modeling and identification modeling[M]. Dalian: Dalian Maritime University Press, 1999: 234–250. [15] GAO Zhiqiang. Scaling and bandwidth-parameterization based controller tuning[C]//Proceedings of 2003 American Control Conference. Denver, USA: IEEE, 2003: 4989–4996. [16] JANG J S R. ANFIS: adaptive-network-based fuzzy inference system[J]. IEEE transactions on systems, man, and cybernetics, 1993, 23(3): 665–685. [17] BURAGOHAIN M, MAHANTA C. A novel approach for ANFIS modelling based on full factorial design[J]. Applied soft computing, 2008, 8(1): 609–625. [18] PREMKUMAR K, MANIKANDAN B V. Adaptive neuro-fuzzy inference system based speed controller for brushless DC motor[J]. Neurocomputing, 2014, 138: 260–270. [19] 李荣辉. 欠驱动水面船舶航迹自抗扰控制研究 [D]. 大 连: 大连海事大学, 2013: 32–34. LI Ronghui. Active disturbance rejction based tracking control of underactuated surface ships[D]. Dalian: Dalian Maritime University, 2013: 29–34. [20] 作者简介: 秦贝贝,硕士研究生,主要研究方 向为自抗扰控制、预测控制。 陈增强,教授,博士生导师,中国 系统仿真学会理事,中国人工智能学 会智能空天专业委员会副主任,天津 市自动化学会理事,主要研究方向为 智能控制、预测控制、自抗扰控制。主 持完成国家 863 项目和国家自然科学 基金项目 6 项,获得省部级科技进步 奖 4 次。发表学术论文 300 余篇。 孙明玮,教授,主要研究方向为飞 行器制导与控制、自抗扰控制。中国 自动化学会数据驱动控制、学习与优 化专业委员会委员。主持国防科技攻 关基金和国家自然科学基金项目 4 项,获得国防科技进步奖 3 次。发 表学术论文 50 余篇。 第 2 期 秦贝贝,等:基于自适应神经模糊推理系统的船舶航向自抗扰控制 ·263·