第11卷第1期 智能系统学报 Vol.11 No.1 2016年2月 CAAI Transactions on Intelligent Systems Feh.2016 D0I:10.11992/is.201507025 网络出版地址:htp:/www.cmki.net/kcms/detail/23.1538.TP.20151229.0837.004.html 基于粒子群优化的Elman神经网络无模型控制 张俊玲1,陈增强12,张青2 (1.南开大学计算机与控制工程学院,天津300071:2.中国民航大学理学院,天津300300) 摘要:针对一类无法建模或是建模过程比较复杂的离散SS0非线性离散系统,提出了一种基于Elman神经网络和 粒子群优化算法的无模型控制方法。该控制方法是在无需知道被控对象动力学模型的情况下,以Elman神经网络 作为控制器结构,利用粒子群优化算法在线学习控制器中的所有权值参数,既而得到每一离散时刻的最优控制量。 仿真研究表明,该方法控制下的非线性系统输出信号具有较快的反应速度和较小的跟踪误差,同时控制量信号有较 好的收敛性与控制精度,这说明了所提出的基于粒子群的Elman神经网络无模型控制方法是有效与合理的。 关键词:非线性系统:非线性离散系统:无模型控制:控制器:Eman神经网络:粒子群优化算法 中图分类号:TP18:TP301.6文献标志码:A文章编号:1673-4785(2016)01-0049-06 中文引用格式:张俊玲,陈增强,张青.基于粒子群优化的Eman神经网络无模型控制[J】.智能系统学报,2016,11(1):49-54. 英文引用格式:ZHANG Junling,CHEN Zengqiang,ZHANG Qing.Elman model--free control method based on particle swarm opti- mization algorithm[J].CAAI Transactions on Intelligent Systems,2016,11(1):49-54. Elman model-free control method based on particle swarm optimization algorithm ZHANG Junling',CHEN Zengqiang'2,ZHANG Qing? (1.College of Computer and Control Engineering,Nankai University,Tianjin 300071,China;2.College of Science,Civil Aviation U. niversity of China,Tianjin 300300,China) Abstract:In this paper,we propose amodel-free control method,based on the Elman neural network and the parti- cle swarm optimization algorithm,for a class of single-input single-output (SISO)discrete nonlinear systems, whose mathematical model cannot be established or is not easily modeled.In the model-free control system,it is not necessary to establish a mathematical model for each object.The Elman neural network is the controller and all the online weight parameters are learned using the particle swarm optimization algorithm.Using the proposed method, we obtain the optimal control variable at each discrete time.Them odel-free control method simulation results demon- strate that the nonlinear system output signal has a fast response rate and few tracking errors.Moreover,the control variable has good convergence and high control accuracy.These results prove that the proposed method is reasona- ble and effective. Keywords:nonlinear system;discrete nonlinear system;model-free control;controller;Elman neural network; particle swarm optimization algorithm 现如今无论是基于传递函数的经典控制理论, 于非线性系统来说,需要耗费巨大的人力物力。无 还是基于状态空间模型的现代控制理论,大部分控 模型控制思想的提出恰恰能解决上述基于模型的控 制器的设计都是基于模型的。然而基于模型的控制 制方法存在的问题。无模型控制就是无需建立被控 理论不可避免地需要对被控对象进行建模,但是建 对象的数学模型而能实现控制的一种方法。其实在 立被控对象的数学模型并不是一件易事,尤其是对 工业应用中最广泛的PD控制方法就是最原始的 无模型控制思想的应用,然而PD方法最大的缺点 收稿日期:2015-07-20.网络出版日期:2015-12-29. 就是控制器参数不易调节。无模型控制方法现阶段 基金项目:国家自然科学基金资助项目(61174094):天津市自然科学基没有固定的控制器结构与设计方式,广义上来说,所 金资助项目(14 JCYBJC18700). 通信作者:陈增强.E-mail:chenzq@nankai.cdu.cn 有不基于数学模型设计控制器的方法都可称之为无
第 11 卷第 1 期 智 能 系 统 学 报 Vol.11 №.1 2016 年 2 月 CAAI Transactions on Intelligent Systems Feb. 2016 DOI:10.11992 / tis.201507025 网络出版地址:http: / / www.cnki.net / kcms/ detail / 23.1538.TP.20151229.0837.004.html 基于粒子群优化的 Elman 神经网络无模型控制 张俊玲1 ,陈增强1,2 ,张青2 (1.南开大学 计算机与控制工程学院,天津 300071; 2.中国民航大学 理学院,天津 300300) 摘 要:针对一类无法建模或是建模过程比较复杂的离散 SISO 非线性离散系统,提出了一种基于 Elman 神经网络和 粒子群优化算法的无模型控制方法。 该控制方法是在无需知道被控对象动力学模型的情况下,以 Elman 神经网络 作为控制器结构,利用粒子群优化算法在线学习控制器中的所有权值参数,既而得到每一离散时刻的最优控制量。 仿真研究表明,该方法控制下的非线性系统输出信号具有较快的反应速度和较小的跟踪误差,同时控制量信号有较 好的收敛性与控制精度,这说明了所提出的基于粒子群的 Elman 神经网络无模型控制方法是有效与合理的。 关键词:非线性系统;非线性离散系统;无模型控制;控制器;Elman 神经网络;粒子群优化算法 中图分类号:TP18; TP301.6 文献标志码:A 文章编号:1673⁃4785(2016)01⁃0049⁃06 中文引用格式:张俊玲,陈增强,张青.基于粒子群优化的 Elman 神经网络无模型控制[J]. 智能系统学报, 2016, 11(1): 49⁃54. 英文引用格式:ZHANG Junling, CHEN Zengqiang, ZHANG Qing. Elman model⁃free control method based on particle swarm opti⁃ mization algorithm[J]. CAAI Transactions on Intelligent Systems, 2016, 11(1): 49⁃54. Elman model⁃free control method based on particle swarm optimization algorithm ZHANG Junling 1 , CHEN Zengqiang 1,2 , ZHANG Qing 2 (1. College of Computer and Control Engineering, Nankai University, Tianjin 300071, China; 2. College of Science, Civil Aviation U⁃ niversity of China, Tianjin 300300, China) Abstract:In this paper, we propose amodel⁃free control method, based on the Elman neural network and the parti⁃ cle swarm optimization algorithm, for a class of single⁃input single⁃output ( SISO) discrete nonlinear systems, whose mathematical model cannot be established or is not easily modeled. In the model⁃free control system, it is not necessary to establish a mathematical model for each object. The Elman neural network is the controller and all the online weight parameters are learned using the particle swarm optimization algorithm.Using the proposed method, we obtain the optimal control variable at each discrete time.Them odel⁃free control method simulation results demon⁃ strate that the nonlinear system output signal has a fast response rate and few tracking errors. Moreover, the control variable has good convergence and high control accuracy. These results prove that the proposed method is reasona⁃ ble and effective. Keywords:nonlinear system; discrete nonlinear system; model⁃free control; controller; Elman neural network; particle swarm optimization algorithm 收稿日期:2015⁃07⁃20. 网络出版日期:2015⁃12⁃29. 基金项目:国家自然科学基金资助项目(61174094);天津市自然科学基 金资助项目(14JCYBJC18700). 通信作者:陈增强. E⁃mail: chenzq@ nankai.edu.cn. 现如今无论是基于传递函数的经典控制理论, 还是基于状态空间模型的现代控制理论,大部分控 制器的设计都是基于模型的。 然而基于模型的控制 理论不可避免地需要对被控对象进行建模,但是建 立被控对象的数学模型并不是一件易事,尤其是对 于非线性系统来说,需要耗费巨大的人力物力。 无 模型控制思想的提出恰恰能解决上述基于模型的控 制方法存在的问题。 无模型控制就是无需建立被控 对象的数学模型而能实现控制的一种方法。 其实在 工业应用中最广泛的 PID 控制方法就是最原始的 无模型控制思想的应用,然而 PID 方法最大的缺点 就是控制器参数不易调节。 无模型控制方法现阶段 没有固定的控制器结构与设计方式,广义上来说,所 有不基于数学模型设计控制器的方法都可称之为无
·50 智能系统学报 第11卷 模型控制。 也就是说控制器能在每个离散时刻k产生一个 现在无模型控制方法得到了越来越多国内外专 控制量u(k),使得实际输出y(k)跟随设定值r(k)》 家的重视,有的已经在工业过程中得以应用。文献 变化。这里采用递归神经网络中的典型结构Elman [1-3]为基于动态线性化的无模型控制方法,在每一 网络作为控制器的结构,如图2所示,其中网络的结 离散时刻对系统进行线性化处理,然后可以利用线 构固定,不随时间变化,网络的权值参数可以随时间 性系统理论求解问题。在无模型控制方法中,神经 不断进行更新学习。 网络因其结构的特殊性,发挥着巨大的作用。如文 献[4]中提出以函数近似结构(可采用神经网络)作 为其控制器,以同时扰动随机逼近算法估计梯度的 p.( 无模型控制方法。文献[5]以前馈神经网络作为无 e(k+1) O(k) 隐含层 模型自适应控制器结构,运用BP算法训练控制器 输入层 P 输出层 p(k-1) 参数,所设计控制器已广泛应用于工业过程控制中。 文献[6]介绍了基于数据的自学习优化控制方法, 保留层 P 采用函数近似结构来估计系统性能指标函数,然后 B.(k-1) 依据最优性原理来获得最优的控制策略。文献[7] 采用双神经元作为控制器结构,主神经元控制器用 图2 Elman无模型控制器 来控制PH过程,子神经元控制器用来补偿其非线 Fig.2 Elman model-free controller 性。本文则采用递归神经网络中的Eman网络作为 Elman网络是由J.L Elman于1990年针对语音 控制器结构,并且采用粒子群优化算法训练神经网 问题提出来的一种多层动态神经网络劉。由于其 络权值参数,从而得到控制量,无需从被控对象的数 结构具有动态递归的特点,对非线性函数有很好的 学模型出发设计控制器,实现系统的无模型控制。 逼近能力,因此被广泛应用于控制系统的设计 中9-o。Elman网络分为4层:输入层、隐含层、输 1 Elman无模型控制系统 出层和保留层。其输入层、隐含层和输出层的连接 下面以SS0离散非线性系统作为被控对象, 类似于前馈网络,区别在于增加了保留层,用来存储 y(k+1)=fy(k),…,y(k-n,),u(k),…,u(k-nn) 隐含层神经元上一时刻的输出值。隐含层的输出通 (1) 过保留层的延迟与存储,重新作为隐含层的输入,这 式(1)中f代·)未知,无模型控制系统结构如图 种连接方式使得网络对历史状态的数据具有记忆功 1所示。 能,从而增加了网络处理动态信息的能力。其数学 [未的 描述如下: 参考信号误差信号 控制信号 输出信号 P.(k)=g(】 n(k+1)e(k+1) Elman光模 ,(k-1)9()+(k-1)e(k+1)) ) SISO k+1) 型制器 过程 (3) u(k)=K∑h,(k-1)p.(k) (4) i=1 (5) 法 性能指 9(k)=P,(k-1) 标函数 式中:N为隐含层与保留层节点数,i,j=1,…,N; e(k)为控制器输入;P:(k)为隐含层输出;9,(k)为保 留层信号;u(k)为网络的输出;w,(·),w(·), 图1 Elman无模型控制系统 h:(·)分别为隐含层节点i与保留层节点j的连接 Fig.1 Elman model-free control system 权值、输入层节点与隐含层节点i的连接权值、隐含 设计控制器的原则是,在每一个离散时刻寻找 层节点i与输出层节点之间的连接权值:g(·)为隐 一组最优的控制器参数(权值参数),使得以下控制 含层节点激活函数,这里取为sigmoid函数(g(x)= 性能指标函数达到最小。 1+e):K为控制增益。 E(k)=[r(k+1)-y(k+1)]2+A[u(k)-u(k-1)]2 最优控制量u(k)的产生依靠Elman神经网络 (2) 自身权值参数的不断学习产生,最常见的基于梯度
模型控制。 现在无模型控制方法得到了越来越多国内外专 家的重视,有的已经在工业过程中得以应用。 文献 [1⁃3]为基于动态线性化的无模型控制方法,在每一 离散时刻对系统进行线性化处理,然后可以利用线 性系统理论求解问题。 在无模型控制方法中,神经 网络因其结构的特殊性,发挥着巨大的作用。 如文 献[4]中提出以函数近似结构(可采用神经网络)作 为其控制器,以同时扰动随机逼近算法估计梯度的 无模型控制方法。 文献[5]以前馈神经网络作为无 模型自适应控制器结构,运用 BP 算法训练控制器 参数,所设计控制器已广泛应用于工业过程控制中。 文献[6]介绍了基于数据的自学习优化控制方法, 采用函数近似结构来估计系统性能指标函数,然后 依据最优性原理来获得最优的控制策略。 文献[7] 采用双神经元作为控制器结构,主神经元控制器用 来控制 PH 过程,子神经元控制器用来补偿其非线 性。 本文则采用递归神经网络中的 Elman 网络作为 控制器结构,并且采用粒子群优化算法训练神经网 络权值参数,从而得到控制量,无需从被控对象的数 学模型出发设计控制器,实现系统的无模型控制。 1 Elman 无模型控制系统 下面以 SISO 离散非线性系统作为被控对象, y(k + 1) = f(y(k),…,y(k - ny),u(k),…,u(k - na)) (1) 式(1)中 f(·)未知,无模型控制系统结构如图 1 所示。 图 1 Elman 无模型控制系统 Fig.1 Elman model⁃free control system 设计控制器的原则是,在每一个离散时刻寻找 一组最优的控制器参数(权值参数),使得以下控制 性能指标函数达到最小。 E(k) = [r(k + 1) - y(k + 1)] 2 + λ[u(k) - u(k - 1)] 2 (2) 也就是说控制器能在每个离散时刻 k 产生一个 控制量 u(k),使得实际输出 y(k)跟随设定值 r(k) 变化。 这里采用递归神经网络中的典型结构 Elman 网络作为控制器的结构,如图 2 所示,其中网络的结 构固定,不随时间变化,网络的权值参数可以随时间 不断进行更新学习。 图 2 Elman 无模型控制器 Fig.2 Elman model⁃free controller Elman 网络是由 J.L Elman 于 1990 年针对语音 问题提出来的一种多层动态神经网络[8] 。 由于其 结构具有动态递归的特点,对非线性函数有很好的 逼近能 力, 因 此 被 广 泛 应 用 于 控 制 系 统 的 设 计 中[9⁃10] 。 Elman 网络分为 4 层:输入层、隐含层、输 出层和保留层。 其输入层、隐含层和输出层的连接 类似于前馈网络,区别在于增加了保留层,用来存储 隐含层神经元上一时刻的输出值。 隐含层的输出通 过保留层的延迟与存储,重新作为隐含层的输入,这 种连接方式使得网络对历史状态的数据具有记忆功 能,从而增加了网络处理动态信息的能力。 其数学 描述如下: pi(k) = g(∑ N j = 1 w p i,j(k - 1)qj(k) + w u i (k - 1)e(k + 1)) (3) u(k) = Kc∑ N i = 1 hi(k - 1)pi(k) (4) qj(k) = pj(k - 1) (5) 式中:N 为隐含层与保留层节点数,i,j = 1,…,N; e(k)为控制器输入;pi(k)为隐含层输出;qj( k)为保 留层信号;u( k) 为网络的输出;w p i,j(·),w u i (·), hi(·)分别为隐含层节点 i 与保留层节点 j 的连接 权值、输入层节点与隐含层节点 i 的连接权值、隐含 层节点 i 与输出层节点之间的连接权值;g(·)为隐 含层节点激活函数,这里取为 sigmoid 函数( g( x)= 1 1+e -x );Kc 为控制增益。 最优控制量 u(k)的产生依靠 Elman 神经网络 自身权值参数的不断学习产生,最常见的基于梯度 ·50· 智 能 系 统 学 报 第 11 卷
第1期 张俊玲,等:基于粒子群优化的Elman神经网络无模型控制 ·51 的学习算法(如BP算法)需要求取性能指标函数对 调整: 权值向量(网络中所有权值参数)的偏导。由于被 控对象的数学模型未知,其中y(k+1)对u(k)的偏 wn三wm- (mat 0sin n (8) 导数是未知的,所以基于梯度的学习算法需要预先 式中:ωm是迭代开始的最大权重,w是达到最大 估计其梯度值,而且梯度算法需要分别求解目标函 迭代次数时的最小权重,采用惯性权重是为了保证 数对各层权值的偏导,无法整体统一更新学习,计算 进化初期的快速性和后期的精细性。 略微复杂。针对这一问题,我们引入了粒子群优化 2.2粒子群算法流程 算法(particle swarm optimization)来实现权值寻优。 1)在搜索空间中随机生成粒子种群,初始化粒 2粒子群优化算法 子的位置和速度; 2)在第n次迭代中,根据适应度函数计算每个 PSO算法是由Kenny和Eberhart于1995年提 粒子的适应度,这里以式(2)作为其适应度函数,其 出的一种群智能优化算法)。它的思想起源于鸟 中入=0.5,找出本次迭代中的个体最优位置和群体 群觅食行为,通过集体协作使群体达到最优,具有高 最优位置; 效的全局搜索能力和鲁棒性。这是一种随机、并行 3)根据位置速度更新式(6)~(8)更新每个粒 的优化算法,不要求目标函数具有可微、可导、连续 子的速度和位置: 等性质,也不需要去求解目标函数的导数,所有待优 4)判断是否达到终止条件,即迭代次数是否达 化参数可以整体统一更新学习,恰恰解决了梯度学 到最大迭代次数,如果是则结束迭代:否则n=n+1, 习算法所存在的问题。 转步骤2。 2.1算法介绍 2.3控制算法流程 粒子群优化算法因其算法自身的优越性在许多 1)在k时刻,根据给定参考量r(k+1)和输出量 领域具有广泛的用途,如函数优化、神经网络训练、 y(k),计算当前时刻输出信号与下一时刻参考输入 多目标优化等14」 信号的偏差e(k+1)=r(k+1)-y(k): 在粒子群优化算法中,被优化问题的解可以想 2)以e(k+1)作为Elman网络输入,基于上一时 象成搜索空间中的一个“粒子”,也就是说每个粒子 刻保存的最优权值参数下,判断所得的控制量u(k) 的位置就是一个潜在的解。每个粒子都有一个适应 是否达到目标要求,如果是则转4),否则就转3); 度值,由相应的被优化函数决定,还有一个决定其方 3)以e(k+1)作为Elman网络输入,利用PS0 向和距离的速度向量。在迭代寻找最优解的过程 优化算法得到最优权值参数向量,从而得到k时刻 中,通过适应度函数估计每个粒子的适应度值,从而 的控制量u(k); 获得两个极值,一个是整个种群目前找到的最优解, 4)将所得最优控制量u(k)施加到被控对象,得 即全局极值:另一个是各个粒子目前找到的最优解, 到输出y(k+1); 即个体极值5 5)令k=k+1,转1)。 假设搜索空间为D维,一个由若干粒子组成的 群体在搜索空间中飞行,粒子i的位置表示为:x:= 3 仿真研究 (xa,x2,…,xD);粒子i的速度表示为::=(1,2, 为了验证基于粒子群算法的Elman无模型控制 …,D):粒子i个体历史最优位置表示为:P=(P, 方法的有效性,本文选取了2个典型离散非线性系 P2,…,PD);群体内所有粒子经历的最优位置表示 统,对它们的控制性能进行了仿真实验,离散非线性 为:Pg=(P1P2,…PD)。 系统分别来自文献[16]和[17]。 粒子速度和位置的更新方程为 本文中Elman网络输人层就一个神经元,为偏 =ωn品+cI(pa-xa)+c2r2(p2-xa)(6) 差信号e(k+1),隐含层与保留层神经元取为4,输 x=x (7) 出层神经元为1,输出控制量u(k):网络所有权值 式中:i=1,2,…,m;d=1,2,…,D;n为迭代次数;m 数量(即粒子向量维数)为24(4+4×4+4=24)。初 为群体中粒子数;”1,2为[0,1]的随机数,用来保持 始输人输出:y(3)=0,y(2)=0,y(1)=0,u(2)=0, 群体的多样性;C1,C2为学习因子,取正常数,使粒子 u(1)=0. 能够不断自我学习以及向群体中优秀个体学习;ω。 3.1仿真模型1 是调整权值变化的函数,依照惯性权重法按式(8) 离散非线性对象如下:
的学习算法(如 BP 算法)需要求取性能指标函数对 权值向量(网络中所有权值参数) 的偏导。 由于被 控对象的数学模型未知,其中 y( k+1)对 u( k)的偏 导数是未知的,所以基于梯度的学习算法需要预先 估计其梯度值,而且梯度算法需要分别求解目标函 数对各层权值的偏导,无法整体统一更新学习,计算 略微复杂。 针对这一问题,我们引入了粒子群优化 算法(particle swarm optimization)来实现权值寻优。 2 粒子群优化算法 PSO 算法是由 Kenny 和 Eberhart 于 1995 年提 出的一种群智能优化算法[11] 。 它的思想起源于鸟 群觅食行为,通过集体协作使群体达到最优,具有高 效的全局搜索能力和鲁棒性。 这是一种随机、并行 的优化算法,不要求目标函数具有可微、可导、连续 等性质,也不需要去求解目标函数的导数,所有待优 化参数可以整体统一更新学习,恰恰解决了梯度学 习算法所存在的问题。 2.1 算法介绍 粒子群优化算法因其算法自身的优越性在许多 领域具有广泛的用途,如函数优化、神经网络训练、 多目标优化等[12⁃14] 。 在粒子群优化算法中,被优化问题的解可以想 象成搜索空间中的一个“粒子”,也就是说每个粒子 的位置就是一个潜在的解。 每个粒子都有一个适应 度值,由相应的被优化函数决定,还有一个决定其方 向和距离的速度向量。 在迭代寻找最优解的过程 中,通过适应度函数估计每个粒子的适应度值,从而 获得两个极值,一个是整个种群目前找到的最优解, 即全局极值;另一个是各个粒子目前找到的最优解, 即个体极值[15] 。 假设搜索空间为 D 维,一个由若干粒子组成的 群体在搜索空间中飞行,粒子 i 的位置表示为:xi = (xi1 ,xi2 ,…,xiD);粒子 i 的速度表示为:vi = ( vi1 ,vi2 , …,viD);粒子 i 个体历史最优位置表示为:pi = ( pi1 , pi2 ,…,piD);群体内所有粒子经历的最优位置表示 为:pg = (pg1 ,pg2 ,…,pgD)。 粒子速度和位置的更新方程为 v n+1 id = ωn v n id + c1 r1(p n id - x n id ) + c2 r2(p n gd - x n id ) (6) x n+1 id = x n id + v n+1 id (7) 式中:i = 1,2,…,m;d = 1,2,…,D;n 为迭代次数;m 为群体中粒子数;r1 ,r2 为[0,1]的随机数,用来保持 群体的多样性;c1 ,c2 为学习因子,取正常数,使粒子 能够不断自我学习以及向群体中优秀个体学习;ωn 是调整权值变化的函数,依照惯性权重法按式(8) 调整: ωn = ωmax - ωmax - ωmin nmax ·n (8) 式中:ωmax是迭代开始的最大权重,ωmin是达到最大 迭代次数时的最小权重,采用惯性权重是为了保证 进化初期的快速性和后期的精细性。 2.2 粒子群算法流程 1)在搜索空间中随机生成粒子种群,初始化粒 子的位置和速度; 2)在第 n 次迭代中,根据适应度函数计算每个 粒子的适应度,这里以式(2)作为其适应度函数,其 中 λ = 0.5,找出本次迭代中的个体最优位置和群体 最优位置; 3)根据位置速度更新式(6) ~ (8)更新每个粒 子的速度和位置; 4)判断是否达到终止条件,即迭代次数是否达 到最大迭代次数,如果是则结束迭代;否则 n = n+1, 转步骤 2。 2.3 控制算法流程 1)在 k 时刻,根据给定参考量 r(k+1)和输出量 y(k),计算当前时刻输出信号与下一时刻参考输入 信号的偏差 e(k+1)= r(k+1)-y(k); 2)以 e(k+1)作为 Elman 网络输入,基于上一时 刻保存的最优权值参数下,判断所得的控制量 u(k) 是否达到目标要求,如果是则转 4),否则就转 3); 3)以 e( k+1) 作为 Elman 网络输入,利用 PSO 优化算法得到最优权值参数向量,从而得到 k 时刻 的控制量 u(k); 4)将所得最优控制量 u(k)施加到被控对象,得 到输出 y(k+1); 5)令 k = k+1,转 1)。 3 仿真研究 为了验证基于粒子群算法的 Elman 无模型控制 方法的有效性,本文选取了 2 个典型离散非线性系 统,对它们的控制性能进行了仿真实验,离散非线性 系统分别来自文献[16]和[17]。 本文中 Elman 网络输入层就一个神经元,为偏 差信号 e( k+1),隐含层与保留层神经元取为 4,输 出层神经元为 1,输出控制量 u( k);网络所有权值 数量(即粒子向量维数)为 24(4+4×4+4 = 24)。 初 始输入输出:y(3)= 0,y(2)= 0,y(1)= 0,u(2)= 0, u(1)= 0。 3.1 仿真模型 1 离散非线性对象如下: 第 1 期 张俊玲,等:基于粒子群优化的 Elman 神经网络无模型控制 ·51·
.52 智能系统学报 第11卷 5y(k)y(k-1) 1.4 1+y(k)2+y(k-1)2+y(k-2) 1.2 一k) u(k)+1.1u(k-1), …4.() k≤200 1.0 y(k+1)= 2.5y(k)y(k-1) 1y(k)2(6-1)+1.2u(k)+ 0.8 0.6 1.4u(k-1)+0.7sin(0.5(y(k)+ 0.4 y(k-1))cos(0.5(y(k)+y(k-1)), k>200 0.2 0 参考控制信号如下: 0 50100150200250300350400 1, k≤100 0.5. 100<k≤200 图5模型1中的控制输入信号曲线 U,(k)= 1, 200<k≤300 Fig.5 Control input curve in model 1 0.5,300<k≤400 本文为了体现Elman神经网络+PSO控制器算法优 参考输出信号y,(k)即参考控制输入下所产生的输 越的控制性能,以模型1为例,与BP神经网络+BP 出值。 算法的传统组合模式进行了比较,网络输入神经元 控制器参数设置如下:粒子数量取为5,最大迭 个数为5,隐含层神经元个数为4,网络权值个数24 代次数取为50,微粒初始位置、微粒初始速度随机 (5×4+4=24),其他参数调节至最优。其仿真结果 给定,范围为[-1,1],为了防止搜索时步长过大,速 如图6、7所示。 度前面乘以系数01,k。=2,C1=c2=2。 仿真结果如图3~5所示。 6.0 6.0 5.5 5.5 5.0 5 4.5 45 4.0 ) 4.0 3.5 3.0 2.5 y(k) 2.5 2.0 2.0 1.5 1.5 0 50100150200250300350400 1.0 050100150200250300350400 图6BP神经网络+BP算法无模型控制方法的输出跟 k 踪信号曲线 图3模型1中的输出跟踪信号曲线 Fig.3 Tracking performance curve in model 1 Fig.6 Tracking performance curve of MFC method with BPNN +BP algorithm 0.6 1.2 -(k) 0.4 …4(K) 1.0 0.2 0 0.2 0.6 -0.4 0.4 -0.6 -0.8 0.2050100150200250300350400 050100150200250300350400 图7BP神经网络+BP算法无模型控制方法的控制输 图4模型1中的跟踪误差信号曲线 入信号曲线 Fig.4 Tracking error curve in model 1 Fig.7 Control input curve of MFC method with BPNN+BP algorithm
y(k+1)= 5y(k)y(k-1) 1+y (k) 2+y (k-1) 2+y (k-2) 2 + u(k)+1.1u(k-1), k≤200 2.5y(k)y(k-1) 1+y (k) 2+y (k-1) 2 +1.2u(k)+ 1.4u(k-1)+0.7sin(0.5(y(k)+ y(k-1))cos(0.5(y(k)+y(k-1)), k>200 ì î í ï ï ï ï ï ï ï ï ï ï ïï 参考控制信号如下: Ur(k) = 1, k ≤ 100 0.5, 100 < k ≤ 200 1, 200 < k ≤ 300 0.5, 300 < k ≤ 400 ì î í ï ï ï ï 参考输出信号 yr(k)即参考控制输入下所产生的输 出值。 控制器参数设置如下:粒子数量取为 5,最大迭 代次数取为 50,微粒初始位置、微粒初始速度随机 给定,范围为[-1,1],为了防止搜索时步长过大,速 度前面乘以系数 0.1, kc = 2,c1 = c2 = 2。 仿真结果如图 3~5 所示。 图 3 模型 1 中的输出跟踪信号曲线 Fig.3 Tracking performance curve in model 1 图 4 模型 1 中的跟踪误差信号曲线 Fig.4 Tracking error curve in model 1 图 5 模型 1 中的控制输入信号曲线 Fig.5 Control input curve in model 1 本文为了体现 Elman 神经网络+PSO 控制器算法优 越的控制性能,以模型 1 为例,与 BP 神经网络+BP 算法的传统组合模式进行了比较,网络输入神经元 个数为 5,隐含层神经元个数为 4,网络权值个数 24 (5×4+4 = 24), 其他参数调节至最优。 其仿真结果 如图 6、7 所示。 图 6 BP 神经网络+BP 算法无模型控制方法的输出跟 踪信号曲线 Fig. 6 Tracking performance curve of MFC method with BPNN +BP algorithm 图 7 BP 神经网络+BP 算法无模型控制方法的控制输 入信号曲线 Fig. 7 Control input curve of MFC method with BPNN+BP algorithm ·52· 智 能 系 统 学 报 第 11 卷
第1期 张俊玲,等:基于粒子群优化的Elman神经网络无模型控制 ·53 3.2 仿真模型2 离散非线性对象如下: 1.2 x(k) 1.0 1+y(k)2 +u(k)3,k≤200 0.8 y(k)y(k-1)y(k-2)(y(k-2)-1)· 0.6 y(k+1)= u(k-1)+u(k) 是0.4 1+y(k-1)2+y(k-2)2 0.2 k>200 0 参考控制信号如下: -0.2 4() 1, k≤100 -0.4 0 50100150200250300350400 ,(k)= J0.5,100<k≤200 0.5sin(km/100)+0.2cos(kr/200), 图10模型2中的控制输入信号曲线 200<k≤400 Fig.10 Control input curve of model 2 参考输出信号采用在参考控制输入下所产生的 后得到的控制量与期望的控制量信号误差较小,并 输出值。控制器参数设置同模型1,仿真结果如图 且能很好地实现对模型输出参考信号的实时跟踪, 8~10所示。 把输出误差控制在合理范围内,具有良好的收敛性。 2.0r 与基于BP网络+BP算法的无模型控制方法相比, 拥有较快的响应速度和较好的控制精度。由此证明 1.5 了基于Elman网络与粒子群算法的无模型控制方法 是有效与合理的。 4结束语 M) 本文针对一类单输入单输出离散非线性系统, 0 提出基于Elman网络结构的无模型控制方法,利用 ) 粒子群优化算法对控制器的参数进行优化学习,通 050100150200250300350400 过两个仿真模型的跟踪控制,结果证明了该方法的 k 有效性。该方法的优点在于:1)控制器的设计不依 图8模型2中的输出跟踪信号曲线 赖于被控对象的具体数学模型,依赖的仅仅是系统 Fig.8 Tracking performance curve in model 2 的输入输出数据:2)控制器网络结构中的参数向量 0.25 使粒子群算法进行优化,避免了梯度算法中需要求 0.20 解偏导数的问题,所有参数统一更新学习,简单便 0.15 捷。 0.10 参考文献: 0 [1]侯忠生,韩志刚.非线性系统鲁棒无模型学习自适应控 -0.05 制[J].控制与决策,1995,10(2):137-142. -0.10 HOU Zhongsheng,HAN Zhigang.Robust modelless learning -0.15 adaptive control of nonlinear systems[J.Control and deci- -0.20 050100150200250300350400 sion,1995.10(2):137-142. [2]李秀英,李桂英,毛琳,等.采用改进粒子群算法的非 图9模型2中的跟踪误差信号曲线 线性大时滞系统无模型控制[J].智能系统学报,2013, Fig.9 Tracking error curve in model 2 8(3):254-260. 从以上2个非线性系统模型的仿真结果来看, LI Xiuying,LI Guiying,MAO Lin,et al.Model-free control 当参考信号为方波或正弦函数时,通过粒子群算法 method for a nonlinear system with large time-delay based 学习得到Elman无模型控制器的最优网络权值,最 on IPSO [J].CAAI transactions on intelligent systems, 2013,8(3):254-260
3.2 仿真模型 2 离散非线性对象如下: y(k + 1) = y(k) 1 + y (k) 2 + u(k) 3 , k ≤200 y(k)y(k - 1)y(k - 2)(y(k - 2) - 1)· u(k - 1) + u(k) 1 + y (k - 1) 2 + y (k - 2) 2 , k > 200 ì î í ï ï ï ï ï ï ï ï 参考控制信号如下: ur(k) = 1, k ≤ 100 0.5, 100 < k ≤ 200 0.5 sin(kπ/ 100) + 0.2cos(kπ/ 200), 200 < k ≤ 400 ì î í ï ï ï ï 参考输出信号采用在参考控制输入下所产生的 输出值。 控制器参数设置同模型 1,仿真结果如图 8~10 所示。 图 8 模型 2 中的输出跟踪信号曲线 Fig.8 Tracking performance curve in model 2 图 9 模型 2 中的跟踪误差信号曲线 Fig.9 Tracking error curve in model 2 从以上 2 个非线性系统模型的仿真结果来看, 当参考信号为方波或正弦函数时,通过粒子群算法 学习得到 Elman 无模型控制器的最优网络权值,最 图 10 模型 2 中的控制输入信号曲线 Fig.10 Control input curve of model 2 后得到的控制量与期望的控制量信号误差较小,并 且能很好地实现对模型输出参考信号的实时跟踪, 把输出误差控制在合理范围内,具有良好的收敛性。 与基于 BP 网络+BP 算法的无模型控制方法相比, 拥有较快的响应速度和较好的控制精度。 由此证明 了基于 Elman 网络与粒子群算法的无模型控制方法 是有效与合理的。 4 结束语 本文针对一类单输入单输出离散非线性系统, 提出基于 Elman 网络结构的无模型控制方法,利用 粒子群优化算法对控制器的参数进行优化学习,通 过两个仿真模型的跟踪控制,结果证明了该方法的 有效性。 该方法的优点在于:1) 控制器的设计不依 赖于被控对象的具体数学模型,依赖的仅仅是系统 的输入输出数据;2)控制器网络结构中的参数向量 使粒子群算法进行优化,避免了梯度算法中需要求 解偏导数的问题,所有参数统一更新学习,简单便 捷。 参考文献: [1]侯忠生, 韩志刚. 非线性系统鲁棒无模型学习自适应控 制[J]. 控制与决策, 1995, 10(2): 137⁃142. HOU Zhongsheng, HAN Zhigang. Robust modelless learning adaptive control of nonlinear systems[ J]. Control and deci⁃ sion, 1995, 10(2): 137⁃142. [2]李秀英, 李桂英, 毛琳, 等. 采用改进粒子群算法的非 线性大时滞系统无模型控制[ J]. 智能系统学报, 2013, 8(3): 254⁃260. LI Xiuying, LI Guiying, MAO Lin, et al. Model⁃free control method for a nonlinear system with large time-delay based on IPSO [ J ]. CAAI transactions on intelligent systems, 2013, 8(3): 254⁃260. 第 1 期 张俊玲,等:基于粒子群优化的 Elman 神经网络无模型控制 ·53·
·54. 智能系统学报 第11卷 [3]LEE K Y,KO H S,KIM H C,et al.A free model based CEN Yigang,QIN Yuanqing,SUN Debao,et al.Applica- intelligent controller design and its application to power sys- tion of PSO algorithm in wavelet neural network[]].Acta tem stabilization[C]//Proceedings of the IEEE Power Engi- simulata systematica sinica,2004,16(12):2783-2785. neering Society Summer Meeting.Seattle,WA,USA, 2788. 2000.4:1985-1989. [14]李宁,邹形,孙德宝,等.基于粒子群的多目标优化算 [4]SPALL J C,CRISTION J A.Model-free control of nonlinear 法[J].计算机工程与应用,2005,41(23):43-46. stochastic systems in discrete time[C]//Proceedings of the LI Ning,ZOU Tong,SUN Debao,et al.Multi-objective 34th IEEE International Conference on Decision and Con- optimization utilizing particle swarm[J].Computer engi- trol.New Orleans,LA,USA,1995,3:2199-2204. neering and applications,2005,41(23):43-46. [5]CHENG G S.Model-free adaptive (MFA)control J]. [15]孙胜永,胡双演,李钊,等.基于粒子群优化算法的BP Computing Control Engineering,2004,15(3):28-33. 神经网络图像复原[J].无线电工程,2014,44(10): [6]刘德荣,李宏亮,王鼎.基于数据的自学习优化控制: 5.7. 研究进展与展望[J].自动化学报,2013,39(11):1858- SUN Shengyong,HU Shuangyan,LI Zhao,et al.BP Neu- 1870. ral Network for image restoration based on Particle Swarm LIU Derong,LI Hongliang,WANG Ding.Data-based self- Optimization[J.Radio engineering,2014,44(10):5-7. learning optimal control:research progress and prospects [16]金尚泰,侯忠生,池荣虎,等.侯离散时间非线性系统 [J].Acta automatica sinica,2013,39(11):1858-1870. 的数据驱动无模型自适应迭代学习控制[J].控制理论 [7]ZHANG L,WANG N.Double neuron model-free control for 与应用,2012,29(8):1001-1009. pH processes [C]//Proceedings of 2010 Chinese Control JIN Shangtai,HOU Zhongsheng,CHI Ronghu,et al.Da- and Decision Conference.Xuzhou,China,2010:2867- ta-driven model-free adaptive iterative learning control for a 2871. class of discrete-time nonlinear systems[].Control theory [8]ELMAN J L.Finding structure in time[J].Cognitive sci- &applications,2012,29(8):1001-1009, ence,1990,14(2):179-211. [17]NARENDRA K S,MUKHOPADHYAY S.Adaptive control [9]LI Xiang,CHEN Zengqiang,YUAN Zhuzhi.Nonlinear sta- using neural networks and approximate models[J].IEEE ble adaptive control based upon Elman networks[J].Ap- transactions on neural networks,1997,8(3):475-485. plied mathematics:a Journal of Chinese universities,2000, 作者简介: 15(3):332-340. 张俊玲,女,1990年生,硕士研究 [l0]王俭臣,齐晓慧,单甘霖.基于EPS0-BP的Elman网 生,主要研究方向为无模型控制、智能 络及其在飞行轨迹预测中的应用[J].控制与决策, 优化算法。 2013,28(12):1884-1888. WANG Jianchen,QI Xiaohui,SHAN Ganlin.Elman net- work based on EPSO-BP and its application in flight trajec- tory prediction[J].Control and decision,2013,28(12): 陈增强,男,1964年生,教授,博士 1884-1888. [11]KENNEDY J,EBERHART R.Particle swarm optimization 生导师,主要研究方向为智能控制、智 能信息处理,曾获天津市自然科学二等 [C//Proceedings of the IEEE International Conference on 奖,发表学术论文100余篇。 Neural Networks.Perth,WA,USA,1995,4:1942-1948. [12]赵勇,岳继光,李炳宇,等.一种新的求解复杂函数优 化问题的并行粒子群算法[J].计算机工程与应用。 2005,41(16):58-60,64. ZHAO Yong,YUE Jiguang,LI Bingyu,et al.A parallel 张青,女,1965年生,教授,主要研 究方向为复杂系统建模与控制、多智能 particle swarm optimization algorithm based on multigroup for solving complex functions optimization[].Computer 体系统,发表学术论文30余篇。 engineering and applications,2005,41(16):58-60,64. [13]岑翼刚,秦元庆,孙德宝,等.粒子群算法在小波神经 网络中的应用[J].系统仿真学报,2004,16(12): 2783-2785,2788
[3]LEE K Y, KO H S, KIM H C, et al. A free model based intelligent controller design and its application to power sys⁃ tem stabilization[C] / / Proceedings of the IEEE Power Engi⁃ neering Society Summer Meeting. Seattle, WA, USA, 2000, 4: 1985⁃1989. [4]SPALL J C, CRISTION J A. Model-free control of nonlinear stochastic systems in discrete time[C] / / Proceedings of the 34th IEEE International Conference on Decision and Con⁃ trol. New Orleans, LA, USA, 1995, 3: 2199⁃2204. [5] CHENG G S. Model - free adaptive ( MFA) control [ J]. Computing & Control Engineering, 2004, 15(3): 28⁃33. [6]刘德荣, 李宏亮, 王鼎. 基于数据的自学习优化控制: 研究进展与展望[J]. 自动化学报, 2013, 39(11): 1858⁃ 1870. LIU Derong, LI Hongliang, WANG Ding. Data⁃based self- learning optimal control: research progress and prospects [J]. Acta automatica sinica, 2013, 39(11): 1858⁃1870. [7]ZHANG L, WANG N. Double neuron model⁃free control for pH processes [ C] / / Proceedings of 2010 Chinese Control and Decision Conference. Xuzhou, China, 2010: 2867⁃ 2871. [8]ELMAN J L. Finding structure in time[ J]. Cognitive sci⁃ ence, 1990, 14(2): 179⁃211. [9]LI Xiang, CHEN Zengqiang, YUAN Zhuzhi. Nonlinear sta⁃ ble adaptive control based upon Elman networks [ J]. Ap⁃ plied mathematics: a Journal of Chinese universities, 2000, 15(3): 332⁃340. [10]王俭臣, 齐晓慧, 单甘霖. 基于 EPSO-BP 的 Elman 网 络及其在飞行轨迹预测中的应用[ J]. 控制与决策, 2013, 28(12): 1884⁃1888. WANG Jianchen, QI Xiaohui, SHAN Ganlin. Elman net⁃ work based on EPSO⁃BP and its application in flight trajec⁃ tory prediction[J]. Control and decision, 2013, 28(12): 1884⁃1888. [11]KENNEDY J, EBERHART R. Particle swarm optimization [C] / / Proceedings of the IEEE International Conference on Neural Networks. Perth, WA, USA, 1995, 4: 1942⁃1948. [12]赵勇, 岳继光, 李炳宇, 等. 一种新的求解复杂函数优 化问题的并行粒子群算法[ J]. 计算机工程与应用, 2005, 41(16): 58⁃60, 64. ZHAO Yong, YUE Jiguang, LI Bingyu, et al. A parallel particle swarm optimization algorithm based on multigroup for solving complex functions optimization [ J]. Computer engineering and applications, 2005, 41(16): 58⁃60, 64. [13]岑翼刚, 秦元庆, 孙德宝, 等. 粒子群算法在小波神经 网络中的应用[ J]. 系统仿真学报, 2004, 16 ( 12): 2783⁃2785, 2788. CEN Yigang, QIN Yuanqing, SUN Debao, et al. Applica⁃ tion of PSO algorithm in wavelet neural network[ J]. Acta simulata systematica sinica, 2004, 16( 12): 2783⁃2785, 2788. [14]李宁, 邹彤, 孙德宝, 等. 基于粒子群的多目标优化算 法[J]. 计算机工程与应用, 2005, 41(23): 43⁃46. LI Ning, ZOU Tong, SUN Debao, et al. Multi⁃objective optimization utilizing particle swarm [ J]. Computer engi⁃ neering and applications, 2005, 41(23): 43⁃46. [15]孙胜永, 胡双演, 李钊, 等. 基于粒子群优化算法的 BP 神经网络图像复原[ J]. 无线电工程, 2014, 44( 10): 5⁃7. SUN Shengyong, HU Shuangyan, LI Zhao, et al. BP Neu⁃ ral Network for image restoration based on Particle Swarm Optimization[J]. Radio engineering, 2014, 44(10): 5⁃7. [16]金尚泰, 侯忠生, 池荣虎, 等. 侯离散时间非线性系统 的数据驱动无模型自适应迭代学习控制[ J]. 控制理论 与应用, 2012, 29(8): 1001⁃1009. JIN Shangtai, HOU Zhongsheng, CHI Ronghu, et al. Da⁃ ta⁃driven model⁃free adaptive iterative learning control for a class of discrete⁃time nonlinear systems[J]. Control theory & applications, 2012, 29(8): 1001⁃1009. [17]NARENDRA K S, MUKHOPADHYAY S. Adaptive control using neural networks and approximate models[ J]. IEEE transactions on neural networks, 1997, 8(3): 475⁃485. 作者简介: 张俊玲,女,1990 年生,硕士研究 生,主要研究方向为无模型控制、智能 优化算法。 陈增强,男,1964 年生,教授,博士 生导师,主要研究方向为智能控制、智 能信息处理,曾获天津市自然科学二等 奖,发表学术论文 100 余篇。 张青,女,1965 年生,教授,主要研 究方向为复杂系统建模与控制、多智能 体系统,发表学术论文 30 余篇。 ·54· 智 能 系 统 学 报 第 11 卷