D0I:10.13374/j.issn1001-053x.1998.06.015 第20卷第6期 北京科技大学学报 VoL.20 No.6 1998年12月 Journal of University of Science and Technology Beijing Dec.1998 神经网络PID 控制 杜建凤崔勇张寒松严忠慧 北京科学大学机械工程学院,北京100083 摘要以工业PD控制中控制器参数调整困雅为背景,在分析神经网络特性的基础上,提出神 经网络控制方法,设计了具有自适应性的神经网络PD控制器.在描述了神经网络的学习机理的 基础上,给出了控制器控制算法,通过2个实例验证了神经网络在线控制的可行性. 关键词神经网络:学习机理;控制算法 分类号TP273.2 在工业生产中,PID控制一般效果良好,已得到广泛应用.但是,它具有一定的局限性: 当控制对象不同时,控制器的参数(K,K,K)难以自动调整以适应外界环境的变化.为了使 控制器具有较好的自适应性,实现控制器参数自动调整,可以采用神经网络控制的方法.由于 人工神经网络具有并行机制、学习能力和记忆功能,近年来人们尝试着把神经网络应用到 自动控制领域中,并且取得了一定成果.本文利用神经网络的自学习这一特性,结合传统思 想,构造了神经网络PD控制器,实现了控制器参数的自动调整, 1神经网络PD控制系统 11网络控制器结构 常规PID离散控制算式为: =K内+K客0T+k内-e-》 T (1) 其中:K。K,K分别为比例、积分、微分系数; ()为k时刻的控制系统实际输出和期望输出 X内 ○人W 的偏差;()为k时刻的控制器输出值,即控制 U(k) 量;T为计算机采样周期 X(肉 根据式(1),运用网络思想,构造神经网络X(俐 PD控制器,如图1所示, 图1 神经网络PID控制器结构图 图1中,网络输人为: X(内=e内 (2) 内=2e07 (3) X(阳=[e(-e(k-1)】IT (4) 网络输出为: 1997-11-07收稿 杜建凤女,24岁,顾士
第 2 0卷 第6期 1 9 98年 12月 北 京 科 技 大 学 学 报 Jo u r n a l o f Un i v e r s i t y o f Sc i e n e e a n d T e c h n o l o g y B e ji i n g V o l . 2 0 N o . 6 】k e 。 1 9 9 8 神经网络 P I D 控制 杜建凤 崔 勇 张寒松 严忠慧 北京科学大学机械工 程学院 , 北京 10 0 0 83 摘 要 以工 业 P ID 控制中控制器参数调整 困难 为背景 , 在分析神经 网络特性 的基础上 , 提 出神 经网络控 制方法 , 设计了 具有 自适应性的神经网络 PI D 控制器 . 在描述 了神 经网络的学 习机理 的 基 础上 , 给出了 控制器控制算法 . 通过 2 个实例验证了神经 网络在线控制的可行性 . 关键词 神经 网络 ; 学习机理 ; 控制算法 分 类号 T P 2 7 .3 2 在 工 业生 产 中 , PI D 控制 一般效 果 良好 , 已 得到 广 泛应 用 . 但 是 , 它具 有 一定 的局 限性 : 当控 制 对象不 同时 , 控 制器 的参数 (凡 , 长 , 凡 )难 以 自动 调 整 以 适应 外 界 环境 的变 化 . 为 了 使 控 制 器具有较好的 自适应性 , 实现控制器参数 自动调整 , 可 以 采用 神经 网络控 制 的方 法 . 由于 人工 神经 网络 具有 并行 机 制 、 学 习能力和 记忆 功能川 , 近年 来人 们 尝试 着 把 神经 网络应 用 到 自动 控制领域 中 , 并且 取得 了一定成果 2[] . 本文利用神经 网络的 自学 习这 一特 性 , 结合 传统 思 想 , 构造 了神经网络 PI D 控 制器 , 实现了控制器参数的 自动调 整 . 1 神经网络 P I D 控制系统 1 . 1 网络控 制器结 构 常规 IP D 离散控 制算式为 : _ , , 、 _ _ 点 _ _ _ _ e 闪 一 e 必一 l) u 叹)K = 凡` ()K + 入 ; 乙 e ( ` ) 1 + 人 d一一一一百二一一一 i = 0 1 ( l ) 叔芍 — 9 尝一 。 。 兀(k) — 生多义兰厂一一 ’ 龙(k) 一 又声 图1 神经网络IP 】〕控 制器结构 图 、少夕. 2 内à` 4 了.、 .、 其 中 : K p , 风 , 凡 分 别 为 比例 、 积 分 、 微 分系数 ; e( k) 为 k 时刻 的控 制系 统实 际输出和期望 输出 的偏差 ; u( k) 为 k 时 刻的控 制器 输 出值 , 即控 制 量 ; T 为计算机 采样周 期 . 根 据式 ( l) , 运用 网 络思 想 , 构 造神 经 网络 P ID 控 制器 , 如 图 1 所示 . 图 1 中 , 网络输人 为 : 戈(k) = e (k) 戈(k) = 艺e( Q T 戈(k) = [ e (k) 一 e ( k 一 l ) ] / T 网络输 出为 : 19 9 7 一 1 1 一 0 7 收稿 杜 建凤 女 , 2 4岁 , 硕士 DOI: 10. 13374 /j . issn1001 -053x. 1998. 06. 015
·572· 北京科技大学学报 1998年第6期 u(内=X(W+XW()+X(内W,() (5) 其中:W()(=1,2,3)为网络加权值. 神经网络根据控制系统实际输出和期望输出的偏差值,采用一定规则,进行自适应学习, 不断调整网络权值向量W到最佳值Wm.从式(1)与(⑤)可知,网络权值的调整过程可以看作 PD控制器参数的自整定过程.因此,神经网络PID控制器具有自适应性. 1.2网络控制系统 建立了使用神经网络PID控制器的计算机控制系统如图2所示.图中y.(阳为被控对象期 望输出,y附为系统实际输出,转换函数把偏差信号ε转换为网络控制器的输人量,网络的输 出()作为系统控制信号, 转 y(k) 换 内 DA 被控对象 数 A/D 测量变送 图2神经网络控制系统 2神经网络的学习机理和控制算法 2.1学习机理 图2中,神经网络按照误差函值最小准则,运用LMS(Least Mean Square)法则a:,进行 自学习,修正网络权值W 令控制系统误差函数为: 丙=12y.(内-y]2 (6) 那么,网络权值学习规则为: ak+1) △W,=-LOW(肉 () 式中L,为学习步长.运用随机逼近理论,可以证明L充分小时,W将收敛到某一稳态值W, 使得误差函数值最小,), 2.2控制算法 根据上述学习机理,图2中的神经网络控制器采用如下控制算法: 内=三W(内x内 (8) dy(k+1) Wk+1)=W肉+L,.k+1)-y,k+1J u(k) (9)
北 京 科 技 大 学 学 报 (u k) = 戈( k) 城 ( k) + 戈( k) 代( k) 十 戈( k) 哄( k) 其 中 : 叫 ( k) (i = 1 , 2 , 3) 为 网络加权值 . 199 8年 第6期 (5 ) 神经网络根 据控 制系 统实际输出和期望 输 出 的偏 差值 , 采 用一 定规则 , 进 行 自适应学 习 , 不断调整 网络权值 向量 砰 i到最 佳值 平 l[] . 从式 (l )与 ( 5) 可知 , 网络权值的调 整过程 可 以 看作 IP D 控制器参数的 自整定 过程 . 因此 , 神经网 络 IP D 控制器具有 自适 应性 . 1 . 2 网络控制 系统 建 立 了使用神 经 网络 IP D 控 制器 的计算机控 制系 统如 图 2 所示 . 图 中ye (k) 为被控对象期 望输 出 , y 式k) 为系 统实 际输 出 , 转 换 函数把偏差信号 。 转换为网络控 制器 的输人 量 , 网络的输 出 u( k) 作为系统控 制 信号 . 只k) 侧 A 蔽而豪刁月巡竺 转换数函 叫 A ZD 测量变送 圈2 神经网络控制系统 2 神经网络的学习机理和控 制算法 .2 1 学 习机理 图 2 中 , 神经 网 络按 照 误差 函值最小 准则 , 自学 习 , 修正 网络权值 研 · 令控制系 统误差 函数为 : 那 么 , 网络 权值学 习规则为 : 运 用 L M S (玫as t eM an s q ~ )法 则l[ .3] , 进行 旦k) = 12/ 以(k) 一 y 汉k) ] ( 6 ) △班 = 式 中L r 为 学 习 步 长 . 运用 随机 逼近理 论 , 使得误差 函数值最 小 .l3[ ] . .2 2 控制 算法 _ a及k + l ) 一 L 石一 一二一一- , , ’ - 口城 ( k) ( 7 ) 可 以证 明 L 充分 小 时 , 砰 i将收敛到某 一稳 态值 平 根据上述 学习机理 , 图 2 中的神经 网络控制器采用如 下控制算法 : 、 1 产、少. 00 了.飞、了.、 产 u( k) = 工城 (k) X (k) 叫 ( k + l ) = 叫 ( k) + L , 妙 。 ( k + l ) 一 夕f ( k + l ) ] a夕f (k + l ) a u (k)
Vol.20 No.6 杜建风等:神经网络PID控制 ·573· ay因 其中,u网 用差分来近似:一 y+1)yk+1)-因 u(u(-(k-1) 在神经网络理论中,学习步长L,一般取(0,1)之间的数,它的大小决定网络权值的调整 幅度.网络的初始权值W,(0)不仅关系到网络能否达到全局最小点,同时对网络学习时间的 长短有较大影响.神经网络理论中,一般取随机数作为初始权值.本文根据所构造的控制器的 特点,借鉴传统PD的ZN调整法的结果,确定网络初始权值为: W0)=[3.5-2W0)/T]K (10) W0)=[2.45-W0)-W0)/T]K (11) W0)=1.25KT (12) 其中K是网络权值初始化系数, 实验结果表明,采用这种方法初始化图2所示神经网络,网络收敛且学习速度也较快, 3实验结果 实验过程中,先后以典型的二阶模拟系统和实际电液比例系统作为控制对象,采用本文 提出的神经网络PD控制方法,得出了系统对阶跃输人的响应结果,而且比较了网络控制器 参数对系统响应的影响. 3.1被控对象 (1)二阶系统.系统传递函数为:G(s=1/(T2S2+2TS+1),取T=0.01s,5-J.7 (②)实际电液比例系统.本文采用的电液比例系统是楔横轧机模拟试验台.其系统原理如 图3所示:加载油缸模拟轧机负载,液压缸活塞杆的移动控制辊缝的大小,压板处位移传感器 将所测电压信号由AD转换送人控制器,控 制器产生控制信号由D/A输人电液比例阀, 一加载袖缸 推动活塞使其向给定位置移动,用来控制系 压板(固定传感 统的响应. 器铁芯) 3.2结果分析 二阶模拟系统和实际电液比例系统相应 的响应曲线分别如图4和图5所示.图 中,L,K,分别为神经网络学习步长、权值初 始化系数和采样周期,1,为系统调整时间,系 图3 楔横轧机实验装量液压系统图 统期望输出y.(内为2.5. 由上文分析知,2个控制对象差别很大,但是,从图4和图5中可以看出,通过选取合适的 网络初始化参数和系统的采样时间,对二者都实现了神经网络PD控制. 神经网络控制系统中,系统响应特性的影响因素很复杂,在上述二阶模拟系统和实际电 液比例系统中分别研究了K和L对系统响应的影响,K值决定神经网络学习的起始位置,L, 决定网络的学习速度并且影响网络学习过程的动特性,实验结果表明,在其他参数不变的情 况下,选取合适的K值和L值(如表1)被控系统具有较好的响应特性
o V l . 卜及 0 2 ) . 6 杜建风等 : 神经网络 列座制 P l l 一 二 少脚 二 二 a , 、 * 、 。 ` 、 . 县 甲 , 二犷- 刃丁 用 2 己夕了术 卫工 ,以 : O u L幻 刁y ( k + l ) 己u (k) 夕长k + l ) 一 夕抓k) 一 。 (幻 一 。 (、 一 l ) ` 在 神经 网络理 论 中 , 学 习步 长 L r 一 般取 (0 , 1)之 间的数 , 它 的 大小 决 定 网络 权值 的调整 幅度 . 网络 的初 始 权值 甲 , (0) 不仅关 系到 网络能否 达 到全 局 最小 点 , 同 时对网络 学 习 时间 的 长 短有 较大影 响 . 神经 网络理 论中 , 一般取 随机 数作 为初始 权值 . 本 文根 据所 构造 的控 制器 的 特 点 , 借鉴传统 IP D 的 乙N 调整法 的结果 4[] , 确定 网络初始 权值为 : 、色.J 、 、产1. n à 1 1 `, 心几. , 1 `. 飞了.龟 1 、 .、 、 斌( 0 ) = [ 3 · 5 一 2 砚( o ) / T ] K 代( 0 ) = [ 2 · 4 5 一 斌( 0 ) 一 峨( o ) / T ] K 琪( 0 ) = 1 . 2 5 尤T 其中 K 是 网络权值初始 化 系数 . 实验结果表 明 , 采用 这种方 法初始化 图 2 所 示神经 网络 , 网络收敛且 学 习速度也较快 . 3 实验结果 实 验 过程 中 , 先后 以 典型 的二 阶模拟 系统 和实 际 电液 比例系统作 为控制对象 , 采 用本文 提出 的神经 网络 IP D 控制方 法 , 得 出了系统对阶跃输入 的 响应 结果 , 而 且 比较 了 网络 控制 器 参数对系 统响应 的影 响 . 1 1 被控对象 l( ) 二 阶系统 . 系统传递 函数为 : (G s) = 1(/ 对梦 十 戈不S + l) , 取 不 = .0 0 15 , 乙 一 .J .7 (2) 实 际电液 比例系 统 . 本文采 用的 电液 比例系 统是楔 横轧机模拟 试验 台 . 其系 统原 理如 图 3 所 示 : 加 载油缸模 拟轧机 负载 , 液压缸 活塞杆 的移 动控制 辊缝 的大 小 , 压板 处位 移传 感器 将 所 测 电压 信号 由 刀D 转 换 送人 控 制器 , 控 制 器 产生 控 制信 号 由 侧A 输人 电液 比例 阀 , 推 动 活 塞 使其 向给 定位 置 移动 , 用来控 制系 统 的响应 . 1 2 结果分 析 二阶模拟系 统和 实际 电液 比例系 统相 应 的 响 应 曲 线 分 别 如 图 4 和 图 5 所 示 . 图 中 , L r , K, 盼别为神经 网络学 习步 长 、 权值初 始 化系 数和 采 样周 期 , t 。 为 系 统调 整 时 间 , 系 统期 望 输出 y式k) 为 2 . 5 . 公7 一加 载油缸 压板 (固定传感 ` ` 器铁芯 ) 异二令厂矍 圈3 楔横 轧机实验装 t 液压 系统 圈 由上文分析知 , 2 个控 制对象差 别很大 , 但是 , 从 图 4 和 图 5 中可 以看 出 , 通过 选取 合适 的 网络初始 化参数和 系统 的采 样时 间 , 对二者 都实 现了神经 网络 IP D 控 制 . 神经网络控 制系 统中 , 系 统响应特 性的影 响 因素很复杂 , 在上 述二 阶模 拟 系统和 实 际电 液 比例系 统 中分别研究 了 K 和 人对系统 响应 的影 响 . K 值决 定神 经 网络 学 习的起始位置 , L r 决定 网络的学 习速 度并且 影 响 网络学 习过程 的 动特性 . 实 验 结果 表 明 , 在其他参数不 变 的情 况下 , 选取合适 的 K 值和 L r 值 (如 表 l) 被控 系统具 有较好 的响应特性
·574· 北京科技大学学报 1998年第6期 5 (a) L=0.001 4=225ms 5 (b) L0.001 4=70ms 4- K=1.6 K=1.8 T=5ms T=5 ms 80160240320400480560640 80160240320400480560640 t/ms t/ms (e) L=0.001 =170ms K=2 T=5 ms 图4二阶模拟系统响应曲线,L,为神经网 络学习步长;K为数值初始系数:T为采样周 期;4为系统调整时间,系统期盟输出y.(内为2.5 80160240320400480560640 t/ms (a) L,=0.003 4=7160ms 5 L=0.004 45520ms 4 K=0.8 4 K0.8 T=40 ms T=40 ms 1200 360060008400 1200360060008400 t/ms t/ms 5⊙ L=0.005 =7760ms 4 K=0.8 T=40m3 图5实际电液比例系统响应曲线 图中L,K,T以,意义同图4. 1200 36006000 8400 t/ms
. 5 7 4 . 北 京 科 技 大 学 学 报 1 9 9 8年 第6 期 >飞 (a) 华 0 . 00 一 ts = 2 2 5 m s 一 天二 1 . 6 T = J m S …厂 . ’ 一 ” ” ” ’ (b) 今 。刀0 1 t s = 7 0 m s _ 天` 1 . 8 了= s m s 一 厂 一 1 . 1 ’ . : 一 ’ l - >飞 8 0 1 60 2 4 0 320 4 0 0 4 8 0 5 6 0 64 0 8 0 1 60 2 4 0 32 0 4 00 4 80 5 60 64 0 刀m s 口m s 5 丽 乙声 0 . 00 1 天片2 2、 s m s ts = 170 m s 图4 二阶模拟系统响应曲线 . L r 为神经网 络学 习步长 ; K 为数值初始系数 ; T 为采样周 期 ; ` 为系统调整时间 , 系统期翅输出.y (k) 为.2 5 净飞 80 16 0 24 0 320 4 0 0 4 80 560 64 0 t 角1 5 (幼 几= 0 刀0 3 犬毕0 . 8 ~ T = 4 0 m s 几= 7 16 0 m s (b) =tI 0 . o 4 护 5 5 2 0 ms 孟卜 0 . 8 了 , 、 T = 4 0 1】15 f 、 / \ 、 { 二习 , 一 l 4 凡J`, l 沂、 苦 >、 n 1 2 00 3 60 0 6 0 0 0 8 4 00 1 2 0() 3 6 00 6 0 0() 以n 巧 8 4 0 0 t /m s ( e ) 二= 0 . 00 5 st = 7 7 60 m: 一 天二 0 . 8 工\ 竺竖 _ 一 { { \ 厂 一 份`月气J ù伪、` 势、 盏 图5 实际电液 比例系统响应曲线 图中乙 , K, ;7 st 意义 同图 4 . 1 2 0 0 3 6 0 0 6 0 0 0 8 4 0 0 刀n 1 s
Vol.20 No.6 杜建凤等:神经网络PID控制 ·575· 表1实验结果 控制器参数 二阶模拟系统 实际电液比例系统 图4a 图46 图4c 图5a 图5b 图5c T/ms 5 40 40 40 Lr 0.001 0.001 0.001 0.003 0.004 0.005 K 1.6 1.8 2 0.8 0.8 0.8 系统响应指标g/ms 225 70 170 7160 5520 7760 4结束语 提出的神经网络PD控制方法简单,它的可行性得到2个实验结果的证明.它的优点有: (1)无需建立被控系统的数学模型;(2)网络权值初始化方法的提出与权值系数K的引人,利于 所建神经网络的收敛性;(3)控制器参数整定方便. 这种方法给工业应用带来极大方便,发挥了神经网络的学习能力.本文只是初步工作,若 进一步完善算法,并选择合适的网络参数(如K,L,T)将会在实际工业生产中取得更为满意 的结果. 参考文献 1胡守仁.神经网络应用技术.北京:国防科技大学出版社,1993.10~20,82~91 2 Narendra K S.Special Section Neural Networks for Control System.IEE Contr,1990,10(3):3 3 Lippman R P.An Introduction to Computing with Neural Nets.IEEE ASSP,1987(2):4 4王锦标,方崇智.过程计算机控制.北京:清华大学出版社,1992,5~20 Neural Network PID Control Du Jianfeng Cui Yong Zhang Hansong Yan Zhonghui Mechanical Engineering School,UST Beijing,Beijing 100083.China ABSTRACT In view of it difficult to adjust the parameters of the industry PID controller and on the basis of analyzing the specific property of neural network,a neural network method is presented,and an adaptive neural network PID controller is designed, The learning mechanic of neural network and the control arithmetic are put foward.It proves the feasibility of the neural network control on line by two examples for the control system on the rolling. KEY WORDS neural network;learning mechanic;control arithmetic
1 0 V . O N 0 2 . 6 杜建凤等 : 神经网络 〕控制 P l l 1 表 实验结果 控制器参数 二阶模拟 系统 实际 电液 比例 系统 4 图 图 a 4 4 图 b e m / T s L r K 系统响应指标 s l s l n 0 . 1 0 0 0 . 1 00 0 . 1 0 0 1 . 6 5 2 2 图 s a 4 0 0 . 00 3 0 . 8 1 6 0 7 图 s b 4 0 0 . 4 0 0 0 . 8 5 5 0 2 0 . 8 6 0 7 7 U n , ù7 .l870 4 结束语 提 出的神 经 网络 IP D 控制 方法简单 , 它的可行 性得 到 2 个实验 结果 的证 明 . 它 的优点 有 : ( l) 无需 建立被 控系统 的数学模型 ; ( 2) 网络权值初 始化方 法 的提 出与权 值系数 K 的 引人 , 利于 所建神经 网络的收敛性 ; ( 3) 控制 器参数整定 方便 . 这种方法 给工业应 用带来极大方 便 , 发挥 了神经 网络 的学 习能力 . 本文 只是 初步 工作 , 若 进一 步完善算法 , 并选择合 适的 网络参数 (如 K , 共 , T ) 将 会在 实 际工 业生 产 中取得 更 为满 意 的结果 . 参 考 文 献 l 胡守仁 . 神经网络应用技术 . 北京 : 国 防科技大学出版社 , 1 993 . 10 ~ 20 , 82 一 91 Z N 扛er n dar K 5 . S pe e i al S e e it o n 噪 u la Ne wt o kr s fo r C on otr l S y s et m . IE C o ntr , 19 9 0 , 1 0 ( 3 ) : 3 3 U p m an R P . nA ln tr o d迸 it o n ot C o m Pu o ng w i ht 陇 u n习 Ne st . IE E A S S P , 1 9 8 7 ( 2 ) : 4 4 王锦标 , 方祟智 . 过程计算机控制 . 北京 : 清华大学 出版社 , 19 92 . 5 ~ 20 N e u r a l N e 1W o kr P I D C o n t r o l D u iJ a nfe ng uC i oY n g 及 a n g aH n s o n g aY n 及 o n g h u i Me e h别山e ia 助g ine e ir gD S e h o l , U S T B e ij i飞 , B e ij i ng 10 0 0 8 3 , C ih an A B ST R A C T nI v i e w o f it id if e ul t ot adj us t hte P a r 田旧 e te rs o f ht e i n d u s try IP D e o n otr ll e r an d o n hte b as i s o f an al y z i n g hte s pe e iif e P r o pe 仰 o f n e u ar l n e tw o rk , a n e u r a l en wt o kr me ht od 1 5 Per s e n et d , an d an ad a P it v e ne u ulr ne wt o kr P I D e o n otr ll e r 1 5 de s i g n e d , Th e l e aun n g m e e h ian e o f en u alr n e wt o kr a n d ht e e o n otr l iar t h l n e it e aer uP t fo w a r d . I t p r o v e s ht e fe as iib li yt o f het n e u alr n e wt o kr e o n 仃D I o n lien 勿 wt o e x 田旧 P l e s fo r het e o n otr l s y s et m o n ht e or lli n g . K E Y W O R D S n e t l ar l n e wt o kr ; l e arn i n g m e c h a in e ; e o n tr o l iar ht m e it e