第5卷第5期 智能系统学报 Vol.5 No.5 2010年10月 CAAI Transactions on Intelligent Systems 0ct.2010 doi:10.3969/j.issn.16734785.2010.05.012 Elman神经网络的板形模式识别方法 张秀玲12,李少清12,田力勇12 (1.燕山大学电气工程学院,河北秦皇岛066004;2.燕山大学工业计算机控制工程河北省重点实验室,河北秦 皇岛066004) 摘要:针对静态网络设计和识别时间模式的能力弱、泛化能力差、学习速度慢等缺点,建立了一个基于Elma神 经网络的板形模式识别系统.该系统由于考虑到了神经网络的过学习或过拟合问题,且通过经验公式和对比实验 来确定神经网络的隐层节点数,具有简单、有效的优点.系统通过对6种基本板形模式及其组合模式的学习,具有 了一定的泛化能力.经仿真验证,实际输出的误差均小于0.1,识别效果良好,可以证明基于Eman动态网络的系 统,其板形识别能力要强于BP网络构成的系统. 关键词:板形模式识别:Elman神经网络:动态网络 中图分类号:1P183文献标识码:A文章编号:16734785(2010)050449-05 Research of flatness pattern recognition based on the Elman neural network ZHANG Xiu-ling2,LI Shao-qing2,TIAN Li-yong'2 (1.College of Electrical Engineering,Yanshan University,Qinhuangdao 066004,China;2.Key Laboratory of Industrial Computer Control Engineering of Hebei Province,Yanshan University,Qinhuangdao 066004,China) Abstract:Due to the presently poor level of designing and recognizing time patterns and generalizations of static neural networks,as well as the fact that learning speed is slow,a flatness pattern recognition system based on the Elman neural network was presented.The system is simple and efficient,because of its philosophy of over-learning or over-fitting a neural network and determining the number of the hidden nodes with experiential formulas and con- trasting experiments.This system has generalization capability through learning the six basic flatness patterns and their combinations.The simulation shows that each error of actual output is less than 0.1,giving a good result,and that the capability of the system based on the Elman dynamic network pattern recognition is better than the system based on a BP network. Keywords:flatness pattern recognition;Elman neural network;dynamic network 板形是带钢的重要质量指标.近年来,板带的纵 向厚度精度越来越高,这样板形问题就变得日益突 1板形基础知识 出山.BP网络虽有结构简单等特点,但用这种静态网 板带的轧制过程实质上是金属在轧辊作用下发 络进行板形模式识别,就是将动态时间建模问题变为 生塑性变形的过程,一定断面形状的坯料经过轧制 静态空间建模问题,这是不合适的2.而由J.L.- 发生明显的纵向延伸和一定的横向流动,进而变为 man于1990年提出的Elman神经网络是一种动态递 一件成品.板带轧制对变形过程有一个重要的要求, 归网络,它在前馈人工神经网络基本结构的基础上, 即沿板带宽度各部分应有均匀的纵向延伸.设想将 通过存储内部状态使其具备映射动态特征的功能,从 带钢分割成若干纵条,如果对于任何一条压下量发 而使系统具有适应时变特性的能力.所以用Elman神 生变化,都会引起该窄条的纵向延伸发生变化,同时 经网络来进行板形模式识别是非常合适的. 也会影响到相邻窄条的变形.由于带钢是一个整体, 各窄条之间必定互相牵制、互相影响.因此,当沿横 向的压下量分布不均时,各窄条就会相应地发生不 收稿日期:2009-1231. 基金项目:国家自然科学基金资助项目(50675186). 均匀的延伸,这就会在各窄条之间产生相互作用的 通信作者:张秀玲.E-mail:zxlysu@yahoo.com.cm. 内应力.当这个内应力足够大时,就会引起带钢的翘
·450· 智能系统学报 第5卷 曲,这就是板形缺陷产生的原因, 式.轧后板形可以表示为基本板形模式的线性组合: 2板形模式的建立 o(y)=aP1(y)+a2P2(y)+a3P3(y). 式中:o(y)为板带材的纵向残余应力;a1、a2、a3为 板形模式识别是在实测信号的基础之上,用数 模式系数或特征系数.当a1>0时,表示一次板形缺 学的方法判别板形缺陷类型,为板形控制提供依据。 陷为左侧浪;a10时,表示二次板形缺陷为中间浪; 程上常见的板形缺陷有6种:左侧浪、右侧浪、中间 a20时,表示四次板 种板形的组合.因此,可以用实际板形与标准板形的 形缺陷为边中浪. 欧氏距离来判断板形缺陷的种类.为满足板形的残 余应力沿板宽方向积分为零的约束条件,采用勒让 3基于Elman网络板形模式识别系统 德正交多项式系来表示板形缺陷的6种基本模式 的建立 左侧浪、右侧浪、中间浪、双边浪、四分浪、边中 浪的标准归一化方程分别为 3.1 Elman神经网络简介 Y1=p1(y)=y, Elman神经网络含有输入层、隐层、输出层、状态 Y2=-P1(y)=-y, 层.待识别的信息从输人节点进人网络,经计算通过 =)=-2 可变权值到达隐层节点,隐层节点的输出既要传给输 出节点,又要传给状态层,最后从输出层输出识别结 =-m()=-(3-7》, 果.到了下一个时刻,状态层将上一时刻的隐层节点 输出值与新的输入节点输出值一道传给隐层结点,重 ¥=%()=g(35y-30y+3), 复上一个时刻的过程.Elman神经网络是可用反馈网 络中最简单的一种31,其拓扑结构如图2所示。 %=-m()=-g((35y-30y+3). 状态层 6种标准归一化板形模式如图1所示. 1.0r 1.0 0.6 0.6 0.2 0.2 -0.2 ÷-0.2 输出 -0.6 -0.6 -1.00.60.2T.0 -1.00.60.21.0 (a)左恻浪 (b)右侧浪 输人单元 隐层单元 输出单元 0.5 0.5 图2 Elman神经网络 0 Fig.2 Elman neural network 05 -0.5 3.2基于Elman网络板形模式识别系统的建立 -1.0 -0.6 0.2 1.0 -1.0 0.60.2 1.0 本系统拥有3个输人节点、13个隐层节点、13 (c)侧浪 (d)双边浪 个状态层节点、3个输出节点.依据文献[3]的方法, 给出网络输入.设实测的待识别样本归一化为Y= 0.4 1.2 (σ(1),o(2),…,o(m),σ(i)为应力值,m为板 -0.4 宽离散化后的段数,n个标准样本归一化为 0.4 -0.8 0 Yk=(o(1),0(2),…,ok(m)), -1 -i.00.6v0.2 1.0 0400.602 k=1,2,…,n 这样,便可求得待识别样本Y与第个标准样本Y (e)四分浪 ()边浪 的欧氏距离: 图1板形标准模式曲线 Fig.1 Patter curves of standard strip flatness D.=1Y-y‖=[∑(c(i)-()2], Y(k=1,2,3,4,5,6)为板形标准样本的基本模 k=1,2,…,n
第5期 张秀玲,等:Elman神经网络的板形模式识别方法 451 D,就成为神经网络的输人.神经网络的输出为 最优停止法.即将样本数据分为2组,一组用来训练 3个板形特征值.文献[4]的识别网络有6个输人, 网络,另一组用来测试网络.在训练网络的过程中, 仍不够简单.在得到6个欧氏距离后,用文献[5]的 每隔一段时间用测试数据来检验网络对未经训练数 方法,可以将6个输人Dk简化为3个输入d,(S= 据的适应能力,当测试用的数据使得网络误差开始 1,2,3).若D1D2时,d1= 上升时,表明出现了过学习或过拟合,应停止训练。 -D2;若D3D4时,d2=-D4; 经多次仿真实验,选择训练次数为5000.对于本文 若D5D6,d3=-D6 的Elman网络,如果训练次数过大,虽然训练误差仍 下面来确定Elman神经网络的隐层节点数.隐 继续减小,但泛化误差将会增大.因此,训练到5000 层节点数的选取可以靠经验公式和实践来完成.选 次时神经网络的权值及阚值是最理想的,此时E- 多了学习时间长,精度不一定提高,网络结构会过于 man网络的泛化能力是最强的.如果出现测试结果 复杂,而选少了又达不到要求的学习和识别精度.按 不一致的情况,就取结果较好的网络结构进行保存. 照文献[6]的方法,考虑到状态矢量和待估计模型 在Matlab主界面右上端Workspace一栏下,有一个 的阶数,用待估计模型的阶数乘以2再加1,及对比 叫做“net”的小图标,里面即是训练好的神经网络, 试验的效果,可以将隐层节点数定为11或是13.经 全部的权值、阈值都在那里,以后用到它时只需调用 仿真验证,拥有13个隐层节点的网络其识别精度要 即可.如果想看到权值或是阈值,只需在Command 高于拥有11个隐层节点的网络.隐层节点数多于 Window中输人“net”,再回车即可.Elman神经网络 13时,精度会下降,学习过程将变得十分缓慢.代价 定为输入层3个节点、输出层3个节点、隐层13个 函数选为实际输出与标准输出的欧氏距离。 节点、状态层13个节点.为了验证Eman神经网络 4仿真结果 的板形模式识别能力,在其完成对6种标准的板形 模式及其组合学习后,对其进行了测试.利用与E 本文用Matlab神经网络工具箱进行编程仿真. man网络拥有同样的隐层节点数、同样长仿真时间 一般情况下,人们用这个工具箱只是为了验证自己 的BP网络进行了对比仿真,仿真结果如表1所示. 的成果,而作者将工具箱作为构建系统的平台.作者 其中误差E为标准输出与网络输出的欧氏距离.图 注意到,神经网络需要一定的时间来学习,但如果神 3为第4个测试样本的Elman网络识别结果图.从 经网络的学习时间太长,会出现过学习或过拟合的 结果中可以看出,对于绝大多数测试样本的3个板 情况们,并不利于其泛化能力的增强.这一点,在文 形特征值识别结果,Elman网络要优于BP网络,而 献[8]中也得到了验证,在训练神经网络时,它的泛 对于实际输出与标准输出的欧氏距离,前者也要小 化误差经历了一个先单调减小,接着复杂变化,最后 于后者.Elman网络拥有动态记忆及模仿系统动力 单调上升的过程,而最佳的泛化能力出现在训练误 学特性的能力[9,因此,Eman网络确实比BP网络 差的全局最小点出现之前.为了解决这个问题,采用 更适合进行板形模式识别. 表1板形识别结果 Table 1 The results of flatness pattern recognition 标准输出 Elman网络输出及误差 BP网络输出及误差 测试样本 2 1 Y=0.2Y1+0.8Y 0.2 0.0 0.8 0.20520.02330.82420.0339 0.2009-0.04890.87670.0910 Y=0.1Y1+0.9Y3 0.1 0.9 0.0 0.11130.8951-0.00270.0126 0.12440.7995-0.18730.2139 Y=0.4Y3+0.6Y 0.0 0.4 0.6 0.04960.34910.63280.07830.10590.47350.45920.1909 Y=0.2Y4+0.8Ys 0.0 -0.2 -0.8-0.0416-0.1961-0.78160.0456-0.13400.0923-0.97130.3643 Y=0.7Y2+0.3Y -0.7 0.0 0.3 -0.6912-0.00310.27140.0301-0.5384-0.08470.35310.1900 Y=0.4Y2+0.6Y6 -0.4 0.0 -0.6 -0.4050-0.0525-0.65440.0758-0.24880.0362-0.7733-0.2329
·452. 智能系统学报 第5卷 0.4 0.05 0.03 0.01 -0.4 -0.01 -0.8 -0.03 1.2 -0.05 1.0-0.6-0.20.2 0.61.0 1.0-0.6-0.20.2 0.61.0 归一化板宽 归一化板宽 (a)板形编差拟合曲线 (b)一次板形含量 0.15 0.6 0.05 0.2 -0.05 -0.2 -0.15 -0.6 -0.20 1.0 -0.6-0.20.2 0.6 1.0 -081.006-02020.610 归一化板宽 归一化板宽 @)二次板形含量 (d)四次板形含量 图3第4个测试样本的识别结果 Fig.3 The fourth test sample recognition results 5 结束语 fication and control of nonlinear systems by a dissimilation particle swarm optimization-based Elman neural network 通过仿真试验建立的基于Elman神经网络的板 [J].Nonlinear Analysis:Real World Applications,2008, 形模式识别系统,在测试中明显好于BP网络的识 9:1345-1360. 别结果.这在实践上可以证明Elman神经网络通过 [4]张秀玲.冷带轧机板形智能识别与智能控制研究[D].秦 皇岛:燕山大学,2002:36-39. 存储内部状态,具备了映射动态特征的功能,从而使 ZHANG Xiuling.Research on intelligent control and recog- 系统具有适应时变特性的能力,这是BP网络所不 nition of flatness for cold strip mill [D].Qinhuangdao: 具有的.另外,对过拟合的考虑,使得Elman神经网 Yanshan University,2002:36-39. 络板形模式识别系统较同等结构的BP神经网络具 [5]周会峰.板形识别预测和控制仿真的智能方法研究[D], 有更好的泛化能力,因此更具实用价值.通过仿真结 秦皇岛:燕山大学,2005:3839. 果可以看出,基于Matlab仿真软件平台,只要有训 ZHOU Huifeng.Research on intelligent methods of flatness 练数据,就可以构造出适合于生产实际的板形模式 recognition prediction and control simulation[D].Qin- 识别系统 huangdao:Yanshan University,2005:38-39. [6]谢庆国,万淑芸,赵金.一种Elman回归网络的设计方法 参考文献: [J刀.华中科技大学学报:自然科学版,2002,30(3):22 [1]王国栋.板形控制和板形理论[M].北京:冶金工业出版 24. 社,1980:1-11. XIE Qingguo,WAN Shuyun,ZHAO Jin.A systemic design [2]魏剑平,李华德,余达太,等.基于回归神经网络的复杂 for Elman recurrent network[J].Joumal of Huazhong Uni- 工业对象的建模[J].北京科技大学学报,1999,21(4): versity of Science and Technology:Nature Science Edition, 406408. 2002,30(3):22-24. WEI Jianping,LI Huade,YU Datai,et al.Modeling for a [7]HAGIWARA K,FUKUMIZU K.Relation between weight complicated industrial object based on recurrent neural net- size and degree of over-fitting in neural network regression work[J].Joural of University of Science and Technology [J].Neural Networks,2008,21:48-58. Beijing,1999,21(4):406408. [8]魏海坤.神经网络结构设计的理论与方法[M].北京:国 [3]GE Hongwei,QIAN Feng,LIANG Yanchun,et al.Identi- 防工业出版社,2005:97-99
第5期 张秀玲,等:Elman神经网络的板形模式识别方法 ·453· [9]陈跃华,曹广益,朱新坚.PEMFC的Elman神经网络建 李少清,男,1984年生,硕士研究 模与模糊神经网络控制[J].能源技术,2005,26(4): 生,主要研究方向为Elman神经网络板 146-149. 形识别. CHEN Yuehua,CAO Guangyi,ZHU Xinjian.Elman neural network modeling and adaptive fuzzy control of PEMFC [J].Energy Technology,2005,26(4):146-149. 作者简介: 张秀玲,女,1968年,教授、博士,主 田力勇,男,1985年生,硕士研究 要研究方向为神经网络智能控制.获国 生,主要研究方向为智能控制, 家科技进步二等奖1项,省部级科技进 步一等奖、二等奖各1项,发表学术论 文60余篇. 6国计算机 《计算机研究与发展》征订启事 《计算机研究与发展》(Journal of Computer Research and Development)是中国科学院计算技术研究所和 中国计算机学会联合主办、科学出版社出版的学术性刊物,中国计算机学会会刊.创刊于1958年(月刊),是 中国第一个计算机刊物.主要刊登计算机科学技术领域高水平的学术论文、最新科研成果和重大应用成果以 及技术进展.反映计算机领域内的新理论、新思想、新技术、重大科研任务的突破创新,是专业性很强的学术 刊物. 《计算机研究与发展》历次被评为我国计算机类核心期刊,多次被评为中国百种杰出学术期刊.是本领 域最有影响力的学术期刊之一.此外,还被美国工程索引(E)检索系统、日本《科学技术文献速报》、俄罗斯 《文摘杂志》、英国《科学文摘》(SA)、《中国学术期刊文摘》、《中国科学引文索引》、“中国科学引文数据库”、 “中国科技论文统计源数据库”等重要检索机构收录.所投稿件无论录用与否均经过同行专家的严格评审, 读者对象为从事计算机研究与开发的研究人员、工程技术人员、各大专院校计算机相关专业的师生以及高新 企业研发人员等. 国内邮发代号:2654:国外发行代号:M603 国际标准连续出版物号:ISSN1000-1239 国内统一连续出版物号:CN11-1777/TP 联系方式: 通讯地址:(100190)北京海淀区中关村科学院南路6号《计算机研究与发展》编辑部 联系电话:+86(10)62620696(兼传真);+86(10)62600350 邮 箱:crad@ict.ac.cn 网 址:http:/crad.ict.ac.cn