D0I:10.13374/i.issnl001153.2008.02.021 第30卷第2期 北京科技大学学报 Vol.30 No.2 2008年2月 Journal of University of Science and Technology Beijing Feh.2008 数据挖掘在安钢电极预测建模中的应用 郭飞李华德冉正云 北京科技大学信息工程学院,北京100083 摘要从安钢电极控制的实际应用出发,应用数据挖掘技术建立了电极预测模型并应用于电极控制系统的参数整定·首先 介绍了建立电极预测模型的数据挖掘过程:然后在数据挖掘算法中提出了一种新的变结构遗传Eman网络方法,该算法用改 进的混合遗传算法对网络结构和权值及自反馈增益同步动态寻优·将基于BP算法的Elma网络和本文提出的变结构遗传 Elman网络都应用于安钢交流电弧炉的电极预测模型中进行比较.通过基于安钢现场数据的计算机仿真实验表明:采用变结 构遗传lman网络的数据挖掘算法比BP算法具有更好的动态性能、更快的逼近速度和更高的精度.在此基础上,把建立的模 型应用于安钢电极控制系统的参数整定,取得了良好的控制效果, 关键词数据挖掘;电极;变结构:混合遗传算法;Elman神经网络 分类号TP273+.3 Application of data mining in electrode prediction modeling of Anyang Steel GUO Fei,LI Huade,RA N Zhengyun School of Information Engineering.University of Science and Technology Beijing.Beijing 100083.China ABSTRACT On the basis of electrode control in Anyang Steel.a prediction model was established by adopting data mining technique and applied to parameter tuning of an electrode control system.First the data mining process of the electrode prediction model was in- troduced.A variable structure generic Elman neural network,which can evolve the network structure,the weights and self-feedback gain coefficient simultaneously.was proposed based on a new hybrid generic algorithm and data mining algorithm.The Elman based on BP algorithm and the variable structure generic Elman neural network were applied to establishing of an electrode prediction model for Anyang Steel.The simulation results based on the spot real data of Anyang Steel show that data mining algorithm combined with the variable structure generic Elman neural network has better dynamic characteristic,faster approach speed,better precision than BP algorithm.Finally,when this model was applied to parameter tuning of the electrode control system in Anyang Steel,its control ef- fect was remarkable. KEY WORDS data mining:electrode:variable structure:hybrid generic algorithm:Elman neural network 交流电弧炉电极控制系统是一种典型的多变 手段 量、非线性、参数时变、复杂强耦合的系统,其动态特 数据挖掘(data mining,DM)也称为数据库中的 性很难被准确全面的描述,这增加了对其模型建立 知识发现(knowledge discovery in database,KDD), 和控制设计的难度,在现有的电弧炉电极控制中, 它是从大量数据中提取出可信、新颖、有效并能被人 有的用统计方法建立预报模型山,有的建立经验模 理解的模式的高级处理过程),实现数据挖掘的方 型],这些方法往往缺乏对海量、复杂数据的处理 法有多种,本文是针对电极预测模型的建模,采用人 能力,所以很难建立精确模型,使控制不能达到满意 工神经网络和遗传算法相结合的方法,动态递归神 的效果,数据挖掘技术为自动和智能地把海量、复 经网络(dynamic recurrent neural network, 杂的数据转化为有用的信息和知识提供了有力的 DRNN)[是在神经网络中引入动态环节来自动记 收稿日期:2006-11-06修回日期:2007-05-11 录某些历史信息,动态递归神经网络在控制系统的 基金项目:北京市教育委员会重点学科共建项目(N 辨识和控制]中极具发展潜力,它直接反映了系 XK100080537) 作者简介:郭飞(1978一)女,博士研究生:李华德(1941一):男, 统的动态特性.而遗传算法](genetic algorithm, 教授,博士生导师 GA)是自然界的遗传进化理论发展而来的全局优化
数据挖掘在安钢电极预测建模中的应用 郭 飞 李华德 冉正云 北京科技大学信息工程学院北京100083 摘 要 从安钢电极控制的实际应用出发应用数据挖掘技术建立了电极预测模型并应用于电极控制系统的参数整定.首先 介绍了建立电极预测模型的数据挖掘过程;然后在数据挖掘算法中提出了一种新的变结构遗传 Elman 网络方法该算法用改 进的混合遗传算法对网络结构和权值及自反馈增益同步动态寻优.将基于 BP 算法的 Elman 网络和本文提出的变结构遗传 Elman 网络都应用于安钢交流电弧炉的电极预测模型中进行比较.通过基于安钢现场数据的计算机仿真实验表明:采用变结 构遗传 Elman 网络的数据挖掘算法比 BP 算法具有更好的动态性能、更快的逼近速度和更高的精度.在此基础上把建立的模 型应用于安钢电极控制系统的参数整定取得了良好的控制效果. 关键词 数据挖掘;电极;变结构;混合遗传算法;Elman 神经网络 分类号 TP273+∙3 Application of data mining in electrode prediction modeling of Anyang Steel GUO FeiLI HuadeRA N Zhengyun School of Information EngineeringUniversity of Science and Technology BeijingBeijing100083China ABSTRACT On the basis of electrode control in Anyang Steela prediction model was established by adopting data mining technique and applied to parameter tuning of an electrode control system.First the data mining process of the electrode prediction model was introduced.A variable structure generic Elman neural networkwhich can evolve the network structurethe weights and self-feedback gain coefficient simultaneouslywas proposed based on a new hybrid generic algorithm and data mining algorithm.T he Elman based on BP algorithm and the variable structure generic Elman neural network were applied to establishing of an electrode prediction model for Anyang Steel.T he simulation results based on the spot real data of Anyang Steel show that data mining algorithm combined with the variable structure generic Elman neural network has better dynamic characteristicfaster approach speedbetter precision than BP algorithm.Finallywhen this model was applied to parameter tuning of the electrode control system in Anyang Steelits control effect was remarkable. KEY WORDS data mining;electrode;variable structure;hybrid generic algorithm;Elman neural network 收稿日期:2006-11-06 修回日期:2007-05-11 基金 项 目: 北 京 市 教 育 委 员 会 重 点 学 科 共 建 项 目 ( No. XK100080537) 作者简介:郭 飞(1978—)女博士研究生;李华德(1941—)男 教授博士生导师 交流电弧炉电极控制系统是一种典型的多变 量、非线性、参数时变、复杂强耦合的系统其动态特 性很难被准确全面的描述这增加了对其模型建立 和控制设计的难度.在现有的电弧炉电极控制中 有的用统计方法建立预报模型[1]有的建立经验模 型[2].这些方法往往缺乏对海量、复杂数据的处理 能力所以很难建立精确模型使控制不能达到满意 的效果.数据挖掘技术为自动和智能地把海量、复 杂的数据转化为有用的信息和知识提供了有力的 手段. 数据挖掘(data miningDM)也称为数据库中的 知识发现(knowledge discovery in databaseKDD) 它是从大量数据中提取出可信、新颖、有效并能被人 理解的模式的高级处理过程[3].实现数据挖掘的方 法有多种本文是针对电极预测模型的建模采用人 工神经网络和遗传算法相结合的方法.动态递归神 经 网 络 ( dynamic recurrent neural network DRNN) [4]是在神经网络中引入动态环节来自动记 录某些历史信息.动态递归神经网络在控制系统的 辨识和控制[5—6]中极具发展潜力它直接反映了系 统的动态特性.而遗传算法[7—8] (genetic algorithm GA)是自然界的遗传进化理论发展而来的全局优化 第30卷 第2期 2008年 2月 北 京 科 技 大 学 学 报 Journal of University of Science and Technology Beijing Vol.30No.2 Feb.2008 DOI:10.13374/j.issn1001-053x.2008.02.021
第2期 郭飞等:数据挖掘在安钢电极预测建模中的应用 .203 搜索算法,目前已经成功地解决了很多复杂系统的 1.2数据选择 优化问题.本文提出一种改进的混合遗传算法(y 根据实际的生产经验,从中选择出20炉钢的数 brid genetic algorithm,HGA),用于动态递归Elman 据.数据包括电极三相电压集U1=[Ua,Ub,Ue]、 神经网络的结构、权值及自反馈增益的同步寻优,从 三相电流集I=[Ia,,1]和三相液压伺服阀门开 而形成一种变结构遗传神经网络(variable structure 度Uz=[ha,h,he],选择的数据中包括了现代电 hybrid genetic Elman artificial neural networks, 弧炉冶炼的熔化期,氧化期等全部的工艺过程 VSHGEA),并将其应用于交流电弧炉电极的数据 1.3数据预处理 挖掘预测建模中,HGA算法在线调整适应度函数, 数据质量好坏会直接影响所建模型的质量和知 在交叉变异中引入自适应策略,采用保持最优个体 识的评价应用,所以需要处理噪声、错误、丢失或非 的方法改进了标准遗传算法,通过基于安钢(安阳 相关数据,对于这类坏数据,采取了剔除的方式,最 钢铁集团有限责任公司)现场实际数据的仿真实验 后获得2000组数据 表明:利用基于变结构遗传神经网络的数据挖掘技 1.4数据变换 术建立起的电极预测模型,有很好的预测精度,将 为了更好适应神经网络处理数据的要求,使数 其应用于电极控制系统的参数整定中,取得了良好 据在建模中发挥更有效的作用,按下式把数据归一 的控制效果,为交流电弧炉电极的良好控制提供了 化处理,变换成[一1,1]之间的数据 保证 x'=-1十2x二xmin xmx一xmin (1) 1电极预测模型的数据挖掘过程 其中,x'为归一化后的数据值,x为原始数据值, 交流电弧炉电极预测模型的数据挖掘过程如图 xmim、xmax分别为原始数据的最小值和最大值 1所示,主要处理步骤如下, 1.5数据挖掘 实现数据挖掘的方法主要有统计学方法、决策 树、聚类分析、规则归纳、人工神经网络、遗传算法、 数据选择 预处理 模糊技术、粗糙(Rough)集方法等,本文根据电极系 统的特点以及神经网络和遗传算法各自的优缺点, 采样数据库 建模用数据 预处理后数据 采用了人工神经网络和遗传算法相结合的方法 1.6知识评价和应用 知识 评价/应用 数据挖掘 将以上通过数据挖掘所得到的电极预测模型, 采用检验数据进行评价检验后,可以应用于电极位 电极控制 电极预测模型 变换后数据 置控制,电网谐波和闪变的抑止等,本文将其应用 于电极控制系统的参数整定上, 图1电极预测模型数据挖掘过程 Fig.I Data mining process of an electrode prediction model 2数据挖掘模型的遗传神经网络算法实现 1.1数据库的建立 2.1采用BP算法的Elman网络 安钢引进的FUCHS100t带指形托架超高功率 Elman神经网络是一种应用广泛的动态递归神 交流竖式电炉(FSF),其电极控制系统采用奥钢联 经网络,它的主要结构是前馈连接,包括输入层、隐 专为电极控制而研制的VAMELT十十电极控制装 层、输出层,其连接权可以进行学习修正,反馈连接 置,该装置是以PC为基础构成的独立控制系统,数 由一组“结构”单元构成,用来记忆隐层单元前一时 据库是用微软的EXCEL软件以.CSV文件的格 刻的输出值.Elman神经网络结构如图2所示[, 式来存储的,为了能够更方便有效地分析处理数 其中网络的外部输入为u∈R',输出为y∈Rm,隐 据,本文重新用微软的SQL SERVER2000建立电 层输出为x∈R”,结构单元的输出为x∈R.W、 极电气运行数据库,数据库中包括电极电压属性表 W和W分别为结构单元到隐层、输入层到隐层 (VOT)、电流属性表(CUT)、液压属性表(HYT)、遗 以及隐层到输出层的连接权矩阵.W是nXn维 传算法种群初始化表(GAT)、神经网络学习训练参 矩阵,W2是nXr维矩阵,W是mXn维矩阵 数表(ANNT)等 则Elman神经网络描述的非线性输入输出关系为: x(k)=f(w'xe(k)+w-u(k)) (2)
搜索算法目前已经成功地解决了很多复杂系统的 优化问题.本文提出一种改进的混合遗传算法(hybrid genetic algorithmHGA)用于动态递归 Elman 神经网络的结构、权值及自反馈增益的同步寻优从 而形成一种变结构遗传神经网络(variable structure hybrid genetic Elman artificial neural networks VSHGEA)并将其应用于交流电弧炉电极的数据 挖掘预测建模中.HGA 算法在线调整适应度函数 在交叉变异中引入自适应策略采用保持最优个体 的方法改进了标准遗传算法.通过基于安钢(安阳 钢铁集团有限责任公司)现场实际数据的仿真实验 表明:利用基于变结构遗传神经网络的数据挖掘技 术建立起的电极预测模型有很好的预测精度.将 其应用于电极控制系统的参数整定中取得了良好 的控制效果为交流电弧炉电极的良好控制提供了 保证. 1 电极预测模型的数据挖掘过程 交流电弧炉电极预测模型的数据挖掘过程如图 1所示主要处理步骤如下. 图1 电极预测模型数据挖掘过程 Fig.1 Data mining process of an electrode prediction model 1∙1 数据库的建立 安钢引进的FUCHS100t 带指形托架超高功率 交流竖式电炉(FSF)其电极控制系统采用奥钢联 专为电极控制而研制的 VAMELT ++电极控制装 置该装置是以 PC 为基础构成的独立控制系统数 据库是用微软的 EXCEL 软件以∗.CSV 文件的格 式来存储的.为了能够更方便有效地分析处理数 据本文重新用微软的 SQL SERVER 2000建立电 极电气运行数据库.数据库中包括电极电压属性表 (VOT)、电流属性表(CUT)、液压属性表(HYT )、遗 传算法种群初始化表(GAT )、神经网络学习训练参 数表(ANNT)等. 1∙2 数据选择 根据实际的生产经验从中选择出20炉钢的数 据.数据包括电极三相电压集 U1=[ UaUbUc ]、 三相电流集 I=[ IaIbIc ]和三相液压伺服阀门开 度 U2=[ hahbhc ].选择的数据中包括了现代电 弧炉冶炼的熔化期氧化期等全部的工艺过程. 1∙3 数据预处理 数据质量好坏会直接影响所建模型的质量和知 识的评价应用所以需要处理噪声、错误、丢失或非 相关数据.对于这类坏数据采取了剔除的方式最 后获得2000组数据. 1∙4 数据变换 为了更好适应神经网络处理数据的要求使数 据在建模中发挥更有效的作用.按下式把数据归一 化处理变换成[—11]之间的数据 x′=—1+2 x— xmin xmax— xmin (1) 其中x′为归一化后的数据值x 为原始数据值 xmin、xmax分别为原始数据的最小值和最大值. 1∙5 数据挖掘 实现数据挖掘的方法主要有统计学方法、决策 树、聚类分析、规则归纳、人工神经网络、遗传算法、 模糊技术、粗糙(Rough)集方法等.本文根据电极系 统的特点以及神经网络和遗传算法各自的优缺点 采用了人工神经网络和遗传算法相结合的方法. 1∙6 知识评价和应用 将以上通过数据挖掘所得到的电极预测模型 采用检验数据进行评价检验后可以应用于电极位 置控制电网谐波和闪变的抑止等.本文将其应用 于电极控制系统的参数整定上. 2 数据挖掘模型的遗传神经网络算法实现 2∙1 采用 BP 算法的 Elman 网络 Elman 神经网络是一种应用广泛的动态递归神 经网络.它的主要结构是前馈连接包括输入层、隐 层、输出层其连接权可以进行学习修正反馈连接 由一组“结构”单元构成用来记忆隐层单元前一时 刻的输出值.Elman 神经网络结构如图2所示[4] 其中网络的外部输入为 u∈R r输出为 y∈R m隐 层输出为 x∈R n结构单元的输出为 xc∈R n.W 1、 W 2和 W 3 分别为结构单元到隐层、输入层到隐层 以及隐层到输出层的连接权矩阵.W 1 是 n× n 维 矩阵W 2 是 n× r 维矩阵W 3 是 m× n 维矩阵. 则 Elman 神经网络描述的非线性输入输出关系为: x( k)= f ( W 1 xc( k)+ W 2 u( k)) (2) 第2期 郭 飞等: 数据挖掘在安钢电极预测建模中的应用 ·203·
.204 北京科技大学学报 第30卷 xe(k)=x(k-1)+x(k-1) (3) 范围内随机选择;按退化概率Pb进行网络结构的 y(k)=g(wx(k)) (4) 某个神经元的删除工作,同时删除与之相关的连接 式中,f(),g()分别是隐含层和输出单元的激发 权值 函数;α是自反馈增益因子.结构单元的输出等于 (③)适应度函数,适应度函数所选择的误差型 上一时刻的隐层单元的输出与“结构”单元的上一时 目标函数为: 刻输出的a倍之和(为保证收敛,要求0<a<1),这 f一E D (5) 样可以逼近高阶系统, 之,(0a()-y(i)2 =kp十H 其中,f为k时刻的适应度值,p为辨识宽度,y和 输出层 y分别为期望输出和网络输出. (4)自适应选择操作,适应度是指导搜索的关 隐含层 键.为了避免“早熟”现象和保证种群中个体的多样 性,需要对适应度函数进行在线调整,本文通过分 析模拟退火算法4]和遗传算法的优缺点,将模拟 (k-1) 结构单元 输入层 退火算法的思想引入遗传算法,应用模拟退火算法 对适应度值按下式进行在线调整,然后再采用轮盘 图2 Elman神经网络结构 赌的方式进行选择: Fig.2 Structure of Elman ANN 基于BP算法的Elman网络可参考文献[9- f 10],它存在很大局限性.首先因为神经网络的结构 选择,也就是隐含层维数的选择对于复杂系统辨识 其中,M为种群大小;f:为第i个个体的适应度;T 的精度和速度都有很大的影响,隐含层的节点数过 为系数,T=To(0.999),T0为初始值,g为遗传 于庞大对于计算速度、网络实现都很困难,隐含层数 代数 目过小则网络收敛的速度就慢,采用BP算法的E 因为轮盘赌的思想是适应度越大被选中的概率 man网络的结构不动态地进行学习,是先确定网络 越大,所以由式(6)可以看出:在进化后期,系数T 结构再学习权值,这样有可能违反Kosmogorov定 不断下降,使适应度相近的个体适应度放大,从而使 理,没有良好的动态逼近能力,其次,BP算法本身 后期具有优势的个体的优势更明显,被选中的概率 容易陷入局部最小值并且学习速率慢,另外,自增 也就越高,从而使结果更具有全局性 益因子一般人为的选择,学习效率低,所以本文采 (5)自适应交叉和变异,交叉概率p。和变异 用一种改进的混合遗传算法(HGA)对Elman动态 概率卫m直接影响算法的收敛速度,本文采用了一 递归神经网络的权值和结构以及自反馈增益同时进 种自适应算法对交叉概率和变异概率进行优化,实 行动态学习,形成一种基于新型混合遗传算法的变 现了交叉概率和变异概率的非线性自适应调整,具 结构遗传神经网络,克服了Elman网络的上述 体公式如下所示: 缺陷 p2(f'-f) 2.2采用混合遗传算法的变结构Elman网络算法 f≥f. Pe fmfa (7) (1)编码问题,因为实数编码不存在编码和解 Pel, f∫a 码的过程,不会在编码和解码的过程中产生误差等 pm2(fmf) 二进制编码所带来的问题,所以本文采用实数编码, fm一fa f≥fa (8) 另外由于要在网络权值和结构同时进化,所以对于 Pml, f<f 个体的基因要排序,顺序为自反馈增益因子、网络结 式中,fm为种群中最大适应度值,f。为当代平均适 构和网络连接权值, 应度值,∫是要交叉的两个个体中较大的适应度值, (2)变结构,为了实现网络结构的进化,需要 f为要变异个体的适应度值,pl、pe2、Pm1和Pm?取 增加网络结构的发育和退化的操作.在进化中按照 值均小于1, 发育概率pa来决定是否增加隐层神经元,同时增加 由式(7)、(8)可以看出:对于适应度值高于平均 与之相关的连接权值,初始的连接权值可以在初始 适应度值的个体,P。和Pm取值较小,使该个体可以
xc( k)=x( k—1)+αxc( k—1) (3) y( k)=g( W 3 x( k)) (4) 式中f (·)g(·)分别是隐含层和输出单元的激发 函数;α是自反馈增益因子.结构单元的输出等于 上一时刻的隐层单元的输出与“结构”单元的上一时 刻输出的 α倍之和(为保证收敛要求0<α<1)这 样可以逼近高阶系统. 图2 Elman 神经网络结构 Fig.2 Structure of Elman ANN 基于 BP 算法的 Elman 网络可参考文献 [9— 10]它存在很大局限性.首先因为神经网络的结构 选择也就是隐含层维数的选择对于复杂系统辨识 的精度和速度都有很大的影响.隐含层的节点数过 于庞大对于计算速度、网络实现都很困难隐含层数 目过小则网络收敛的速度就慢.采用 BP 算法的 E-l man 网络的结构不动态地进行学习是先确定网络 结构再学习权值这样有可能违反 Kosmogorov 定 理没有良好的动态逼近能力.其次BP 算法本身 容易陷入局部最小值并且学习速率慢.另外自增 益因子一般人为的选择学习效率低.所以本文采 用一种改进的混合遗传算法(HGA)对 Elman 动态 递归神经网络的权值和结构以及自反馈增益同时进 行动态学习形成一种基于新型混合遗传算法的变 结构遗传神经网络克服了 Elman 网络的上述 缺陷. 2∙2 采用混合遗传算法的变结构 Elman 网络算法 (1) 编码问题.因为实数编码不存在编码和解 码的过程不会在编码和解码的过程中产生误差等 二进制编码所带来的问题所以本文采用实数编码. 另外由于要在网络权值和结构同时进化所以对于 个体的基因要排序顺序为自反馈增益因子、网络结 构和网络连接权值. (2) 变结构.为了实现网络结构的进化需要 增加网络结构的发育和退化的操作.在进化中按照 发育概率 pa 来决定是否增加隐层神经元同时增加 与之相关的连接权值初始的连接权值可以在初始 范围内随机选择;按退化概率 pb 进行网络结构的 某个神经元的删除工作同时删除与之相关的连接 权值. (3) 适应度函数.适应度函数所选择的误差型 目标函数为: f k= 1 Ek = p ∑ k i=k-p+1 (yd( i)- y( i)) 2 (5) 其中f k 为 k 时刻的适应度值p 为辨识宽度yd 和 y 分别为期望输出和网络输出. (4) 自适应选择操作.适应度是指导搜索的关 键.为了避免“早熟”现象和保证种群中个体的多样 性需要对适应度函数进行在线调整.本文通过分 析模拟退火算法[11—14]和遗传算法的优缺点将模拟 退火算法的思想引入遗传算法.应用模拟退火算法 对适应度值按下式进行在线调整然后再采用轮盘 赌的方式进行选择: f i= e f i/T ∑ M i=1 e f i/T (6) 其中M 为种群大小;f i 为第 i 个个体的适应度;T 为系数T = T0(0∙99g —1 )T0 为初始值g 为遗传 代数. 因为轮盘赌的思想是适应度越大被选中的概率 越大所以由式(6)可以看出:在进化后期系数 T 不断下降使适应度相近的个体适应度放大从而使 后期具有优势的个体的优势更明显被选中的概率 也就越高从而使结果更具有全局性. (5) 自适应交叉和变异.交叉概率 pc 和变异 概率 pm 直接影响算法的收敛速度.本文采用了一 种自适应算法对交叉概率和变异概率进行优化实 现了交叉概率和变异概率的非线性自适应调整具 体公式如下所示: pc= pc2( f′— f a) f m— f a f′≥ f a pc1 f< f a (7) pm= pm2( f m— f ) f m— f a f≥ f a pm1 f< f a (8) 式中f m 为种群中最大适应度值f a 为当代平均适 应度值f′是要交叉的两个个体中较大的适应度值 f 为要变异个体的适应度值pc1、pc2、pm1和 pm2取 值均小于1. 由式(7)、(8)可以看出:对于适应度值高于平均 适应度值的个体pc 和 pm 取值较小使该个体可以 ·204· 北 京 科 技 大 学 学 报 第30卷
第2期 郭飞等:数据挖掘在安钢电极预测建模中的应用 .205. 受到保护进入下一代;对于适应度值低于平均值的 pa、Pb都取的较小为O.1.而基于BP算法的Eman 个体,p。和Pm取值较大使其被淘汰,通过p。和 网络,经过多次实验,采用中间层结构为9个节点时 pm的自适应调整可以提供相对较好的P。和pm,既 性能最好.以其中A相电极的电流仿真曲线为例. 保持了种群的多样性,又保证算法的收敛 图4为A相电流的训练拟合曲线,为了方便观 (6)最优保存,由于轮盘赌的选择操作不能保 察选择其中50组数据,从图中可以看出,对于训练 证遗传算法的全局收敛,所以要在下一代中保留父 数据,变结构遗传神经网络比基于BP算法的改进 代的最优解.用历代最优个体替换当前种群中最差 Elman网络有更好的逼近能力,精度更高,图5是 的个体,使到目前为止得到的最佳个体不会被选择、 误差变化曲线图,从图中可以看出:对于变结构遗 交叉、变异等遗传操作破坏。其中历代最优解为:如 传神经网络,在进化85代左右误差基本已经达到了 果当前群体中的最佳个体的适应度比历代最优个体 目标要求收敛;而基于BP算法的改进的Eman网 的适应度大,则复制当前的最佳个体替换历代最优 络在训练100次左右就陷入了局部最小值,网络误 个体;反之不替换 差基本保持0.18不变,在310代后才收敛:从收敛 3电极预测模型实例分析 速度上看变结构遗传神经网络也要快于基于BP算 法改进的Elman网络.图6是在训练样本外从检验 基于变结构遗传神经网络的数据挖掘预测模型 数据中抽取样本输入神经网络模型而得到的曲线, 如图3.输入信号为u(k),分别送给对象和Elman 从图中可以看出,即使是非训练样本的输出也达到 网络,对象的输出为y(k十1),网络的输出为y(k 了令人满意的效果,比基于BP算法的Elman网络 十1),定义误差函数为E=2(ya一y)(a一y)采 有更好的泛化能力和精度 35 用混合遗传算法修正权值、神经网络结构、Elman网 络的自反馈增益因子 30 () 电极对象 (k+1) 25 用 k+1) Eman网格 实际输出 .-变结构遗传Elman网络 HGA ·一BP算法Elman网格 0 5 101520253035404550 图3基于变结构遗传Elman网络的辨识模型 样本量 Fig.3 Identification model based on variable structure genetic E- 图4A相电流曲线(训练数据) lamn ANN Fig.4 Curves of A-phase current(training data) 交流电弧炉的电极控制系统是一个多输入多输 出系统,现在大部分采用的是单相电极各自调节的 1.6 控制方式时].但是这样没有考虑多项耦合的情况, 14 ·--BP算法Eman网络 容易造成三相电极不平衡.本文采用三相电极综合 一变结构遗传神经网络 考虑的建模方式,充分考虑了三相电极的耦合作用. 根据图3建立基于变结构遗传Elamn神经网络的 0.6 电弧炉预测模型,神经网络系统输入为三相电极的 0.4 k一2时刻的电压值U1(k一2),电流值1(k一2):三 0.2 相电极的k一1时刻的电压值U1(k一1),电流值 0 50 100150200250300350 I(k一1);三相电极的k时刻的电压值U1(k),电流 训练次数 值I(k):三相电极k时刻的液压阀门开度U2(k)· 图5误差比较曲线 输出为三相电极的k十1时刻的电压值U1(k十1) Fig-5 Curves of error 和电流值1(k+1),神经网络的样本数据是20炉 钢2000组输入输出数据.其中一半作为训练数据, 4电极控制器参数整定 一半作为检验数据.初始种群为100;最大遗传代数 为500;p1=0.8,p2=0.6,pm1=0.1,pm2=0.02, 在用检验数据对基于数据挖掘技术的电极预测
受到保护进入下一代;对于适应度值低于平均值的 个体pc 和 pm 取值较大使其被淘汰.通过 pc 和 pm 的自适应调整可以提供相对较好的 pc 和 pm既 保持了种群的多样性又保证算法的收敛. (6) 最优保存.由于轮盘赌的选择操作不能保 证遗传算法的全局收敛所以要在下一代中保留父 代的最优解.用历代最优个体替换当前种群中最差 的个体使到目前为止得到的最佳个体不会被选择、 交叉、变异等遗传操作破坏.其中历代最优解为:如 果当前群体中的最佳个体的适应度比历代最优个体 的适应度大则复制当前的最佳个体替换历代最优 个体;反之不替换. 3 电极预测模型实例分析 基于变结构遗传神经网络的数据挖掘预测模型 如图3.输入信号为 u( k)分别送给对象和 Elman 网络对象的输出为 yd ( k+1)网络的输出为 y( k +1)定义误差函数为 E= 1 2 (yd—y) T (yd—y).采 用混合遗传算法修正权值、神经网络结构、Elman 网 络的自反馈增益因子. 图3 基于变结构遗传 Elman 网络的辨识模型 Fig.3 Identification model based on variable structure genetic Elamn ANN 交流电弧炉的电极控制系统是一个多输入多输 出系统现在大部分采用的是单相电极各自调节的 控制方式[15].但是这样没有考虑多项耦合的情况 容易造成三相电极不平衡.本文采用三相电极综合 考虑的建模方式充分考虑了三相电极的耦合作用. 根据图3建立基于变结构遗传 Elamn 神经网络的 电弧炉预测模型.神经网络系统输入为三相电极的 k—2时刻的电压值 U1( k—2)电流值 I( k—2);三 相电极的 k—1时刻的电压值 U1( k—1)电流值 I( k—1);三相电极的 k 时刻的电压值 U1( k)电流 值 I( k);三相电极 k 时刻的液压阀门开度 U2( k). 输出为三相电极的 k+1时刻的电压值 U1( k+1) 和电流值 I( k+1).神经网络的样本数据是20炉 钢2000组输入输出数据.其中一半作为训练数据 一半作为检验数据.初始种群为100;最大遗传代数 为500;pc1=0∙8pc2=0∙6pm1=0∙1pm2=0∙02 pa、pb 都取的较小为0∙1.而基于 BP 算法的 Elman 网络经过多次实验采用中间层结构为9个节点时 性能最好.以其中 A 相电极的电流仿真曲线为例. 图4为 A 相电流的训练拟合曲线为了方便观 察选择其中50组数据.从图中可以看出对于训练 数据变结构遗传神经网络比基于 BP 算法的改进 Elman 网络有更好的逼近能力精度更高.图5是 误差变化曲线图.从图中可以看出:对于变结构遗 传神经网络在进化85代左右误差基本已经达到了 目标要求收敛;而基于 BP 算法的改进的 Elman 网 络在训练100次左右就陷入了局部最小值网络误 差基本保持0∙18不变在310代后才收敛;从收敛 速度上看变结构遗传神经网络也要快于基于 BP 算 法改进的 Elman 网络.图6是在训练样本外从检验 数据中抽取样本输入神经网络模型而得到的曲线. 从图中可以看出即使是非训练样本的输出也达到 了令人满意的效果比基于 BP 算法的 Elman 网络 有更好的泛化能力和精度. 图4 A 相电流曲线(训练数据) Fig.4 Curves of A-phase current(training data) 图5 误差比较曲线 Fig.5 Curves of error 4 电极控制器参数整定 在用检验数据对基于数据挖掘技术的电极预测 第2期 郭 飞等: 数据挖掘在安钢电极预测建模中的应用 ·205·
,206 北京科技大学学报 第30卷 35 5结论 交流电弧炉电极控制系统是复杂的多变量、时 变、非线性、强耦合系统,这些特性增加了建立其模 型的难度,本文采用数据挖掘的方法对电极系统进 20 行了预测建模.其中挖掘方法采用Elman神经网络 实际输出 15 -变结构遗传Elman网络 的方法,并针对网络的基本问题如容易陷入最小值、 一BP算法Elman网格 网络结构不优化等进行了改进,提出了基于新型混 0 101520253035404550 合遗传算法的变结构遗传Elman网络算法,并应用 样本量 于实际的交流电弧炉电极系统的预测建模中,此算 图6A相电流曲线(检验数据) 法以较高的精度拟合了实际的输入输出动态特性, Fig.6 Curves of A phase current (checking data) 并用实际的未训练的数据进行了验证,通过和基于 BP算法的Elman网络比较,证明了用本文提出的 模型进行知识评价后,把它应用于安钢F$F电极控 变结构遗传Elman网络数据挖掘方法建立的模型 制系统的参数整定来进行知识应用,安钢FSF电极 控制系统的VAMELT十十电极控制装置是以PC 有更好的泛化能力,更符合实际工程的需要.把建 好的预测模型应用到安钢电极控制系统的PID参 为基础构成的独立控制系统.控制算法是经典的 数整定中,取得了良好的效果. PD控制,三根电极各加一套控制系统,各自调节, 自成闭环,控制系统在方案设计合理、仪表校对和 参考文献 安装正确的前提下,控制品质就取决于控制器参数 [1]Zhang JJ.Wang S H.Terminal adaptive predication and expert 的选择,安钢F$F电极控制系统原控制器参数的整 directing operation for the steelmaking process of electric arc fur 定采用的是经验试凑法,这就给系统带来了很多不 nace.Acta Auom Sin.1993,19(4):463 稳定的因素,控制效果不理想,本文把根据实际现 (张俊杰,王顺晃,电弧炉炼钢过程终点自适应预报与专家指 导系统.自动化学报,1993,19(4):46) 场数据建立的模型应用于PID控制器参数的离线 [2]Wu J.Li S Q.Wang H R.et al.Operation reactance of AC- 整定中,采样周期和系统实际采样周期相同,都为 EAF.J Unin Sci Technol Beijing,1999,21(5):440 20ms,用工程上常用的动态特性参数法来整定PID (武骏,李士琦,王海润,等.炼钢交流电弧炉工作电抗模型.北 控制器参数·采用新控制器参数后,采集新数据与 京科技大学学报,1999,21(5):440) 原来没有进行整定前的数据进行比较,如图7.图7 [3]Parsue K.OLAP&.Datamining:Bridging the gap.Database (a)是整定前电流值,图7(b)为利用预测模型参数 Program Des,1997.10(2):20 [4]Elman JL.Finding structure in time.Cognitive Sci.1990.14 整定后的A相电流值,由两幅图比较可以清楚的发 (2):179 现,参数整定后性能有了明显的改善 [5]Cong S,Gao X P.Recurrent neural networks and their applica- 40 tion in system identification.Syst Eng Electron,2003.25(2): 194 [6]Lin F J.Wai R J.Chou W D.et al.Adaptive backstepping control 10 using recurrent neural network for linear induction motor drive. IEEE Trans Ind Electron.2002.49(1):134 200 400 600 800 1000 [7]Weber S.A general concept of fuzzy connectives,negations and 采样点 40 implications based on tnorms and t-conorms.Fuzy Sets Syst. 30 1983(11):115 [8]Zhang L P,Chai Y T.Actuality and developmental trend for ge netic algorithms.Inf Control.2001.30(6):531 10 (b) (张丽萍,柴跃廷.遗传算法的现状及发展动向·信息与控制, 200 400 600 800 1000 2001,30(6):531) 采样点 [9]Pham D T,Liu X.Training of Elman net works and dynamic sys- tem modeling.Int JSyst Sci.1996,27(2):221 图7A相电流参数整定前(a)后(b)性能比较 [10]Yan P F,Zhang C S.Artificial Neural Networks and Evolu- Fig.7 Curves of A phase current before (a)and after (b)parame- tionary Computing.Beijing:Tsinghua University Press.2000 ter tuning 11
图6 A 相电流曲线(检验数据) Fig.6 Curves of A phase current (checking data) 图7 A 相电流参数整定前(a)后(b)性能比较 Fig.7 Curves of A phase current before (a) and after (b) parameter tuning 模型进行知识评价后把它应用于安钢 FSF 电极控 制系统的参数整定来进行知识应用.安钢FSF 电极 控制系统的 VAMELT ++电极控制装置是以 PC 为基础构成的独立控制系统.控制算法是经典的 PID 控制三根电极各加一套控制系统各自调节 自成闭环.控制系统在方案设计合理、仪表校对和 安装正确的前提下控制品质就取决于控制器参数 的选择.安钢FSF 电极控制系统原控制器参数的整 定采用的是经验试凑法这就给系统带来了很多不 稳定的因素控制效果不理想.本文把根据实际现 场数据建立的模型应用于 PID 控制器参数的离线 整定中采样周期和系统实际采样周期相同都为 20ms用工程上常用的动态特性参数法来整定 PID 控制器参数.采用新控制器参数后采集新数据与 原来没有进行整定前的数据进行比较如图7.图7 (a)是整定前电流值图7(b)为利用预测模型参数 整定后的 A 相电流值.由两幅图比较可以清楚的发 现参数整定后性能有了明显的改善. 5 结论 交流电弧炉电极控制系统是复杂的多变量、时 变、非线性、强耦合系统这些特性增加了建立其模 型的难度.本文采用数据挖掘的方法对电极系统进 行了预测建模.其中挖掘方法采用 Elman 神经网络 的方法并针对网络的基本问题如容易陷入最小值、 网络结构不优化等进行了改进提出了基于新型混 合遗传算法的变结构遗传 Elman 网络算法并应用 于实际的交流电弧炉电极系统的预测建模中.此算 法以较高的精度拟合了实际的输入输出动态特性 并用实际的未训练的数据进行了验证.通过和基于 BP 算法的 Elman 网络比较证明了用本文提出的 变结构遗传 Elman 网络数据挖掘方法建立的模型 有更好的泛化能力更符合实际工程的需要.把建 好的预测模型应用到安钢电极控制系统的 PID 参 数整定中取得了良好的效果. 参 考 文 献 [1] Zhang J JWang S H.Terminal adaptive predication and expert directing operation for the steelmaking process of electric arc furnace.Acta A utom Sin199319(4):463 (张俊杰王顺晃.电弧炉炼钢过程终点自适应预报与专家指 导系统.自动化学报199319(4) :46) [2] Wu JLi S QWang H Ret al.Operation reactance of ACEAF.J Univ Sci Technol Beijing199921(5):440 (武骏李士琦王海润等.炼钢交流电弧炉工作电抗模型.北 京科技大学学报199921(5):440) [3] Parsue K.OLAP & Datamining:Bridging the gap. Database Program Des199710(2):20 [4] Elman J L.Finding structure in time.Cognitive Sci199014 (2):179 [5] Cong SGao X P.Recurrent neural networks and their application in system identification.Syst Eng Electron200325(2): 194 [6] Lin F JWai R JChou W Det al.Adaptive backstepping control using recurrent neural network for linear induction motor drive. IEEE T rans Ind Electron200249(1):134 [7] Weber S.A general concept of fuzzy connectivesnegations and implications based on t-norms and t-conorms.Fuzz y Sets Syst 1983(11):115 [8] Zhang L PChai Y T.Actuality and developmental trend for genetic algorithms.Inf Control200130(6):531 (张丽萍柴跃廷.遗传算法的现状及发展动向.信息与控制 200130(6):531) [9] Pham D TLiu X.Training of Elman networks and dynamic system modeling.Int J Syst Sci199627(2):221 [10] Yan P FZhang C S.A rtificial Neural Networks and Evolutionary Computing.Beijing:Tsinghua University Press2000: 11 ·206· 北 京 科 技 大 学 学 报 第30卷
第2期 郭飞等:数据挖掘在安钢电极预测建模中的应用 .207. (阎平凡,张长水.人工神经网络与模拟进化计算。北京:清 modelling.Proe CSEE.2005,25(11):90 华大学出版社,2000:11) (张栾英,李瑞欣,秦志明,等.采用模拟退火算法的Emam网 [11]Sun L,Zhang Q D,Chen X L.et al.Thermal contour model of 络及在热工过程建模中的应用.中国电机工程学报,2005,25 work roll in plate mills by simulated annealing algorithm.IUniv (11):90) Sci Technol Beijing.2002.24(3):313 [14]Vyas NS.Satishkumar D.Artificial neural network design for (孙林,张清东,陈先霖,等.基于模拟退火算法的中厚板精轧 fault identification in rotor-bearing system.Mech Mach Theory, 机工作辊热膨胀模型.北京科技大学学报,2002,24(3):313) 2001,36(1):157 [12]Xu Y.A clustering analysis approach using adaptive genetic algo [15]Liu X H.Yin J.Zhang QZ.Adaptive control of a class of non rithms.Syst Eng Electron.1997,30(9):39 linear system using piecewise linearization based on Lyapunovs (徐勇·一种基于自适应遗传算法的聚类分析方法,系统工 law-Control Theory Appl.2005.22(5):829 程与电子技术,1997,30(9):39) (刘小河,殷杰,张奇志·基于Lyapunov方法的一类非线性系 [13]Zhang L Y.Li R X.Qin Z M.et al.Elman network using sim- 统分段线性化自适应控制,控制理论与应用,2005,22(5): ulated annealing algorithm and its application in thermal process 829) (上接第143页) [9]Chiriac H.Lupu N.Magnetic properties of (Nd,Ce.Pr)Fe- [2]Inoue A.Stabilization of metallic supercooled liquid and bulk (Si.Al)bulk amorphous materials.J MagnMagn Mater, amorphous alloys.Acta Mater.2000.48:279 1999,196/197,235 [3]Nich T G.Mukan T.Liu C T.Superplastic behavior of a Zr- [10]Fan G J.Loser W.Roth S.Glassforming ability of RE-Al- 10Al-5Ti-17.9Cu-14.6Ni metallic glass in the supercooled liq TM alloys (RE=Sm:Y:TM=Fe,Co.Cu).Acta Mater, uid region.Scripta Mater,1999.40 (9):1021 2000,48,3823 [4]Javazaki H.Ukaih:Izemiya K.Corrosion behavior of amorphous [11]Lu Z P.Hu X.Li Y.Glass forming ability of La-Al-Ni-Cu Ni Cr-Nb-P-B bulk alloys in 6M HCI solution.Mater Sci and Pd-Si-Cu bulk metallic glasses.Mater Sci Eng.2001, Emg,2001,A318:77 A304/306:679 [5]Gebert A.Wolff U.John A.Stability of the bulk glass forming [12]Liu Z F,Yang B.Zhang Y,et al.Preparation of a La62Al15.7 Mg6sY 10Cu2s alloy in aqueous electrolytes.Mater Sci Eng 2001. (Cu,Ni)22.3 bulk amorphous alloy by spray forming.J Univ Sci A299:125 Technol Beijing.2007.29(4):394 [6]Myung W N,Bach Y,Hwange S.Viscous flow behavior and (刘宗锋,杨滨,张勇,等.喷射成形制备La62A5.7(Cu,Ni)2.3 thermal properties of bulk Amorphous Pd4o Nilo Cu3o P20 alloys. 块体非晶合金.北京科技大学学报,2007,29(4):394) Mater Sci Eng.2001.A304/306:687 [13]Inoue A.High strength bulk amorphous alloys with low critical [7]Zhan G T.Inoue A.Ti-based amorphous alloys with a large su- cooling rates.Mater Trans JIM,1995,36:866 percooled liquid region.Mater Sci Eng.2001,A304/306:771 [14]Ohnuma M,Pryds N H.Linderoth S.et al.Bulk amorphous [8]Gerold U,Wiedenmann A.Keiderlin G U.Decomposition and (Mgo.98Alo.02)Cus Y10 alloy.Scripta Mater.1999.41(8): crystallization of the bulk amorphous ZrTisCu47 Nig alloy studied 889 by SANS.PhwB,1997,234/236.995
(阎平凡张长水.人工神经网络与模拟进化计算.北京:清 华大学出版社2000:11) [11] Sun LZhang Q DChen X Let al.Thermal contour model of work roll in plate mills by simulated annealing algorithm.J Univ Sci Technol Beijing200224(3):313 (孙林张清东陈先霖等.基于模拟退火算法的中厚板精轧 机工作辊热膨胀模型.北京科技大学学报200224(3):313) [12] Xu Y.A clustering analysis approach using adaptive genetic algorithms.Syst Eng Electron199730(9):39 (徐勇.一种基于自适应遗传算法的聚类分析方法.系统工 程与电子技术199730(9):39) [13] Zhang L YLi R XQin Z Met al.Elman network using simulated annealing algorithm and its application in thermal process modelling.Proc CSEE200525(11):90 (张栾英李瑞欣秦志明等.采用模拟退火算法的 Elman 网 络及在热工过程建模中的应用.中国电机工程学报200525 (11):90) [14] Vyas N SSatishkumar D.Artificial neural network design for fault identification in rotor-bearing system.Mech Mach Theory 200136(1):157 [15] Liu X HYin JZhang Q Z.Adaptive control of a class of nonlinear system using piecewise linearization based on Lyapunov’s law.Control Theory Appl200522(5):829 (刘小河殷杰张奇志.基于 Lyapunov 方法的一类非线性系 统分段线性化自适应控制.控制理论与应用200522(5): 829) (上接第143页) [2] Inoue A.Stabilization of metallic supercooled liquid and bulk amorphous alloys.Acta Mater200048:279 [3] Nich T GMukan TLiu C T.Superplastic behavior of a Zr— 10Al—5Ti—17∙9Cu—14∙6Ni metallic glass in the supercooled liquid region.Scripta Mater199940(9):1021 [4] Javazaki HUkaihIzemiya K.Corrosion behavior of amorphous Ni—Cr—Nb—P—B bulk alloys in 6M HCl solution. Mater Sci Eng2001A318:77 [5] Gebert AWolff UJohn A.Stability of the bulk glass-forming Mg65Y10Cu25alloy in aqueous electrolytes.Mater Sci Eng2001 A299:125 [6] Myung W NBaeh YHwange S.Viscous flow behavior and thermal properties of bulk Amorphous Pd40Ni10Cu30P20 alloys. Mater Sci Eng2001A304/306:687 [7] Zhan G TInoue A.T-i based amorphous alloys with a large supercooled liquid region.Mater Sci Eng2001A304/306:771 [8] Gerold UWiedenmann AKeiderlin G U.Decomposition and crystallization of the bulk amorphous Zr11Ti34Cu47Ni8alloy studied by SANS.Phys B1997234/236:995 [9] Chiriac HLupu N.Magnetic properties of (NdCePr)—Fe— (SiAl ) bulk amorphous materials. J Magn Magn Mater 1999196/197:235 [10] Fan G JLoser WRoth S.Glass-forming ability of RE—Al— T M alloys (RE=SmY;T M =FeCoCu).Acta Mater 200048:3823 [11] Lu Z PHu XLi Y.Glass forming ability of La—Al—Ni—Cu and Pd—Si—Cu bulk metallic glasses. Mater Sci Eng2001 A304/306:679 [12] Liu Z FYang BZhang Yet al.Preparation of a La62Al15∙7 (CuNi)22∙3bulk amorphous alloy by spray forming.J Univ Sci Technol Beijing200729(4):394 (刘宗锋杨滨张勇等.喷射成形制备 La62Al15∙7(CuNi)22∙3 块体非晶合金.北京科技大学学报200729(4):394) [13] Inoue A.High strength bulk amorphous alloys with low critical cooling rates.Mater T rans JIM199536:866 [14] Ohnuma MPryds N HLinderoth Set al.Bulk amorphous (Mg0∙98Al0∙02)60Cu30Y10 alloy.Scripta Mater199941(8): 889 第2期 郭 飞等: 数据挖掘在安钢电极预测建模中的应用 ·207·