工程科学学报,第40卷,第7期:815-821,2018年7月 Chinese Journal of Engineering,Vol.40,No.7:815-821,July 2018 DOI:10.13374/j.issn2095-9389.2018.07.007;http://journals.ustb.edu.cn 基于极限学习机(ELM)的连铸坯质量预测 陈恒志”,杨建平),卢新春12),余相灼),刘青) 1)北京科技大学钢铁治金新技术国家重点实验室,北京1000832)方大特钢科技股份有限公司,南昌330000 区通信作者,E-mail:qliu@usth.edu.cm 摘要针对传统基于BP神经网络建立的连铸坯质量预测模型训练速度慢、适应能力弱、预测精度低等问题,本文提出一种 基于极限学习机的连铸坯质量预测方法,对方大特钢60Si2M连铸坯中心疏松和中心偏析缺陷进行预测,并与BP和遗传算 法优化BP神经网络预测模型的预测结果进行分析对比.结果表明:BP及GA-BP神经网络预测模型对连铸坯中心疏松和中 心偏析缺陷的预测准确率分别为50%、57.5%、70%和72.5%;而基于极限学习机的连铸坯预测模型预测准确率更高,对连铸 坯中心疏松和中心偏析缺陷的预测准确率分别为85%和82.5%,且该模型具有极快的运算时间,仅需0.1s.该模型可对连铸 坯质量进行迅速准确地分析,为连铸坯质量预测的在线应用提供了一种新的方法 关键词连铸坯;BP神经网络:遗传算法:极限学习机:质量预测 分类号TF777.2 Quality prediction of the continuous casting bloom based on the extreme learning machine CHEN Heng-zhi),YANG Jian-ping,LU Xin-chun'2),YU Xiang-zhuo,LIU Qing 1)State Key Laboratory of Advanced Metallurgy,University of Science and Technology Beijing,Beijing 100083,China 2)Fangda Special Steel Technology Co.,Ltd,Nanchang 330000,China Corresponding author,E-mail:qliu@ustb.edu.cn ABSTRACT To solve the problems of slow training,weak generalization ability,and low prediction accuracy in the traditional pre- diction model established in terms of the BP neural network,a method of the quality prediction of the continuous casting bloom based on the extreme learning machine (ELM)was proposed to predict the degree of the center porosity and the central segregation of 60Si2Mn continuous casting bloom produced by Fangda Special Steel.Comparing the prediction models of the BP neural network and the GA-BP neural network,the results show that the prediction accuracy of the model based on ELM is improved to 85%and 82.5% in the center loose and central segregation,respectively,and the operation time is reduced to 0.Is.The model can rapidly and accu- rately analyze the quality of a continuous casting billet,thus providing a new method for the online application of continuous casting bil- let quality prediction. KEY WORDS continuous casting bloom;BP neural network;genetic algorithm;extreme learning machine;quality prediction 连铸坯生产过程中,钢水洁净度较低或工艺操 际生产的连铸坯质量缺陷检测模型,由于检验时间 作不稳定,往往造成连铸坯质量缺陷,如中心偏析、 的滞后性,难以对铸坯质量进行实时精准预测,不利 横纵裂纹等,致使产品质量下降,废品率增加,难以 于钢铁企业高品质钢的生产.如何及时准确地预报 及时满足客户的订单需求.目前,大多数应用于实 和检测铸坯质量是钢铁企业可持续发展过程中亟待 收稿日期:2017-06-12 基金项目:国家自然科学基金资助项目(50874014)
工程科学学报,第 40 卷,第 7 期:815鄄鄄821,2018 年 7 月 Chinese Journal of Engineering, Vol. 40, No. 7: 815鄄鄄821, July 2018 DOI: 10. 13374 / j. issn2095鄄鄄9389. 2018. 07. 007; http: / / journals. ustb. edu. cn 基于极限学习机(ELM)的连铸坯质量预测 陈恒志1) , 杨建平1) , 卢新春1,2) , 余相灼1) , 刘 青1) 苣 1)北京科技大学钢铁冶金新技术国家重点实验室, 北京 100083 2)方大特钢科技股份有限公司, 南昌 330000 苣通信作者,E鄄mail: qliu@ ustb. edu. cn 摘 要 针对传统基于 BP 神经网络建立的连铸坯质量预测模型训练速度慢、适应能力弱、预测精度低等问题,本文提出一种 基于极限学习机的连铸坯质量预测方法,对方大特钢 60Si2Mn 连铸坯中心疏松和中心偏析缺陷进行预测,并与 BP 和遗传算 法优化 BP 神经网络预测模型的预测结果进行分析对比. 结果表明:BP 及 GA鄄鄄BP 神经网络预测模型对连铸坯中心疏松和中 心偏析缺陷的预测准确率分别为 50% 、57郾 5% 、70% 和 72郾 5% ;而基于极限学习机的连铸坯预测模型预测准确率更高,对连铸 坯中心疏松和中心偏析缺陷的预测准确率分别为 85% 和 82郾 5% ,且该模型具有极快的运算时间,仅需 0郾 1 s. 该模型可对连铸 坯质量进行迅速准确地分析,为连铸坯质量预测的在线应用提供了一种新的方法. 关键词 连铸坯; BP 神经网络; 遗传算法; 极限学习机; 质量预测 分类号 TF777郾 2 收稿日期: 2017鄄鄄06鄄鄄12 基金项目: 国家自然科学基金资助项目(50874014) Quality prediction of the continuous casting bloom based on the extreme learning machine CHEN Heng鄄zhi 1) , YANG Jian鄄ping 1) , LU Xin鄄chun 1,2) , YU Xiang鄄zhuo 1) , LIU Qing 1) 苣 1)State Key Laboratory of Advanced Metallurgy, University of Science and Technology Beijing, Beijing 100083, China 2)Fangda Special Steel Technology Co. , Ltd, Nanchang 330000, China 苣Corresponding author,E鄄mail: qliu@ ustb. edu. cn ABSTRACT To solve the problems of slow training, weak generalization ability, and low prediction accuracy in the traditional pre鄄 diction model established in terms of the BP neural network, a method of the quality prediction of the continuous casting bloom based on the extreme learning machine ( ELM) was proposed to predict the degree of the center porosity and the central segregation of 60Si2Mn continuous casting bloom produced by Fangda Special Steel. Comparing the prediction models of the BP neural network and the GA鄄鄄BP neural network, the results show that the prediction accuracy of the model based on ELM is improved to 85% and 82郾 5% in the center loose and central segregation, respectively, and the operation time is reduced to 0郾 1 s. The model can rapidly and accu鄄 rately analyze the quality of a continuous casting billet, thus providing a new method for the online application of continuous casting bil鄄 let quality prediction. KEY WORDS continuous casting bloom; BP neural network; genetic algorithm; extreme learning machine; quality prediction 连铸坯生产过程中,钢水洁净度较低或工艺操 作不稳定,往往造成连铸坯质量缺陷,如中心偏析、 横纵裂纹等,致使产品质量下降,废品率增加,难以 及时满足客户的订单需求. 目前,大多数应用于实 际生产的连铸坯质量缺陷检测模型,由于检验时间 的滞后性,难以对铸坯质量进行实时精准预测,不利 于钢铁企业高品质钢的生产. 如何及时准确地预报 和检测铸坯质量是钢铁企业可持续发展过程中亟待
.816. 工程科学学报,第40卷,第7期 解决的重要问题.连铸坯生产过程中工艺参数众 如图1所示. 多,且连铸坯缺陷的各影响因素之间具有很强的非 输人层 隐含层 输出层 线性关系.基于上述特征,神经网络较强的非线性 逼近能力,可以很好地解决这一问题.张邦礼等) 提出了基于BP神经网络的连铸坯质量预测模型, 误差反馈 并利用不同的激活函数改善网络的性能:Bou- houche2]运用神经网络建立了连铸坯缺陷预测模 型,该模型进行离线学习,并利用图形化编程软件在 过程计算机上实现了神经网络的连铸坯质量的预 测:常运合等]运用改进的BP神经网络建立了连 铸坯质量缺陷预测模型,应用于生产后全年中心裂 图1BP神经网络结构 纹不合格板坯减少50.6%;张静4)在遗传算法中运 Fig.I Structure of the BP neural network 用灾变算子优化神经网络并建立连铸坯质量预测模 该神经网络结构含有L个输入层神经元,n个 型,该模型预测结果精度较高,但测试样本数据较 隐含层神经元,m个输出神经元.典型的单隐层前 少,其可靠性有待进一步测试.虽然神经网络具有 馈神经网络结构如图1所示.设隐含层的神经元激 较强的非线性逼近能力,但是模型训练的速度较慢, 活函数为g(x),其模型表达式如下式所示 易陷入局部最优化,且易出现过度训练引起泛化性 能下降等问题,限制了其在工业上的应用.BP神经 Y= Big(x;+b) (1) j=1i=1 网络是目前研究深入、应用最广泛的神经网络算法 式中:Y为网络的输出值,w:为第i个隐含层神经元 之一,针对BP神经网络预测模型存在的不足,本文 与第j个输入层神经元的连接权值,x:为第j个输入 引入极限学习机(extreme learning machine,ELM) 层神经元的输入值,B为输出层与第i个隐含层神 的方法构建连铸坯质量预测模型.模型在训练过程 经元的连接权值,b,为第i个隐含层神经元的偏置. 中不需要调整网络的输入权值以及隐藏层的偏置, 当网络创建时,输入层和隐藏层中的神经元之 只需设置网络的隐藏层节点个数,就能产生唯一的 间的连接被分配随机的权值和阈值,然后网络生成 最优解,且该模型训练速度快、泛化性能较好.本文 输出值.网络对输出与实际输出值进行比较,并通 通过建立基于极限学习机的连铸坯质量预测模型对 过误差反向传播改变网络的连接权值,从而达到降 连铸方坯(断面为:180mm×180mm)中心疏松和中 低网络的最小均方误差E,表达式如下式所示.网 心偏析缺陷进行预测,并与基于BP和GA(genetic 络的训练一直重复这个过程,直到误差最小化. algorithm)-BP遗传算法优化BP神经网络方法建立 的连铸坯质量预测模型的预测结果进行比较发现: E= 2点 (0-Y)2 (2) 本文建立的基于极限学习机的连铸坯质量预测模型 式中:E是最小均方误差,L是模型的输入层节点个 具有较高的预测准确率且运行过程极为高效,有助 数,n是模型的输出层节点个数,O是实际值,Y是 于实现钢铁企业连铸坯质量预测的在线应用. 网络的输出值. 1 基于BP神经网络的连铸坯质量预测模型 由Kolmogorov理论可知,三层BP神经网络[6-刀 可无限逼近任一非线性函数,本文运用Matlab建立 人工神经网络可以有效地解决非线性问题,且 三层BP神经网连铸坯质量预测模型以期获得较高 网络结构简单,鲁棒性强,已被成功应用于各个领 的连铸坯质量预测准确率.根据实际调研与前人的 域.鉴于上述特点,本文建立基于BP的连铸坯质量 研究,归纳总结了影响连铸坯质量的20个因素(见 预测模型,以期得到较好的连铸坯质量预测准确率. 表1)作为该模型的输入变量[⑧] 1.1模型建立 由于隐含层节点数对预测结果的准确率有很大 BP神经网络由信号前向传播和误差反向传播 的影响,本文根据Dong等9)金矿磨浮过程能耗预 组成,且两个过程的连续循环构成网络的训练过程. 测研究中的经验公式求得最优隐含层节点数范围为 输入层的节点代表预选输入参数.中间层或隐藏层 [6,16]. 的节点与输入输出神经元以外的数据没有直接联 1.2模型验证 系.输出层的节点代表预期的输出参数.网络模型 本文运用Matlab建立BP神经网络的连铸坯质
工程科学学报,第 40 卷,第 7 期 解决的重要问题. 连铸坯生产过程中工艺参数众 多,且连铸坯缺陷的各影响因素之间具有很强的非 线性关系. 基于上述特征,神经网络较强的非线性 逼近能力,可以很好地解决这一问题. 张邦礼等[1] 提出了基于 BP 神经网络的连铸坯质量预测模型, 并利用 不 同 的 激 活 函 数 改 善 网 络 的 性 能; Bou鄄 houche [2]运用神经网络建立了连铸坯缺陷预测模 型,该模型进行离线学习,并利用图形化编程软件在 过程计算机上实现了神经网络的连铸坯质量的预 测;常运合等[3] 运用改进的 BP 神经网络建立了连 铸坯质量缺陷预测模型,应用于生产后全年中心裂 纹不合格板坯减少 50郾 6% ;张静[4] 在遗传算法中运 用灾变算子优化神经网络并建立连铸坯质量预测模 型,该模型预测结果精度较高,但测试样本数据较 少,其可靠性有待进一步测试. 虽然神经网络具有 较强的非线性逼近能力,但是模型训练的速度较慢, 易陷入局部最优化,且易出现过度训练引起泛化性 能下降等问题,限制了其在工业上的应用. BP 神经 网络是目前研究深入、应用最广泛的神经网络算法 之一,针对 BP 神经网络预测模型存在的不足,本文 引入极限学习机[5] (extreme learning machine,ELM) 的方法构建连铸坯质量预测模型. 模型在训练过程 中不需要调整网络的输入权值以及隐藏层的偏置, 只需设置网络的隐藏层节点个数,就能产生唯一的 最优解,且该模型训练速度快、泛化性能较好. 本文 通过建立基于极限学习机的连铸坯质量预测模型对 连铸方坯(断面为:180 mm 伊 180 mm)中心疏松和中 心偏析缺陷进行预测,并与基于 BP 和 GA( genetic algorithm)鄄鄄BP 遗传算法优化 BP 神经网络方法建立 的连铸坯质量预测模型的预测结果进行比较发现: 本文建立的基于极限学习机的连铸坯质量预测模型 具有较高的预测准确率且运行过程极为高效,有助 于实现钢铁企业连铸坯质量预测的在线应用. 1 基于 BP 神经网络的连铸坯质量预测模型 人工神经网络可以有效地解决非线性问题,且 网络结构简单,鲁棒性强,已被成功应用于各个领 域. 鉴于上述特点,本文建立基于 BP 的连铸坯质量 预测模型,以期得到较好的连铸坯质量预测准确率. 1郾 1 模型建立 BP 神经网络由信号前向传播和误差反向传播 组成,且两个过程的连续循环构成网络的训练过程. 输入层的节点代表预选输入参数. 中间层或隐藏层 的节点与输入输出神经元以外的数据没有直接联 系. 输出层的节点代表预期的输出参数. 网络模型 如图 1 所示. 图 1 BP 神经网络结构 Fig. 1 Structure of the BP neural network 该神经网络结构含有 L 个输入层神经元,n 个 隐含层神经元,m 个输出神经元. 典型的单隐层前 馈神经网络结构如图 1 所示. 设隐含层的神经元激 活函数为 g(x),其模型表达式如下式所示. Y = 移 L j = 1 移 n i = 1 茁ig(棕ji xj + bi) (1) 式中:Y 为网络的输出值,棕ji为第 i 个隐含层神经元 与第 j 个输入层神经元的连接权值,xj 为第 j 个输入 层神经元的输入值,茁i 为输出层与第 i 个隐含层神 经元的连接权值,bi 为第 i 个隐含层神经元的偏置. 当网络创建时,输入层和隐藏层中的神经元之 间的连接被分配随机的权值和阈值,然后网络生成 输出值. 网络对输出与实际输出值进行比较,并通 过误差反向传播改变网络的连接权值,从而达到降 低网络的最小均方误差 E,表达式如下式所示. 网 络的训练一直重复这个过程,直到误差最小化. E = 1 2 移 L j = 1 移 n i = 1 (Oji - Yji) 2 (2) 式中:E 是最小均方误差,L 是模型的输入层节点个 数,n 是模型的输出层节点个数,Oji是实际值,Yji是 网络的输出值. 由 Kolmogorov 理论可知,三层 BP 神经网络[6鄄鄄7] 可无限逼近任一非线性函数,本文运用 Matlab 建立 三层 BP 神经网连铸坯质量预测模型以期获得较高 的连铸坯质量预测准确率. 根据实际调研与前人的 研究,归纳总结了影响连铸坯质量的 20 个因素(见 表 1)作为该模型的输入变量[8] . 由于隐含层节点数对预测结果的准确率有很大 的影响,本文根据 Dong 等[9] 金矿磨浮过程能耗预 测研究中的经验公式求得最优隐含层节点数范围为 [6,16]. 1郾 2 模型验证 本 文运用Matlab建立BP神经网络的连铸坯质 ·816·
陈恒志等:基于极限学习机(ELM)的连铸坯质量预测 .817· 表1连铸坯质量缺陷影响因素 Table 1 Influential factors of the quality of the continuous casting bloom 变量 符号 变量 符号 钢水C质量分数/% X 钢水S质量分数/% 钢水P质量分数/% X2 钢水Mn质量分数/% 古 钢水Si质量分数/% X3 钢水C质量分数/% Xs 钢水Cr质量分数/% 专 钢水全AI质量分数/% Xo 钢水酸溶铝质量分数/% Xs 钢水C质量分数/% Xio 二冷比水量/kg Xn 二冷0段水量/(m3h1) X16 中间包温度/℃ Xn 二冷1段水量/(m3,h1) Xn 拉速/(m'min) Xns 二冷2段水量/(m3.h1) X18 结品器水量/(m3.h1) Xi4 结品器进出水温差/℃ X19 结品器锥度/(°) X15 电磁搅拌电流/A X2o 量预测模型,且模型以方大特钢60Si2Mn的160组 25 -0预测值 实际生产数据为样本,随机选取其中120组数据建 一一实际值 立模型,剩余40组数据验证模型的准确性.在模型 2.0 9 训练前对输入数据进行归一化处理,处理方式为对 1.5 同一影响因素集进行归一化处理,这样既能消除由 于数据量纲不同造成预测精度不高的问题,又能保 1.0 9 持各变量的原始信息,数据归一化范围为[0.1, 0.5 0.9].在神经网络的隐含层节点数寻优过程中发 现,当节点数为9且隐含层神经元激活函数为$型 函数[]时模型的预测精度最佳.BP神经网络参数 10 20 30 0 如表2所示. 样本 图2中心疏松的实际值和预测值的比较 表2BP神经网络参数 Fig.2 Comparison of the center porosity between the actual values Table 2 Fundamental parameters of the BP neural network and the predicted values 参数 值 参数 值 输入层节点数 20 输出层节点数 1 25 -0-预测值 隐含层节点数 9 最大训练步数 1000 一·一实际值 2.09 9 学习速率 0.001 动量因子 0.9 训练函数 trainlm 隐含层数 1 5 图2为基于BP神经网络的连铸坯质量预测模 型对连铸坯中心疏松缺陷等级的预测值和实际值. 0.5 图3为该模型对连铸坯中心偏析缺陷的预测值和实 际值.该模型对连铸坯的中心疏松和中心偏析缺陷 3 测试准确率分别为50%和57.5%.从预测结果可 0 20 30 40 知该连铸坯质量预测模型对连铸坯缺陷进行预测的 样本 实际值和预测值存在较大的差异,模型对连铸坯质 图3中心偏析的实际值和预测值的比较 量预测的准确率有待于提升,下文将尝试运用遗传 Fig.3 Comparison of the central segregation between the actual val- 算法来优化BP神经网络连铸坯质量预测模型以期 ues and the predicted values 提高模型的预测准确率. 一非线性函数,但是网络在训练过程中容易陷入局 基于GA-BP神经网络的连铸坯质量预 部最优值.而遗传算法具有较强的全局寻优能力, 因此,将遗传算法和BP神经网络相结合的连铸坯 测模型 质量预测模型可以使模型在较强的学习能力下搜索 虽然BP神经网络的学习能力很强,可逼近任 全局最优值
陈恒志等: 基于极限学习机(ELM)的连铸坯质量预测 表 1 连铸坯质量缺陷影响因素 Table 1 Influential factors of the quality of the continuous casting bloom 变量 符号 变量 符号 钢水 C 质量分数/ % X1 钢水 S 质量分数/ % X6 钢水 P 质量分数/ % X2 钢水 Mn 质量分数/ % X7 钢水 Si 质量分数/ % X3 钢水 Cu 质量分数/ % X8 钢水 Cr 质量分数/ % X4 钢水全 Al 质量分数/ % X9 钢水酸溶铝质量分数/ % X5 钢水 C 质量分数/ % X10 二冷比水量/ kg X11 二冷 0 段水量/ (m 3·h - 1 ) X16 中间包温度/ 益 X12 二冷 1 段水量/ (m 3·h - 1 ) X17 拉速/ (m·min - 1 ) X13 二冷 2 段水量/ (m 3·h - 1 ) X18 结晶器水量/ (m 3·h - 1 ) X14 结晶器进出水温差/ 益 X19 结晶器锥度/ (毅) X15 电磁搅拌电流/ A X20 量预测模型,且模型以方大特钢 60Si2Mn 的 160 组 实际生产数据为样本,随机选取其中 120 组数据建 立模型,剩余 40 组数据验证模型的准确性. 在模型 训练前对输入数据进行归一化处理,处理方式为对 同一影响因素集进行归一化处理,这样既能消除由 于数据量纲不同造成预测精度不高的问题,又能保 持各变量的原始信息,数据归一化范围为 [0郾 1, 0郾 9]. 在神经网络的隐含层节点数寻优过程中发 现,当节点数为 9 且隐含层神经元激活函数为 S 型 函数[10]时模型的预测精度最佳. BP 神经网络参数 如表 2 所示. 表 2 BP 神经网络参数 Table 2 Fundamental parameters of the BP neural network 参数 值 参数 值 输入层节点数 20 输出层节点数 1 隐含层节点数 9 最大训练步数 1000 学习速率 0郾 001 动量因子 0郾 9 训练函数 trainlm 隐含层数 1 图 2 为基于 BP 神经网络的连铸坯质量预测模 型对连铸坯中心疏松缺陷等级的预测值和实际值. 图 3 为该模型对连铸坯中心偏析缺陷的预测值和实 际值. 该模型对连铸坯的中心疏松和中心偏析缺陷 测试准确率分别为 50% 和 57郾 5% . 从预测结果可 知该连铸坯质量预测模型对连铸坯缺陷进行预测的 实际值和预测值存在较大的差异,模型对连铸坯质 量预测的准确率有待于提升,下文将尝试运用遗传 算法来优化 BP 神经网络连铸坯质量预测模型以期 提高模型的预测准确率. 2 基于 GA鄄鄄 BP 神经网络的连铸坯质量预 测模型 虽然 BP 神经网络的学习能力很强,可逼近任 图 2 中心疏松的实际值和预测值的比较 Fig. 2 Comparison of the center porosity between the actual values and the predicted values 图 3 中心偏析的实际值和预测值的比较 Fig. 3 Comparison of the central segregation between the actual val鄄 ues and the predicted values 一非线性函数,但是网络在训练过程中容易陷入局 部最优值. 而遗传算法具有较强的全局寻优能力, 因此,将遗传算法和 BP 神经网络相结合的连铸坯 质量预测模型可以使模型在较强的学习能力下搜索 全局最优值. ·817·
818. 工程科学学报,第40卷,第7期 2.1模型建立 25 遗传算法由美国的Holland教授提出,该方法 -0预测值 一◆一实际值 是以自然中的遗传和生物进化论为指导思想而提出 2.0 的一种全局最优化搜索方法,他把自然界中“优胜 15 劣汰”的生物进化引入到优化神经网络的参数中, 按照所选择的适应度函数并通过模拟生物遗传中的 1.0 选择、交叉和变异,然后对个体进行“适者生存,优 开05 胜劣汰”的选择.反复循环迭代,直到筛选出满足条 件的个体为止. 下面本文将运用Matlab建立遗传算法(genetic 10 20 30 40 algorithm,GA)和BP神经网络I-)相结合的连铸 样本 坯质量预测模型来提高模型的预测准确率,且本模 图4中心疏松的实际值和预测值的比较 型遗传算法的种群个体适应度值K为各输出节点 Fig.4 Comparison of the center porosity between the actual values 的连铸坯缺陷预测结果输出值与连铸坯缺陷实际值 and the predicted values 的误差绝对值的和,其计算公式如下式所示 2.5 -0-预测值 K= ,abs(ym-om) (3) 一实际值 2.0 式中:K为适应度值,n为网络输出的节点数,ym为 1.5 神经网络的第m个样本对应的期望输出,0m为第m 个样本对应的的实际输出,abs(x)为绝对值函数. 1.0 遗传算法的基本参数如表3所示 表3遗传算法的基本参数 Table 3 Fundamental parameters and operations of the genetic algorithm 参数名 值 操作项 操作方法 10 20 30 初始种群数 30 编码方式 实数编码 样本 迭代次数 20 选择操作 适应度比例法 图5中心偏析的实际值和预测值的比较 Fig.5 Comparison of the central segregation between the actual val- 交叉概率 0.42 交叉操作 实数交叉法 ues and the predicted values 变异概率 0.2 变异操作 非一致变异法 2.2 模型验证 3 基于极限学习机的连铸坯质量预测模型 通过运用方大特钢60Si2Mn的120组数据对基 为了提高连铸坯质量预测模型的运算速度和预 于GA-BP神经网络连铸坯质量预测模型进行训 测准确率,本文尝试多种方法建立连铸坯预测模型, 练,并运用剩余的40组测试样本来检测GA-BP神 最终选择基于极限学习机的连铸坯质量预测模型, 经网铬的连铸坯质量预测模型的预测精度.图4为 因为该模型具有较快的运行速度[14且模型对连铸 基于GA-BP的连铸坯质量预测模型对连铸坯中 坯质量缺陷的预测准确率有了进一步的提高. 心疏松缺陷等级的预测值和实际值.图5为该模 3.1模型建立 型对连铸坯中心偏析缺陷的预测值和实际值.该 极限学习机是一种简单有效的单隐层前馈神经 模型对连铸坯的中心疏松和中心偏析缺陷预测准 网络1s6,该神经网络结构含有n个输入层神经 确率分别为70%和72.5%,与基于BP神经网络 元,l个隐层神经元,m个输出神经元;其中,输入层 连铸坯质量预测模型相比较,该模型的预测精度 第i个神经元与隐含层第j个神经元的连接权值为 有了明显的提升,对连铸坯中心疏松和中心偏析 ω,隐含层对应的神经元偏置为b.典型的单隐层前 的预测准确率分别提升了20%和15%.然而对于 馈神经网络结构如图6所示. 实际生产,该模型训练时间较长不利于连铸坯质 假设任意N个不同样本(X,Y)∈R。×R,隐 量预测模型在线的应用,且该模型的预测精度还 含层节点个数为L,设隐层神经元的激活函数为 有待进一步提升 G(x),极限学习机模型数学表达式如下式所示
工程科学学报,第 40 卷,第 7 期 2郾 1 模型建立 遗传算法由美国的 Holland 教授提出,该方法 是以自然中的遗传和生物进化论为指导思想而提出 的一种全局最优化搜索方法,他把自然界中“优胜 劣汰冶的生物进化引入到优化神经网络的参数中, 按照所选择的适应度函数并通过模拟生物遗传中的 选择、交叉和变异,然后对个体进行“适者生存,优 胜劣汰冶的选择. 反复循环迭代,直到筛选出满足条 件的个体为止. 下面本文将运用 Matlab 建立遗传算法( genetic algorithm, GA)和 BP 神经网络[11鄄鄄13] 相结合的连铸 坯质量预测模型来提高模型的预测准确率,且本模 型遗传算法的种群个体适应度值 K 为各输出节点 的连铸坯缺陷预测结果输出值与连铸坯缺陷实际值 的误差绝对值的和,其计算公式如下式所示. K = 移 n m = 1 abs(ym - om ) (3) 式中:K 为适应度值,n 为网络输出的节点数,ym 为 神经网络的第 m 个样本对应的期望输出,om 为第 m 个样本对应的的实际输出,abs( x) 为绝对值函数. 遗传算法的基本参数如表 3 所示. 表 3 遗传算法的基本参数 Table 3 Fundamental parameters and operations of the genetic algorithm 参数名 值 操作项 操作方法 初始种群数 30 编码方式 实数编码 迭代次数 20 选择操作 适应度比例法 交叉概率 0郾 42 交叉操作 实数交叉法 变异概率 0郾 2 变异操作 非一致变异法 2郾 2 模型验证 通过运用方大特钢 60Si2Mn 的 120 组数据对基 于 GA鄄鄄BP 神经网络连铸坯质量预测模型进行训 练,并运用剩余的 40 组测试样本来检测 GA鄄鄄 BP 神 经网络的连铸坯质量预测模型的预测精度. 图 4 为 基于 GA鄄鄄BP 的连铸坯质量预测模型对连铸坯中 心疏松缺陷等级的预测值和实际值. 图 5 为该模 型对连铸坯中心偏析缺陷的预测值和实际值. 该 模型对连铸坯的中心疏松和中心偏析缺陷预测准 确率分别为 70% 和 72郾 5% ,与基于 BP 神经网络 连铸坯质量预测模型相比较,该模型的预测精度 有了明显的提升,对连铸坯中心疏松和中心偏析 的预测准确率分别提升了 20% 和 15% . 然而对于 实际生产,该模型训练时间较长不利于连铸坯质 量预测模型在线的应用,且该模型的预测精度还 有待进一步提升. 图 4 中心疏松的实际值和预测值的比较 Fig. 4 Comparison of the center porosity between the actual values and the predicted values 图 5 中心偏析的实际值和预测值的比较 Fig. 5 Comparison of the central segregation between the actual val鄄 ues and the predicted values 3 基于极限学习机的连铸坯质量预测模型 为了提高连铸坯质量预测模型的运算速度和预 测准确率,本文尝试多种方法建立连铸坯预测模型, 最终选择基于极限学习机的连铸坯质量预测模型, 因为该模型具有较快的运行速度[14] 且模型对连铸 坯质量缺陷的预测准确率有了进一步的提高. 3郾 1 模型建立 极限学习机是一种简单有效的单隐层前馈神经 网络[15鄄鄄16] ,该神经网络结构含有 n 个输入层神经 元,l 个隐层神经元,m 个输出神经元;其中,输入层 第 i 个神经元与隐含层第 j 个神经元的连接权值为 棕,隐含层对应的神经元偏置为 b. 典型的单隐层前 馈神经网络结构如图 6 所示. 假设任意 N 个不同样本(Xj,Yj)沂Rn 伊 Rm ,隐 含层节点个数为 L,设隐层神经元的激活函数为 G(x),极限学习机模型数学表达式如下式所示. ·818·
陈恒志等:基于极限学习机(ELM)的连铸坯质量预测 ·819· 确率整体呈上升趋势:当隐含层神经元个数为120 时,训练模型的拟合度达到了最高(激活函数为 ‘sin'和‘sigmoid'时,训练准确率为100%;激活函 数为‘hardlim'时,模型训练准确率高达92%).图7 和图8分别为不同的激活函数和隐含层神经元个数 对连铸坯中心疏松模型和连铸坯中心偏析模型预测 准确率的影响. 90 hardlim -o-sigmoid 输人层 隐层 输出层 80外0 A-sin 图6典型的单隐层前馈神经网络模型 70 Fig.6 Typical feedforward neural network model of the single hidden layer Y.= B.G(0,4)G=1,2,…,m)(4) 50 式中:Y为网络的第m个输出层神经元的输出, 40 w,=[ua,w2,…,wn]T是隐含层第i个神经元与输 30 20 406080 100 120 入层的连接权值,B:为隐含层第i个神经元与输出 隐含层节点数 层的连接权值,G(w:,b:,x:)为第i个隐含层神经元 图7不同激活函数和隐层节点数对应的中心疏松预测准确率 的输出. Fig.7 Testing accuracy of the center porosity corresponding to differ- 该神经网络在对样本训练前随机的产生连接权 ent activation functions and the hidden layer node 值ω和隐含层神经元的偏置b,只需确定隐含层神 90 经元个数和隐含层神经元激活函数,即可计算出B. hardlim o-sigmoid 80 本文运用Matlab软件构建基于极限学习机的 ▲-stn 连铸坯质量预测模型.在建模过程中,发现不同的 70 隐藏层节点个数,对模型的预测精确度存在着很大 60 影响.因此模型需要在确定激活函数的情况下选择 隐藏层节点个数,且该模型分别选取不同的激励函 50 数进行实验,对比分析不同的激活函数和隐藏层节 40 点个数对模型测试精度的影响.本文选择的激活函 数为‘sin'、‘sigmoid'和‘hardlim';其中‘sigmoid'函 30 0 20 40 60 80 100 120 数是一种常见的S型函数.其函数表达式为 隐含层节点数 5() 图8不同激活函数和隐层节点数对应的中心偏析预测准确率 (5) Fig.8 Testing accuracy of the center segregation corresponding to ‘sin'函数为正弦函数.而hardlim'是一种传 different activation functions and the hidden laver node 递函数,传递函数是通过层的网络输入来计算输出: 由图7可知,在验证连铸坯中心疏松缺陷预测 hardlim(N)需要一组网络输入N,N是一个S×Q 模型的有效性时发现,模型隐含层神经元个数在 的矩阵,由网络输入矢量组成,当N符合条件时,函 (0,20]时模型的预测准确率逐渐增加,隐含层神经 数返回值为1,否则返回值为0 元个数在(20,120]时模型的预测准确率整体呈下 3.2模型验证 降趋势,由此可知当隐含层神经元个数超过20时, 本模型同样以方大特钢60Si2Mn的160组实际 模型的训练开始出现过度拟合:同样对于连铸坯中 生产数据为样本,选取其中的120组数据建立模型, 心偏析缺陷预测模型,在验证模型的有效性时发现 剩余的40组数据验证模型的准确性.在模型训练 模型的隐含层神经元个数在(0,20]时模型的预测 的过程中发现,随着隐含层神经元个数的逐渐增加 准确率基本不变,隐含层神经元个数超过20时模型 (隐含层神经元个数范围(0,120]),模型的训练准 的预测准确率整体呈下降趋势,具体如图8所示,由
陈恒志等: 基于极限学习机(ELM)的连铸坯质量预测 图 6 典型的单隐层前馈神经网络模型 Fig. 6 Typical feedforward neural network model of the single hidden layer Ym = 移 L i = 1 茁iG(棕i,bi,xj) (j = 1,2,…,n) (4) 式中:Ym 为网络的第 m 个输出层神经元的输出, 棕i = [棕i1 ,棕i2 ,…,棕in ] T是隐含层第 i 个神经元与输 入层的连接权值,茁i 为隐含层第 i 个神经元与输出 层的连接权值,G(棕i,bi,xi)为第 i 个隐含层神经元 的输出. 该神经网络在对样本训练前随机的产生连接权 值 棕 和隐含层神经元的偏置 b,只需确定隐含层神 经元个数和隐含层神经元激活函数,即可计算出 茁. 本文运用 Matlab 软件构建基于极限学习机的 连铸坯质量预测模型. 在建模过程中,发现不同的 隐藏层节点个数,对模型的预测精确度存在着很大 影响. 因此模型需要在确定激活函数的情况下选择 隐藏层节点个数,且该模型分别选取不同的激励函 数进行实验,对比分析不同的激活函数和隐藏层节 点个数对模型测试精度的影响. 本文选择的激活函 数为‘sin爷、‘sigmoid爷和‘hardlim爷;其中‘sigmoid爷函 数是一种常见的 S 型函数. 其函数表达式为. S(x) = 1 1 + e - x (5) ‘sin爷函数为正弦函数. 而‘ hardlim爷是一种传 递函数,传递函数是通过层的网络输入来计算输出; hardlim(N) 需要一组网络输入 N,N 是一个 S 伊 Q 的矩阵,由网络输入矢量组成,当 N 符合条件时,函 数返回值为 1,否则返回值为 0. 3郾 2 模型验证 本模型同样以方大特钢 60Si2Mn 的 160 组实际 生产数据为样本,选取其中的 120 组数据建立模型, 剩余的 40 组数据验证模型的准确性. 在模型训练 的过程中发现,随着隐含层神经元个数的逐渐增加 (隐含层神经元个数范围(0,120]),模型的训练准 确率整体呈上升趋势;当隐含层神经元个数为 120 时,训练模型的拟合度达到了最高( 激活函数为 ‘sin爷和‘ sigmoid爷 时,训练准确率为 100% ;激活函 数为‘hardlim爷时,模型训练准确率高达 92% ). 图 7 和图 8 分别为不同的激活函数和隐含层神经元个数 对连铸坯中心疏松模型和连铸坯中心偏析模型预测 准确率的影响. 图 7 不同激活函数和隐层节点数对应的中心疏松预测准确率 Fig. 7 Testing accuracy of the center porosity corresponding to differ鄄 ent activation functions and the hidden layer node 图 8 不同激活函数和隐层节点数对应的中心偏析预测准确率 Fig. 8 Testing accuracy of the center segregation corresponding to different activation functions and the hidden layer node 由图 7 可知,在验证连铸坯中心疏松缺陷预测 模型的有效性时发现,模型隐含层神经元个数在 (0,20]时模型的预测准确率逐渐增加,隐含层神经 元个数在(20,120] 时模型的预测准确率整体呈下 降趋势,由此可知当隐含层神经元个数超过 20 时, 模型的训练开始出现过度拟合;同样对于连铸坯中 心偏析缺陷预测模型,在验证模型的有效性时发现 模型的隐含层神经元个数在(0,20] 时模型的预测 准确率基本不变,隐含层神经元个数超过 20 时模型 的预测准确率整体呈下降趋势,具体如图 8 所示,由 ·819·
·820· 工程科学学报,第40卷,第7期 此可知当隐含层神经元个数超过20时,模型的训练 3.5 开始出现过度拟合:从而可知本文建立的两个模型 -。预测值 女一实际值 的最佳隐含层神经元个数范围为(0,20]. 3.0 本文建立的模型以预测准确率和训练拟合度为 2.5 目标,通过选择不同的激活函数和隐含层神经元个 数,使模型的预测准确率和训练拟合达到最佳.因 20 ● 此,综合考虑分析本文最终确定连铸坯中心疏松预 1.5 测模型的激活函数为‘sigmoid'时,最佳隐含层神经 元个数为15;连铸坯中心偏析预测模型的激活函数 1.08 c000888385 为‘hardlim'时,最佳隐含层神经元个数为20,具体 10 20 30 40 参数如表4所示 样本 图9中心疏松的实际值和预测值的比较 表4极限学习机的基本参数 Fig.9 Comparison of the center porosity between the actual values Table 4 Fundamental parameters of the extreme leamning machine and the predicted values 缺陷类型 输入层节点 隐含层节点 激活函数 中心疏松 20 15 sigmoid 。预测值 4 一一实际值 中心偏析 20 20 hardlim 图9和图10分别为连铸坯中心疏松和中心偏 34 9 析缺陷实际值和预测值.本模型对连铸坯中心疏 松和中心偏析两种缺陷的预测命中率分别为85% 和82.5%.图中连铸坯缺陷等级‘1’表示连铸坯 ! 无缺陷,‘2'表示连铸坯缺陷等级为0.5,‘3’表示 连铸坯缺陷等级为1,‘4'表示连铸坯缺陷等级为 8883833 033838 1.5. 10 20 30 40 样本 3.3三个连铸坯质量预测模型的比较 图10中心偏析的实际值和预测值的比较 现对本文建立的基于BP、遗传算法(GA)优化 Fig.10 Comparison between the actual values and the predicted val- BP和极限学习机的三个连俦坯质量预测模型对连 ues of the central segregation 铸坯中心疏松和中心偏析的识别准确率、运算时间 等参数进行比较,结果如表5所示. 表5三种模型测试结果比较 Table 5 Comparison of the test results from the three models considered above 网络类型 训练样本 测试样本 中心疏松命中率/% 中心偏析命中率/% 运算时间/s BP 120 40 50 57.5 2 GA-BP 120 40 70 72.5 120 极限学习机 120 40 85 82.5 0.1 从表5中可以看出,BP神经网络模型预测准确 85%和82.5%,且该模型具有极快的运行速度,运 率较低,对连铸坯中心疏松和中心偏析缺陷的预测 算时间仅需0.1s. 准确率分别为50%和57.5%.经遗传算法优化后 基于BP和GA-BP神经网络的连铸坯质量预 的BP神经网络预测模型的预测结果有了进一步的 测模型是一种误差逆向传播训练的前馈神经网络, 改善,对连铸坯中心疏松和中心偏析缺陷的预测准 为提高模型预测精度,神经网络通过实际值与输出 确率分别为70%和72.5%,但该模型学习速度慢, 值的误差反馈来调整模型的连接权值.然而,上述 训练时间较长,运算时间为120s,不利于连铸坯质 两种模型在运行过程中存在一定的不足,即BP神 量预测模型的在线应用:而基于极限学习机的连铸 经网络预测模型随机产生的权值容易使网络陷入局 坯质量预测模型预测准确率较高,对连铸坯中心疏 部最优;GA-BP神经网络预测模型的训练速度慢, 松和中心偏析缺陷的预测准确率可分别提高至 且网络在寻优过程中易出现早熟收敛,运算结果非
工程科学学报,第 40 卷,第 7 期 此可知当隐含层神经元个数超过 20 时,模型的训练 开始出现过度拟合;从而可知本文建立的两个模型 的最佳隐含层神经元个数范围为(0,20]. 本文建立的模型以预测准确率和训练拟合度为 目标,通过选择不同的激活函数和隐含层神经元个 数,使模型的预测准确率和训练拟合达到最佳. 因 此,综合考虑分析本文最终确定连铸坯中心疏松预 测模型的激活函数为‘ sigmoid爷时,最佳隐含层神经 元个数为 15;连铸坯中心偏析预测模型的激活函数 为‘hardlim爷时,最佳隐含层神经元个数为 20,具体 参数如表 4 所示. 表 4 极限学习机的基本参数 Table 4 Fundamental parameters of the extreme learning machine 缺陷类型 输入层节点 隐含层节点 激活函数 中心疏松 20 15 sigmoid 中心偏析 20 20 hardlim 图 9 和图 10 分别为连铸坯中心疏松和中心偏 析缺陷实际值和预测值. 本模型对连铸坯中心疏 松和中心偏析两种缺陷的预测命中率分别为 85% 和 82郾 5% . 图中连铸坯缺陷等级‘1爷 表示连铸坯 无缺陷,‘2爷表示连铸坯缺陷等级为 0郾 5,‘3爷表示 连铸坯缺陷等级为 1,‘4爷表示连铸坯缺陷等级为 1郾 5. 3郾 3 三个连铸坯质量预测模型的比较 现对本文建立的基于 BP、遗传算法(GA)优化 BP 和极限学习机的三个连铸坯质量预测模型对连 铸坯中心疏松和中心偏析的识别准确率、运算时间 图 9 中心疏松的实际值和预测值的比较 Fig. 9 Comparison of the center porosity between the actual values and the predicted values 图 10 中心偏析的实际值和预测值的比较 Fig. 10 Comparison between the actual values and the predicted val鄄 ues of the central segregation 等参数进行比较,结果如表 5 所示. 表 5 三种模型测试结果比较 Table 5 Comparison of the test results from the three models considered above 网络类型 训练样本 测试样本 中心疏松命中率/ % 中心偏析命中率/ % 运算时间/ s BP 120 40 50 57郾 5 2 GA鄄鄄BP 120 40 70 72郾 5 120 极限学习机 120 40 85 82郾 5 0郾 1 从表 5 中可以看出,BP 神经网络模型预测准确 率较低,对连铸坯中心疏松和中心偏析缺陷的预测 准确率分别为 50% 和 57郾 5% . 经遗传算法优化后 的 BP 神经网络预测模型的预测结果有了进一步的 改善,对连铸坯中心疏松和中心偏析缺陷的预测准 确率分别为 70% 和 72郾 5% ,但该模型学习速度慢, 训练时间较长,运算时间为 120 s,不利于连铸坯质 量预测模型的在线应用;而基于极限学习机的连铸 坯质量预测模型预测准确率较高,对连铸坯中心疏 松和中心偏析缺陷的预测准确率可分别提高至 85% 和 82郾 5% ,且该模型具有极快的运行速度,运 算时间仅需 0郾 1 s. 基于 BP 和 GA鄄鄄 BP 神经网络的连铸坯质量预 测模型是一种误差逆向传播训练的前馈神经网络, 为提高模型预测精度,神经网络通过实际值与输出 值的误差反馈来调整模型的连接权值. 然而,上述 两种模型在运行过程中存在一定的不足,即 BP 神 经网络预测模型随机产生的权值容易使网络陷入局 部最优;GA鄄鄄BP 神经网络预测模型的训练速度慢, 且网络在寻优过程中易出现早熟收敛,运算结果非 ·820·
陈恒志等:基于极限学习机(ELM)的连铸坯质量预测 ·821· 全局最优值:与此同时,上述两个模型的训练函数都 [3]Chang Y H,Zeng Z,Zhang J Q,et al.Online quality prediction 为梯度下降函数,在迭代过程中需要调整所有相关 system of bloom castings based on BP neural network.fron Steel, 2011,46(5):33 参数,增加模型的复杂度和运算时间.这里,需要特 (常运合,曾智,张家泉,等.基于BP神经网络的大方坯质量 别指出的是,本文建立的基于前馈神经网络极限学 在线预报模型.钢铁,2011,46(5):33) 习机的连铸坯质量预测模型,可随机产生输入层和 [4]Zhang J.Research on Slab Defect Prediction and Parameter Optimi- 隐含层之间的连接权值及隐含层神经元的偏置.根 zation System based on Neural Neticork Dissertation ] 据输入向量和输出向量,求出隐含层和输出层之间 Chongqing:Chongqing University,2001 的连接权值B即可,基于极限学习机的连铸坯质量 (张静.基于神经网络的遗传算法的板坯缺陷预报和参数优 化系统研究[学位论文].重庆:重庆大学,2001) 预测模型不仅泛化能力强,学习效率高且运算速度 [5]Huang G B,Zhu Q Y,Siew C K.Extreme learning machine:a 快,预测精度高.因此,由上述分析可知,基于极限 new leaming scheme of feedforward neural networks//Proceedings 学习机的连俦坯质量预测模型可对连铸坯质量进行 IEEE International Joint Conference on Neural Networks.Buda- 迅速准确地分析,为连铸坯质量预测的在线应用提 pest,2004:985 供了一种新的方法. [6]Jing GL.Du WT,Guo YY.Studies on prediction of separation percent in electrodialysis process ria BP neural networks and im- 4结论 proved BP algorithms.Desalination,2012,291:78 [7]Wang Z,Chang J,Ju Q P,et al.Prediction model of end-point (1)基于BP神经网络的连铸坯质量预测模型 manganese content for BOF steelmaking process.IS/Int,2012, 对连铸坯中心疏松和中心偏析缺陷预测准确率可分 52(9):1585 别达到50%和57.5%. [8]Cai KK.Ouality Control of Continuous Casting Strand.2nd Ed Beijing:Metallurgical Industry Press,2010 (2)基于GA-BP神经网络的连铸坯质量预测 (蔡开科.连铸坯质量控制.2版.北京:治金工业出版社, 模型相对基于BP神经网络的连铸坯质量预测模 2010) 型,预测准确率有了很大提升,对连铸坯中心疏松和 [9]Dong S,Wang B,Wang Z,et al.Comparison of prediction models 中心偏析缺陷预测准确率可分别达到70%和 for power draw in grinding and flotation processes in a gold treat- 72.5%,但模型训练需要消耗较长的时间,不利于模 ment plant.J Chem Eng Jpn,2016,49(2):204 [10]Hu J,Zeng X J.An efficient activation function for BP neural 型的在线应用. network //International Workshop on Intelligent Systems and Ap- (3)基于极限学习机的连铸坯质量预测模型对 plications.Wuhan,2009:1 连铸坯缺陷的预测准确率明显优于BP和GA-BP [11]Liu Q,Wang B.Yuan W,et al.Prediction model of floatation 神经网络预测模型,对连铸坯中心疏松和中心偏析 recovery ratio for a gold mine.J Unir Sci Technol Beijing,2014, 36(11):1456 缺陷预测准确率可分别达到85%和82.5%,且模型 (刘青,王彬,袁玮,等.金矿浮选回收率预测模型.北京科 对样本进行训练所需时间仅0.1s,训练速度比BP 技大学学报,2014,36(11):1456) 和GA-BP神经网络预测模型有了极大的提升. [12]Liu K,Guo W Y,Shen X L,et al.Research on the forecast (4)基于极限学习机的连铸坯质量预测模型可 model of electricity power industry loan based on GA-BP neural 对钢铁企业的海量生产数据进行快速分析,对连铸 network.Energy Procedia,2012,14:1918 坯质量预测的迅捷在线应用具有重要的推动作用, [13]Ji C,Cai ZZ,Tao N B,et al.Molten steel breakout prediction based on genetic algorithm and BP neural network in continuous 有望应用于冶金过程工艺或质量控制参数预测 casting process//2012 31st Chinese Control Conference.Hefei, 研究. 2012:3402 [14]Huang G B,Zhou H M,Ding X J,et al.Extreme learning ma- 参考文献 chine for regression and multiclass classification.IEEE Trans Syst [1]Zhang B L,Zhang X S,Cao C X.Neural network applied in diag- Man Cybern Part B Cybern,2012,42(2):513 nosis of steel slab production.Microcomput Appl,2001,17(1):34 [15]Yu Q,Miche Y.Severin E,et al.Bankruptcy prediction using (张邦礼,张雪松,曹长修.神经网络在钢铁板坯生产缺陷诊 extreme learning machine and financial expertise.Neurocomput- 断中的应用.微型电脑应用,2001,17(1):34) ing,2014,128:296 [2]Bouhouche S.Contribution to Quality and Process Optimization in [16]Deo R C.Sahin M.Application of the extreme leamning machine Continuous Casting using Mathematical Modelling [Dissertation]. algorithm for the prediction of monthly effective drought index in Freiburg:Technische Universitat Bergakademie Freiberg,2002 eastern Australia.Atmos Res,2015,153:512
陈恒志等: 基于极限学习机(ELM)的连铸坯质量预测 全局最优值;与此同时,上述两个模型的训练函数都 为梯度下降函数,在迭代过程中需要调整所有相关 参数,增加模型的复杂度和运算时间. 这里,需要特 别指出的是,本文建立的基于前馈神经网络极限学 习机的连铸坯质量预测模型,可随机产生输入层和 隐含层之间的连接权值及隐含层神经元的偏置. 根 据输入向量和输出向量,求出隐含层和输出层之间 的连接权值 茁 即可,基于极限学习机的连铸坯质量 预测模型不仅泛化能力强,学习效率高且运算速度 快,预测精度高. 因此,由上述分析可知,基于极限 学习机的连铸坯质量预测模型可对连铸坯质量进行 迅速准确地分析,为连铸坯质量预测的在线应用提 供了一种新的方法. 4 结论 (1)基于 BP 神经网络的连铸坯质量预测模型 对连铸坯中心疏松和中心偏析缺陷预测准确率可分 别达到 50% 和 57郾 5% . (2)基于 GA鄄鄄 BP 神经网络的连铸坯质量预测 模型相对基于 BP 神经网络的连铸坯质量预测模 型,预测准确率有了很大提升,对连铸坯中心疏松和 中心 偏 析 缺 陷 预 测 准 确 率 可 分 别 达 到 70% 和 72郾 5% ,但模型训练需要消耗较长的时间,不利于模 型的在线应用. (3)基于极限学习机的连铸坯质量预测模型对 连铸坯缺陷的预测准确率明显优于 BP 和 GA鄄鄄 BP 神经网络预测模型,对连铸坯中心疏松和中心偏析 缺陷预测准确率可分别达到 85% 和 82郾 5% ,且模型 对样本进行训练所需时间仅 0郾 1 s,训练速度比 BP 和 GA鄄鄄BP 神经网络预测模型有了极大的提升. (4)基于极限学习机的连铸坯质量预测模型可 对钢铁企业的海量生产数据进行快速分析,对连铸 坯质量预测的迅捷在线应用具有重要的推动作用, 有望应用于冶金过程工艺或质量控制参数预测 研究. 参 考 文 献 [1] Zhang B L, Zhang X S, Cao C X. Neural network applied in diag鄄 nosis of steel slab production. Microcomput Appl, 2001, 17(1): 34 (张邦礼, 张雪松, 曹长修. 神经网络在钢铁板坯生产缺陷诊 断中的应用. 微型电脑应用, 2001, 17(1): 34) [2] Bouhouche S. Contribution to Quality and Process Optimization in Continuous Casting using Mathematical Modelling [Dissertation]. Freiburg: Technische Universit覿t Bergakademie Freiberg, 2002 [3] Chang Y H, Zeng Z, Zhang J Q, et al. Online quality prediction system of bloom castings based on BP neural network. Iron Steel, 2011, 46(5): 33 (常运合, 曾智, 张家泉, 等. 基于 BP 神经网络的大方坯质量 在线预报模型. 钢铁, 2011, 46(5): 33) [4] Zhang J. Research on Slab Defect Prediction and Parameter Optimi鄄 zation System based on Neural Network [ Dissertation ]. Chongqing: Chongqing University, 2001 (张静. 基于神经网络的遗传算法的板坯缺陷预报和参数优 化系统研究[学位论文]. 重庆: 重庆大学, 2001) [5] Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: a new learning scheme of feedforward neural networks / / Proceedings IEEE International Joint Conference on Neural Networks. Buda鄄 pest, 2004: 985 [6] Jing G L, Du W T, Guo Y Y. Studies on prediction of separation percent in electrodialysis process via BP neural networks and im鄄 proved BP algorithms. Desalination, 2012, 291: 78 [7] Wang Z, Chang J, Ju Q P, et al. Prediction model of end鄄point manganese content for BOF steelmaking process. ISIJ Int, 2012, 52(9): 1585 [8] Cai K K. Quality Control of Continuous Casting Strand. 2nd Ed. Beijing: Metallurgical Industry Press, 2010 (蔡开科. 连铸坯质量控制. 2 版. 北京: 冶金工业出版社, 2010) [9] Dong S, Wang B, Wang Z, et al. Comparison of prediction models for power draw in grinding and flotation processes in a gold treat鄄 ment plant. J Chem Eng Jpn, 2016, 49(2): 204 [10] Hu J, Zeng X J. An efficient activation function for BP neural network / / International Workshop on Intelligent Systems and Ap鄄 plications. Wuhan, 2009: 1 [11] Liu Q, Wang B, Yuan W, et al. Prediction model of floatation recovery ratio for a gold mine. J Univ Sci Technol Beijing, 2014, 36(11): 1456 (刘青, 王彬, 袁玮, 等. 金矿浮选回收率预测模型. 北京科 技大学学报, 2014, 36(11): 1456) [12] Liu K, Guo W Y, Shen X L, et al. Research on the forecast model of electricity power industry loan based on GA鄄鄄 BP neural network. Energy Procedia, 2012, 14: 1918 [13] Ji C, Cai Z Z, Tao N B, et al. Molten steel breakout prediction based on genetic algorithm and BP neural network in continuous casting process / / 2012 31st Chinese Control Conference. Hefei, 2012: 3402 [14] Huang G B, Zhou H M, Ding X J, et al. Extreme learning ma鄄 chine for regression and multiclass classification. IEEE Trans Syst Man Cybern Part B Cybern, 2012, 42(2): 513 [15] Yu Q, Miche Y, S佴verin E, et al. Bankruptcy prediction using extreme learning machine and financial expertise. Neurocomput鄄 ing, 2014, 128: 296 [16] Deo R C, 褗ahin M. Application of the extreme learning machine algorithm for the prediction of monthly effective drought index in eastern Australia. Atmos Res, 2015, 153: 512 ·821·