工程科学学报,第41卷,第8期:1052-1060,2019年8月 Chinese Journal of Engineering,Vol.41,No.8:1052-1060,August 2019 DOI:10.13374/j.issn2095-9389.2019.08.011;http://journals.ustb.edu.cn 基于PSO-RELM转炉冶炼终点锰含量预测模型 张壮),曹玲玲),林文辉),孙建坤),冯小明),刘青) 1)北京科技大学钢铁冶金新技术国家重点实验室,北京1000832)新余钢铁集团有限公司,新余338001 区通信作者,E-mail:qiu@ustb.edu.cn 摘要分析了影响转炉治炼终点钢水中锰含量的因索,针对基于BP神经网络算法的转炉治炼终点锰含量预测模型存在的 收敛速度慢,预测精度低等问题,提出了一种基于极限学习机(ELM)算法建模的新思路,并引入正则化以及改进粒子群优化 算法(PSO),建立了基于改进粒子群算法优化的正则化极限学习机(PS0-RELM)的转炉终点锰含量预测模型:应用国内某 炼钢厂转炉实际生产数据对模型进行训练和验证,并与基于BP、ELM和RELM算法的三类模型进行比较.结果表明,采用P. S0-RELM方法构建的模型,锰含量预测误差在±0.025%范围内的命中率达到94%,均方误差为2.18×10~8,拟合优度R2为 0.72,上述三项指标均显著优于其他三类模型,此外,该模型还具有良好的泛化能力,对于转炉实际治炼过程具有一定的指导 意义. 关键词转炉:终点锰含量:改进粒子群算法:极限学习机:正则化极限学习机:预测模型 分类号TF723 Improved prediction model for BOF end-point manganese content based on IPSO-RELM method ZHANG Zhuang,CAO Ling-ling,LIN Wen-hui,SUN Jian-kun),FENG Xiao-ming?),LIU Qing 1)State Key Laboratory of Advanced Metallurgy,University of Science and Technology Beijing,Beijing 100083,China 2)Xinyu Iron Steel Group Co.,Ltd.,Xinyu 338001,China Corresponding author,E-mail:qliu@ustb.edu.cn ABSTRACT The basic oxygen furnace (BOF)steelmaking process,as the predominant steelmaking method used around the world, involves very complex physical and chemical phenomena such as multi-component reactions,multi-phase fluid dynamics,and high tem- perature.The main task of the BOF process is tailoring the temperature and melt components to meet the requirements of high-quality steel production.With the development of intelligent steelmaking,the prediction of the end-point manganese content is an extremely important task for the BOF process,and improving the level of control regarding the end-point of BOF steelmaking can reduce produc- tion costs and enhance efficiency.In this paper,the mechanism of the BOF steelmaking process and the factors influencing the end- point manganese content were analyzed.The control variables for predicting the end-point manganese content were also determined.To solve the problems of slow convergence,weak generalization ability,and low prediction accuracy in the prediction model established for the BP neural network,a new modeling concept based on an extreme learning machine (ELM)algorithm was proposed.By introducing regularization and improved particle swarm optimization(IPSO),a prediction model for the end-point manganese content in a converter based on improved particle swarm optimization and a regularized ELM (IPSO-RELM)was established.The paper then trained and verified the performance of these models with actual production data.A comparison of the performance of the proposed model with those of the prediction model of the BP neural network,the ELM model,and the RELM model reveals that the IPSO-RELM prediction model has the highest prediction accuracy and the best generalization performance.The hit ratio of the IPSO-RELM prediction model is 94% 收稿日期:2018-08-08 基金项目:江西省重点研发计划资助项目(20171ACE50020)
工程科学学报,第 41 卷,第 8 期:1052鄄鄄1060,2019 年 8 月 Chinese Journal of Engineering, Vol. 41, No. 8: 1052鄄鄄1060, August 2019 DOI: 10. 13374 / j. issn2095鄄鄄9389. 2019. 08. 011; http: / / journals. ustb. edu. cn 基于 IPSO鄄鄄RELM 转炉冶炼终点锰含量预测模型 张 壮1) , 曹玲玲1) , 林文辉1) , 孙建坤1) , 冯小明2) , 刘 青1) 苣 1) 北京科技大学钢铁冶金新技术国家重点实验室, 北京 100083 2) 新余钢铁集团有限公司, 新余 338001 苣通信作者, E鄄mail: qliu@ ustb. edu. cn 摘 要 分析了影响转炉冶炼终点钢水中锰含量的因素,针对基于 BP 神经网络算法的转炉冶炼终点锰含量预测模型存在的 收敛速度慢,预测精度低等问题,提出了一种基于极限学习机(ELM)算法建模的新思路,并引入正则化以及改进粒子群优化 算法(IPSO),建立了基于改进粒子群算法优化的正则化极限学习机( IPSO鄄鄄RELM)的转炉终点锰含量预测模型;应用国内某 炼钢厂转炉实际生产数据对模型进行训练和验证,并与基于 BP、ELM 和 RELM 算法的三类模型进行比较. 结果表明,采用 IP鄄 SO鄄鄄RELM 方法构建的模型,锰含量预测误差在 依 0郾 025% 范围内的命中率达到 94% ,均方误差为 2郾 18 伊 10 - 8 ,拟合优度 R 2为 0郾 72,上述三项指标均显著优于其他三类模型,此外,该模型还具有良好的泛化能力,对于转炉实际冶炼过程具有一定的指导 意义. 关键词 转炉; 终点锰含量; 改进粒子群算法; 极限学习机; 正则化极限学习机;预测模型 分类号 TF723 收稿日期: 2018鄄鄄08鄄鄄08 基金项目: 江西省重点研发计划资助项目(20171ACE50020) Improved prediction model for BOF end鄄point manganese content based on IPSO鄄鄄RELM method ZHANG Zhuang 1) , CAO Ling鄄ling 1) , LIN Wen鄄hui 1) , SUN Jian鄄kun 1) , FENG Xiao鄄ming 2) , LIU Qing 1) 苣 1) State Key Laboratory of Advanced Metallurgy, University of Science and Technology Beijing, Beijing 100083, China 2) Xinyu Iron & Steel Group Co. , Ltd. , Xinyu 338001, China 苣Corresponding author, E鄄mail: qliu@ ustb. edu. cn ABSTRACT The basic oxygen furnace (BOF) steelmaking process, as the predominant steelmaking method used around the world, involves very complex physical and chemical phenomena such as multi鄄component reactions, multi鄄phase fluid dynamics, and high tem鄄 perature. The main task of the BOF process is tailoring the temperature and melt components to meet the requirements of high鄄quality steel production. With the development of intelligent steelmaking, the prediction of the end鄄point manganese content is an extremely important task for the BOF process, and improving the level of control regarding the end鄄point of BOF steelmaking can reduce produc鄄 tion costs and enhance efficiency. In this paper, the mechanism of the BOF steelmaking process and the factors influencing the end鄄 point manganese content were analyzed. The control variables for predicting the end鄄point manganese content were also determined. To solve the problems of slow convergence, weak generalization ability, and low prediction accuracy in the prediction model established for the BP neural network, a new modeling concept based on an extreme learning machine (ELM) algorithm was proposed. By introducing regularization and improved particle swarm optimization (IPSO), a prediction model for the end鄄point manganese content in a converter based on improved particle swarm optimization and a regularized ELM ( IPSO鄄鄄 RELM) was established. The paper then trained and verified the performance of these models with actual production data. A comparison of the performance of the proposed model with those of the prediction model of the BP neural network, the ELM model, and the RELM model reveals that the IPSO鄄鄄RELM prediction model has the highest prediction accuracy and the best generalization performance. The hit ratio of the IPSO鄄鄄RELM prediction model is 94%
张壮等:基于PSO-RELM转炉治炼终点锰含量预测模型 ·1053· when the predictive errors of the model are within 0.025%,the mean square error is 2.18x10-,and the fitting degree is 0.72.Rela- tive to the above three models,the IPSO-RELM prediction model may provide a more accurate prediction of the end-point manganese content and thus serves as a good reference point for actual production. KEY WORDS basic oxygen furace BOF);end-point manganese content;improved particle swarm optimization (IPSO);extreme learning machine ELM);regularized extreme learning machine RELM):prediction model 转炉炼钢作为钢铁生产长流程中十分重要的环 提出了正则化极限学习机(regularized extreme learn- 节,是目前世界上最主要的炼钢方法.转炉炼钢的 ing machine,RELM).RELM模型具有比ELM模型 目的是获得化学成分和温度均合格的钢水,为此,转 更好的泛化性能,但同ELM模型一样,RELM模型 炉炼钢过程的重要任务就是保证吹炼的平稳进行以 采用随机给定的输入层权值和隐含层偏差,这会影 及准确预测并控制终点钢水的成分和温度-].目 响RELM模型的稳定性和预测精度,而粒子群优化 前,国内外关于转炉冶炼终点碳含量和温度预测方 算法[)](particle swarm optimization,PSO)具有实现 面的研究工作开展得较多,并且取得了较好的预测 容易、精度高、收敛快等优,点.通过分析PS0优化算 效果[4-):然而,在终点锰含量预测方面做的研究相 法的原理,针对RELM模型输入层权值和隐含层偏 对较少.在转炉炼钢过程中,若能实现对终点钢水 差随机给定的问题,作者以国内某钢厂80t转炉实 锰含量的准确预测,则可以提高操作人员对出钢判 际生产数据为建模样本,将冶金基本原理同统计学 断的准确性,进一步提高转炉冶炼终点命中率,从而 理论相结合,对转炉冶炼终点锰含量预测模型进行 降低生产成本,提高钢水质量.日本高翰武志等6 了研究,通过将其与转炉冶炼终点锰含量相关的因 在副枪取样分析钢水锰含量的基础上,利用热力学 素进行分析,提出基于改进粒子群算法(improved 原理和质量守恒建立了从副枪取样到吹炼终点的锰 particle swarm optimization,PSO)优化正则化极限学 含量预测模型,由于该模型需要用副枪测量钢水中 习机的转炉冶炼终点锰含量预测模型,与基于BP 的锰含量,因而成本较高,且只适用于装备有副枪的 神经网络模型、ELM模型和RELM模型的预测结果 转炉.杨立红等[)利用自适应模糊神经网络对转炉进行比较发现,本文建立的基于PS0-RELM转炉 治炼终点锰含量进行了较为精确的预测,其控制水 冶炼终点锰含量预测模型具有较高的预测精度和良 平接近于动态锰成分控制模型.刘锟等[)分析了影 好的泛化性能,可以更为精确的实现对转炉冶炼终 响终点锰含量的工艺因素,并根据吹炼后期副枪检 点锰含量预测 测的熔池碳含量和温度建立了终点锰含量预测模 型.Wang等[]根据转炉冶金基本原理结合统计学 1研究方法 的方法,分别建立了转炉冶炼终点锰含量代数学预 由于转炉炼钢过程中的物理化学反应十分复 测模型、B神经网络预测模型和基于遗传算法改进 杂,转炉冶炼终点锰含量的影响因素众多,且各影响 的BP神经网络预测模型,其中基于BP神经网络和 因素之间具有很强的非线性关系,机理模型很难建 基于遗传算法改进的BP神经网络预测模型,预测 立.针对上述问题,本文引入粒子群算法、极限学习 误差在±0.025%范围内时,锰含量预测的命中率分 机算法和正则化极限学习机算法对终点锰含量预测 别为71%和84%.上述研究工作为转炉冶炼终点 模型进行研究,并将智能算法的不足进行改进,采用 锰含量预测研究奠定了重要基础 综合优化算法建模,以期获得一种终点锰含量预测 然而,传统的BP神经网络算法具有需要设置 精度较高的建模方法 大量网络训练参数、训练速度较慢且容易陷入局部 1.1粒子群算法及其改进 最优解的固有缺陷.为此,本文引入极限学习机 粒子群算法源于对鸟群捕食行为的研究,是一 (extreme learning machine,ELM)模型,它是Huang 种新兴起来的进化算法(evolutionary algorithm, 等[1基于广义逆矩阵理论提出的一种单隐层前馈 EA),由Kennedy和Eberhart[a]于1995年首次提 神经网络,该算法拥有极快的学习速度,同时可避免出.粒子群算法在对动物群体活动行为进行深人观 传统神经网络算法存在的问题).然而ELM模型 察的基础上,利用群体中个体对信息的共享使整个 也存在泛化能力较差、预测不稳定等问题.为提高 群体运动在问题求解空间中从无序逐渐变得有序, ELM模型的泛化性能,2009年,Deng等]通过向 从而获得最优解 ELM模型引入结构风险最小化理论以及正则化项, 类似于遗传算法(genetic algorithm,GA),粒子
张 壮等: 基于 IPSO鄄鄄RELM 转炉冶炼终点锰含量预测模型 when the predictive errors of the model are within 0郾 025% , the mean square error is 2郾 18 伊 10 - 8 ,and the fitting degree is 0郾 72. Rela鄄 tive to the above three models, the IPSO鄄鄄RELM prediction model may provide a more accurate prediction of the end鄄point manganese content and thus serves as a good reference point for actual production. KEY WORDS basic oxygen furnace (BOF); end鄄point manganese content; improved particle swarm optimization (IPSO); extreme learning machine (ELM); regularized extreme learning machine (RELM); prediction model 转炉炼钢作为钢铁生产长流程中十分重要的环 节,是目前世界上最主要的炼钢方法. 转炉炼钢的 目的是获得化学成分和温度均合格的钢水,为此,转 炉炼钢过程的重要任务就是保证吹炼的平稳进行以 及准确预测并控制终点钢水的成分和温度[1鄄鄄3] . 目 前,国内外关于转炉冶炼终点碳含量和温度预测方 面的研究工作开展得较多,并且取得了较好的预测 效果[4鄄鄄5] ;然而,在终点锰含量预测方面做的研究相 对较少. 在转炉炼钢过程中,若能实现对终点钢水 锰含量的准确预测,则可以提高操作人员对出钢判 断的准确性,进一步提高转炉冶炼终点命中率,从而 降低生产成本,提高钢水质量. 日本高輪武志等[6] 在副枪取样分析钢水锰含量的基础上,利用热力学 原理和质量守恒建立了从副枪取样到吹炼终点的锰 含量预测模型,由于该模型需要用副枪测量钢水中 的锰含量,因而成本较高,且只适用于装备有副枪的 转炉. 杨立红等[7]利用自适应模糊神经网络对转炉 冶炼终点锰含量进行了较为精确的预测,其控制水 平接近于动态锰成分控制模型. 刘锟等[8]分析了影 响终点锰含量的工艺因素,并根据吹炼后期副枪检 测的熔池碳含量和温度建立了终点锰含量预测模 型. Wang 等[9]根据转炉冶金基本原理结合统计学 的方法,分别建立了转炉冶炼终点锰含量代数学预 测模型、BP 神经网络预测模型和基于遗传算法改进 的 BP 神经网络预测模型,其中基于 BP 神经网络和 基于遗传算法改进的 BP 神经网络预测模型,预测 误差在 依 0郾 025% 范围内时,锰含量预测的命中率分 别为 71% 和 84% . 上述研究工作为转炉冶炼终点 锰含量预测研究奠定了重要基础. 然而,传统的 BP 神经网络算法具有需要设置 大量网络训练参数、训练速度较慢且容易陷入局部 最优解的固有缺陷. 为此,本文引入极限学习机 (extreme learning machine,ELM) 模型,它是 Huang 等[10]基于广义逆矩阵理论提出的一种单隐层前馈 神经网络,该算法拥有极快的学习速度,同时可避免 传统神经网络算法存在的问题[11] . 然而 ELM 模型 也存在泛化能力较差、预测不稳定等问题. 为提高 ELM 模型的泛化性能,2009 年,Deng 等[12] 通过向 ELM 模型引入结构风险最小化理论以及正则化项, 提出了正则化极限学习机(regularized extreme learn鄄 ing machine,RELM). RELM 模型具有比 ELM 模型 更好的泛化性能,但同 ELM 模型一样,RELM 模型 采用随机给定的输入层权值和隐含层偏差,这会影 响 RELM 模型的稳定性和预测精度,而粒子群优化 算法[13] (particle swarm optimization,PSO) 具有实现 容易、精度高、收敛快等优点. 通过分析 PSO 优化算 法的原理,针对 RELM 模型输入层权值和隐含层偏 差随机给定的问题,作者以国内某钢厂 80 t 转炉实 际生产数据为建模样本,将冶金基本原理同统计学 理论相结合,对转炉冶炼终点锰含量预测模型进行 了研究,通过将其与转炉冶炼终点锰含量相关的因 素进行分析,提出基于改进粒子群算法( improved particle swarm optimization,IPSO)优化正则化极限学 习机的转炉冶炼终点锰含量预测模型,与基于 BP 神经网络模型、ELM 模型和 RELM 模型的预测结果 进行比较发现:本文建立的基于 IPSO鄄鄄 RELM 转炉 冶炼终点锰含量预测模型具有较高的预测精度和良 好的泛化性能,可以更为精确的实现对转炉冶炼终 点锰含量预测. 1 研究方法 由于转炉炼钢过程中的物理化学反应十分复 杂,转炉冶炼终点锰含量的影响因素众多,且各影响 因素之间具有很强的非线性关系,机理模型很难建 立. 针对上述问题,本文引入粒子群算法、极限学习 机算法和正则化极限学习机算法对终点锰含量预测 模型进行研究,并将智能算法的不足进行改进,采用 综合优化算法建模,以期获得一种终点锰含量预测 精度较高的建模方法. 1郾 1 粒子群算法及其改进 粒子群算法源于对鸟群捕食行为的研究,是一 种新 兴 起 来 的 进 化 算 法 ( evolutionary algorithm, EA),由 Kennedy 和 Eberhart [14]于 1995 年首次提 出. 粒子群算法在对动物群体活动行为进行深入观 察的基础上,利用群体中个体对信息的共享使整个 群体运动在问题求解空间中从无序逐渐变得有序, 从而获得最优解. 类似于遗传算法( genetic algorithm,GA),粒子 ·1053·
·1054· 工程科学学报,第41卷,第8期 群算法是一种基于迭代的优化算法].首先将系 改进部分如下 统进行初始化,产生一组随机解,然后通过迭代搜寻 (1)本文采用一种非线性权重方法来改善标准 最优值.但PSO没有GA所包含的交叉和变异操 粒子群算法的不足6],这种算法可描述为: 作,而是粒子在解空间中通过追随当前搜寻到的最 w=0ms-(ωar-wmin)Xtan 优值来搜寻全局的最优值.所以与GA相比,PSO具 (作)x (6) 有调整参数少且简单易实现的优点.目前已广泛应 在当前迭代次数k较小时,ω接近于wm保证 用于函数优化、神经网络训练等多个领域. 了算法的全局搜索能力:随着迭代次数k的增大,ω PSO算法可以描述为:在一个D维搜索空间 以非线性递减,保证了算法的局部搜索能力,从而使 中,一个种群由s个粒子组成,可由如下矩阵表示: 算法能灵活地调整全局搜索与局部搜索能力 Z=(Z1,Z2,…,Z) (2)借鉴遗传算法的变异思想,给粒子群算法 (1) 第i个粒子的位置可以表示为: 加入“变异”因子,使粒子每次更新之后,可以以一 定变异率初始化粒子,从而避免陷入局部极值,增大 Z=(Za,Z2,…,2n)r (2) 搜索范围. 其中,Zo表示第i个粒子在第D维的位置.根据所 1.2极限学习机算法 设定的目标函数,可以计算出每个粒子在位置Z:时 极限学习机是一种新型单隐层前馈型神经网 所对应的适应度值. 络-18].典型的单隐层前馈神经网络结构如图1 第i个粒子的速度可以表示为: 所示. V=(Va,V2,…,Vo)r (3) 其中,V表示第i个粒子在第D维的速度.随着每 一次的迭代进行,粒子都通过个体的最优值和全局 的最优值来更新自身的速度和位置,更新公式如下 式所示: (Vi=oVi +cir(Pl -Zh)+car (Ph -Zi) Z=Zh+av Ye (4) 式中::'表示粒子i在第k+1次迭代中第d维的 ② 速度;Z*'表示粒子i在第k+1次迭代中第d维的 图1典型的单隐层前馈神经网络模型 Fig.I Typical single hidden layer feedforward neural network model 位置;k为第k次迭代;w为惯性权重;d=1,2,…, D;i=1,2,…,s;c1,c2为学习因子;r1∈rand(0,1), 对于一个单隐层神经网络,假设任意?个不同 r2∈rand(0,1);a为约束因子;P表示粒子i在第d 样本(x,),其中,=[x,…,a]T∈R,n表 维的个体极值点的位置:P表示整个种群在第d维 示第j个样本第n个输入项;=[h,2,…,]T∈ 的全局极值点的位置.为防止粒子盲目搜索,一般 R“,'m表示第j个样本第m个期望输出项;隐含层 将粒子在第d维的位置变化范围限定在[-Zm, 节点0的个数为1,设隐含层神经元的激活函数为 Zx]内,速度变化范围限定在[-Vx,Vx]内. G(x),)为输入层与隐含层的连接权值向量,B为隐 惯性权重系数ω的表达式为: 含层与输出层的连接权值向量,则ELM模型数学表 达式如下式所示 (k=1,2,…,N) yn=∑BG(n,b), (5) 式中,wmx、ωin分别表示所设置的初始惯性权重系 =1,2,…,r) (7) 数的最大值和结束迭代时惯性权重系数的最小值,k 式中,Y。为网络的第m个输出层神经元的输出:G 为当前迭代次数,N为最大迭代次数, (n:,b,x)为第i个隐含层神经元的输出;:= PS0通过迭代计算来确定粒子的全局最优值. [7a,门2,…,?m]',n表示第n个输入层与第i个隐 然而,粒子群算法在迭代寻优过程中存在容易陷入 含层的连接权值,β:=[Ba,B2,…,Bm]',Bm为第i 局部极值的问题.因此,为了解决这一问题,提高算 个隐含层与第m个输出层的连接权值,b:为第i个 法的收敛速度,本文采用了一种改进的粒子群算法, 隐含层神经元的偏差
工程科学学报,第 41 卷,第 8 期 群算法是一种基于迭代的优化算法[15] . 首先将系 统进行初始化,产生一组随机解,然后通过迭代搜寻 最优值. 但 PSO 没有 GA 所包含的交叉和变异操 作,而是粒子在解空间中通过追随当前搜寻到的最 优值来搜寻全局的最优值. 所以与 GA 相比,PSO 具 有调整参数少且简单易实现的优点. 目前已广泛应 用于函数优化、神经网络训练等多个领域. PSO 算法可以描述为:在一个 D 维搜索空间 中,一个种群由 s 个粒子组成,可由如下矩阵表示: Z = (Z1 ,Z2 ,…,Zs) (1) 第 i 个粒子的位置可以表示为: Zi = (Zi1 ,Zi2 ,…,ZiD) T (2) 其中,ZiD表示第 i 个粒子在第 D 维的位置. 根据所 设定的目标函数,可以计算出每个粒子在位置 Zi 时 所对应的适应度值. 第 i 个粒子的速度可以表示为: Vi = (Vi1 ,Vi2 ,…,ViD) T (3) 其中,ViD表示第 i 个粒子在第 D 维的速度. 随着每 一次的迭代进行,粒子都通过个体的最优值和全局 的最优值来更新自身的速度和位置,更新公式如下 式所示: V k + 1 id = 棕V k id + c1 r1 (P k id - Z k id ) + c2 r2 (P k jd - Z k id ) Z k + 1 id = Z k id + 琢V { k + 1 id (4) 式中:V k + 1 id 表示粒子 i 在第 k + 1 次迭代中第 d 维的 速度;Z k + 1 id 表示粒子 i 在第 k + 1 次迭代中第 d 维的 位置;k 为第 k 次迭代;棕 为惯性权重;d = 1,2,…, D;i = 1,2,…,s;c1 ,c2为学习因子;r1沂rand(0,1), r2沂rand(0,1);琢 为约束因子;P k id表示粒子 i 在第 d 维的个体极值点的位置;P k jd表示整个种群在第 d 维 的全局极值点的位置. 为防止粒子盲目搜索,一般 将粒子在第 d 维的位置变化范围限定在[ - Zmax, Zmax]内,速度变化范围限定在[ - Vmax,Vmax]内. 惯性权重系数 棕 的表达式为: 棕 = 棕max - k ( 棕max - 棕min ) N 伊 仔 4 , (k = 1, 2, … , N ) (5) 式中,棕max、棕min分别表示所设置的初始惯性权重系 数的最大值和结束迭代时惯性权重系数的最小值,k 为当前迭代次数,N 为最大迭代次数. PSO 通过迭代计算来确定粒子的全局最优值. 然而,粒子群算法在迭代寻优过程中存在容易陷入 局部极值的问题. 因此,为了解决这一问题,提高算 法的收敛速度,本文采用了一种改进的粒子群算法, 改进部分如下. (1)本文采用一种非线性权重方法来改善标准 粒子群算法的不足[16] ,这种算法可描述为: 棕 = 棕max - (棕max - 棕min ) 伊 tan ( k ) N 伊 仔 4 (6) 在当前迭代次数 k 较小时,棕 接近于 棕max保证 了算法的全局搜索能力;随着迭代次数 k 的增大,棕 以非线性递减,保证了算法的局部搜索能力,从而使 算法能灵活地调整全局搜索与局部搜索能力. (2)借鉴遗传算法的变异思想,给粒子群算法 加入“变异冶因子,使粒子每次更新之后,可以以一 定变异率初始化粒子,从而避免陷入局部极值,增大 搜索范围. 1郾 2 极限学习机算法 极限学习机是一种新型单隐层前馈型神经网 络[17鄄鄄18] . 典型的单隐层前馈神经网络结构如图 1 所示. 图 1 典型的单隐层前馈神经网络模型 Fig. 1 Typical single hidden layer feedforward neural network model 对于一个单隐层神经网络,假设任意 r 个不同 样本( xj,t j),其中,xj = [xj1 ,xj2 ,…,xjn ] T沂R n ,xjn表 示第 j 个样本第 n 个输入项;t j = [t j1 ,t j2 ,…,t jm ] T沂 R m ,t jm表示第 j 个样本第 m 个期望输出项;隐含层 节点 o 的个数为 l,设隐含层神经元的激活函数为 G(x),浊 为输入层与隐含层的连接权值向量,茁 为隐 含层与输出层的连接权值向量,则 ELM 模型数学表 达式如下式所示. Ym = 移 l i = 1 茁im G(浊i,bi,xj), (j = 1, 2, … , r) (7) 式中,Ym为网络的第 m 个输出层神经元的输出;G (浊i,bi,xj ) 为第 i 个隐含层神经元的输出; 浊i = [浊i1 ,浊i2 ,…,浊in ] T ,浊in表示第 n 个输入层与第 i 个隐 含层的连接权值,茁i = [茁i1 ,茁i2 ,…,茁im ] T ,茁im 为第 i 个隐含层与第 m 个输出层的连接权值,bi为第 i 个 隐含层神经元的偏差. ·1054·
张壮等:基于PSO-RELM转炉治炼终点锰含量预测模型 ·1055· 该模型在对样本训练前随机产生输入层与隐含 当A1+HH为非奇异矩阵时,求解式(11)得: 层的连接权值和隐含层神经元偏差,从而只需选择 B=(AI+HH)H't (12) 合适的隐含层神经元个数和激活函数,求出隐含层 式中,I为单位矩阵.网络的输出为: 与输出层的连接权值即可. Y=H耶=H(AI+HH)-Ht (13) 1.3正则化极限学习机算法 至此,将结构风险最小化理论和正则化系数引 虽然极限学习机具有设置参数少,操作简单,学 入到极限学习机中,构成了正则化极限学习机 习速度较快等优点,但也有以下不足 1.4改进粒子群优化正则化极限学习机算法 (1)极限学习机仅基于经验风险最小化原理, RELM模型虽然在ELM模型的基础上通过引 未考虑结构风险,因此当隐含层节点数目增多时可 入结构风险最小化理论提高了泛化能力,但在解决 能出现过拟合问题. 梯度下降问题时,由于RELM模型采用随机的输入 (2)极限学习机直接计算出输出层权值的最小 层权值和隐含层偏差,并不能保证训练出的ELM 二乘解,不会根据数据集的具体情况进行调整,所以 模型达到最优,因此需要更多的隐含层节点才能达 ELM模型的可控性不足 到理想的精度,从而导致收敛速度慢、预测效率低和 为了克服以上不足,增强ELM模型的泛化能 稳定性差等问题.而粒子群优化算法s)(particle 力,在极限学习机中引入结构风险和正则化系数入, swarm optimization,PS0)具有设置参数少、预测精度 通过参数入来调节结构风险与经验风险的比例,以 高、收敛速度快等优点.本文通过分析粒子群优化 改善ELM模型的过拟合问题,并提高ELM的泛化 算法的原理,并将其进行了改进,针对RELM模型 性能[],有学者通过该方法建模并取得了较为理想 输入层权值和隐含层偏差随机给定的问题,提出了 的预测效果[2o).RELM数学模型表述为: 基于PSO-RELM算法的转炉冶炼终点锰含量预测 目标函数: 模型,即将RELM模型的输入层权值和隐含层偏差 minE=min(入‖B2I+‖e2‖) (8) 作为改进粒子群算法的粒子,用改进粒子群优化算 受限制于: 法对其进行寻优,并将训练集的预测值与实际值的 均方误差(MSE)作为适应度函数,以提高RELM算 Bfn+b)-5=号 法的预测准确率与效率,改善RELM的性能.其中, (0=1,2,…,r) (9) MSE计算公式如下: 式中:E代表极限学习机的风险总和:入‖B2川代表 sE=名(国-y (14) 结构风险;‖e2‖代表经验风险;入为正则化系数, 表示在实际风险中结构风险占的权衡比重;e:为训 式中:W为转炉冶炼终点Mn含量实测值;W为转 练误差和;r为样本数:样本(x):(x)是隐含层神 炉治炼终点Mn含量预测值:r为计算MSE的样 经元激活函数,第i个隐含层节点输出为f(ηx+ 本数 b:).由此构造拉格朗日方程得: PSO-RELM训练过程归纳如下: L(B,e,o)=AIB‖+‖e‖-σ(H邺-t-e) (1)初始化种群.初始的粒子群由RELM随机 (10) 产生的输入层权值矩阵和隐含层偏差矩阵组成.确 其中,0=[01,02,…,0,],0:∈R(i= 定种群规模P,将隐含层节点数设为,输入层神经 1,2,,…,r)为拉格朗日算子;H= 元数设为n,则粒子维度为U=l(n+1).选取学习 因子c和c2,将位置和速度限制在[-1,1]内,根据 「f(nx1+b)…fnx1+b) 式(4)更新粒子速度和位置. 表示隐含层输 (2)计算粒子适应度.使用RELM模型计算出 f(nxn+b)…fnxn+b,) 每个粒子的训练集均方误差(MSE),作为改进粒子 出矩阵.分别对式(10)中各个变量求偏导: 群优化算法的适应度值.经过多次测试,选取si函 (OL 2ABT =oH 数作为RELM隐含层的激活函数时效果最好. aB aL (3)寻找群体极值.将每次迭代后得到的适应 +2e+w=0 (11) de 度值MSE分别和粒子的个体极值、群体极值进行比 aL 较,如果该适应度值更小,则将该适应度值作为新的 do →H邺-t-e=0 个体极值和群体极值.重复上述过程到迭代结束
张 壮等: 基于 IPSO鄄鄄RELM 转炉冶炼终点锰含量预测模型 该模型在对样本训练前随机产生输入层与隐含 层的连接权值和隐含层神经元偏差,从而只需选择 合适的隐含层神经元个数和激活函数,求出隐含层 与输出层的连接权值即可. 1郾 3 正则化极限学习机算法 虽然极限学习机具有设置参数少,操作简单,学 习速度较快等优点,但也有以下不足. (1)极限学习机仅基于经验风险最小化原理, 未考虑结构风险,因此当隐含层节点数目增多时可 能出现过拟合问题. (2)极限学习机直接计算出输出层权值的最小 二乘解,不会根据数据集的具体情况进行调整,所以 ELM 模型的可控性不足. 为了克服以上不足,增强 ELM 模型的泛化能 力,在极限学习机中引入结构风险和正则化系数 姿, 通过参数 姿 来调节结构风险与经验风险的比例,以 改善 ELM 模型的过拟合问题,并提高 ELM 的泛化 性能[19] ,有学者通过该方法建模并取得了较为理想 的预测效果[20] . RELM 数学模型表述为: 目标函数: min E = min 茁 (姿椰茁 2椰 + 椰着 2椰) (8) 受限制于: 移 l i = 1 茁i f(浊ixj + bi) - t j = 着j (j = 1,2,…,r) (9) 式中:E 代表极限学习机的风险总和;姿椰茁 2椰代表 结构风险;椰着 2椰代表经验风险;姿 为正则化系数, 表示在实际风险中结构风险占的权衡比重;着j 为训 练误差和;r 为样本数;样本(xj,t j);f(x)是隐含层神 经元激活函数,第 i 个隐含层节点输出为 f(浊ixj + bi). 由此构造拉格朗日方程得: L(茁,着,滓) = 姿椰茁 2椰 + 椰着 2椰 - 滓(H茁 - t j - 着) (10) 其 中 , 滓 = [ 滓 1 , 滓 2 , … , 滓 r ] , 滓 i 沂 R ( i = 1 , 2 , … , r ) 为 拉 格 朗 日 算 子 ; H = f(浊1 x1 + b1 ) … f(浊lx1 + bl) 左 左 f(浊1 xn + b1 ) … f(浊lxn + bl é ë ê ê ê ù û ú ú ú ) n 伊 l ,表示隐含层输 出矩阵. 分别对式(10)中各个变量求偏导: 鄣L 鄣茁 寅2姿茁 T = 滓H 鄣L 鄣着 寅2着 T + 滓 = 0 鄣L 鄣滓 寅H茁 - t j - 着 ì î í ï ï ï ï ï ï = 0 (11) 当 姿I + H TH 为非奇异矩阵时,求解式(11)得: ^茁 = (姿I + H TH) - 1H T t j (12) 式中,I 为单位矩阵. 网络的输出为: Y = H ^茁 = H(姿I + H TH) - 1H T t j (13) 至此,将结构风险最小化理论和正则化系数引 入到极限学习机中,构成了正则化极限学习机. 1郾 4 改进粒子群优化正则化极限学习机算法 RELM 模型虽然在 ELM 模型的基础上通过引 入结构风险最小化理论提高了泛化能力,但在解决 梯度下降问题时,由于 RELM 模型采用随机的输入 层权值和隐含层偏差,并不能保证训练出的 RELM 模型达到最优,因此需要更多的隐含层节点才能达 到理想的精度,从而导致收敛速度慢、预测效率低和 稳定性差等问题. 而粒子群优化算法[15] ( particle swarm optimization,PSO)具有设置参数少、预测精度 高、收敛速度快等优点. 本文通过分析粒子群优化 算法的原理,并将其进行了改进,针对 RELM 模型 输入层权值和隐含层偏差随机给定的问题,提出了 基于 IPSO鄄鄄RELM 算法的转炉冶炼终点锰含量预测 模型,即将 RELM 模型的输入层权值和隐含层偏差 作为改进粒子群算法的粒子,用改进粒子群优化算 法对其进行寻优,并将训练集的预测值与实际值的 均方误差(MSE)作为适应度函数,以提高 RELM 算 法的预测准确率与效率,改善 RELM 的性能. 其中, MSE 计算公式如下: MSE = 1 r 移 r j = 1 (Wj - W忆j) 2 (14) 式中:Wj 为转炉冶炼终点 Mn 含量实测值; W忆j 为转 炉冶炼终点 Mn 含量预测值; r 为计算 MSE 的样 本数. IPSO鄄鄄RELM 训练过程归纳如下: (1)初始化种群. 初始的粒子群由 RELM 随机 产生的输入层权值矩阵和隐含层偏差矩阵组成. 确 定种群规模 P,将隐含层节点数设为 l,输入层神经 元数设为 n,则粒子维度为 U = l( n + 1). 选取学习 因子 c1和 c2 ,将位置和速度限制在[ - 1,1]内,根据 式(4)更新粒子速度和位置. (2)计算粒子适应度. 使用 RELM 模型计算出 每个粒子的训练集均方误差(MSE),作为改进粒子 群优化算法的适应度值. 经过多次测试,选取 sin 函 数作为 RELM 隐含层的激活函数时效果最好. (3)寻找群体极值. 将每次迭代后得到的适应 度值 MSE 分别和粒子的个体极值、群体极值进行比 较,如果该适应度值更小,则将该适应度值作为新的 个体极值和群体极值. 重复上述过程到迭代结束, ·1055·
·1056· 工程科学学报,第41卷,第8期 可以获得一组较优的输入层权值矩阵和隐含层偏差 分析,计算出各影响因素与终点锰含量的皮尔逊 矩阵. (Pearson)相关系数,分析结果如表1. (4)模型训练与测试.将通过上述寻优过程得 表1转炉终点锰含量影响因素的皮尔逊相关系数 到输入层权值矩阵和隐含层偏差矩阵带入到RELM Table 1 Pearson correlation coefficients of process parameters in the 模型中,代入数据进行训练和测试. prediction of end-point manganese content for BOF Pearson Pearson 2模型的建立与讨论 变量 变量 相关系数 相关系数 为了提高转炉冶炼终点锰含量的预测精度,结 化渣剂加入量 -0.545 铁水S质量分数 -0.231" 合以上算法,作者以国内某钢厂80t转炉生产数据 废钢装人量 0.376 铁水温度 0.231" 为建模样本,对转炉冶炼终点锰含量预测模型进行 铁水Mn质量分数 0.371" 铁水P质量分数 0.217" 了研究,分别建立了基于ELM转炉冶炼终点锰含量 石灰加入量 0.288 氧耗量 0.201" 预测模型、基于RELM终点锰含量预测模型和基于 轻烧白云石加入量 0.256" 铁水加入量 0.193" PSO-RELM终点锰含量预测模型,并与基于经典的 注:*表示变量与终点锰含量在0.01水平上显著相关:*表示 BP神经网络模型的预测结果进行比较分析,以期获 变量与终点锰含量在0.05水平上显著相关. 得一种性能最优的转炉冶炼终点锰含量预测模型. 相关性的大小与皮尔逊系数绝对值的大小成正 下文以PSO-ELM模型为例介绍模型的建立过程. 比,基于此,表1按照对终点锰含量的影响大小排列 2.1PSO-RELM模型的建立 十个因素.由表1可知,以上十个变量均与转炉冶 要建立转炉冶炼终点锰含量PSO-RELM预测 炼终点锰含量在0.01水平上显著相关,因此,将以 模型,需确定该模型的输入变量.为此,作者分析了 上十个终点锰含量影响因素作为IPSO-RELM预测 转炉冶炼过程中不同工艺参数对终点锰成分的影 模型的输入变量,转炉冶炼终点锰含量作为输出变 响,利用SPSS统计分析软件对冶炼现场获得的终点 量,模型含有一个隐含层,RELM模型的拓扑结构如 锰含量数据项和其他工艺参数数据项进行了相关性 图2所示. 输入层 中间层 输出层 铁水的装人量 铁水的温度℃ 铁水P质量分数/% 铁水Mn质量分数% 终点钢水Mn 质量分数/% 铁水S质量分数% 物 废钢的加人量:,( 氧耗量(标祝)/m3 石灰的加入量g, 轻烧白云石的加入量kg 化渣剂的加入量kg 图2RELM模型拓扑结构图 Fig.2 Structural diagram of RELM model 为避免模型的各输入项数据因为大小相差悬殊 量;min(xn)、max(xn)分别为原始数据样本中的最 而影响模型的收敛速度和预测精度,需要对建模的 小值和最大值. 数据进行归一化处理2】.将作为模型输入项和输 对某钢厂采集到的80t转炉生产数据进行预处 出项的原始数据按公式(15)全部映射到[-1,+1] 理后(删除离散数据、异常数据和重复数据,对缺失 范围内 的数据进行填补),得到了331组生产数据.建立的 x加-min((xm) PSO-RELM模型以该331组生产数据为样本,且模 (15) max(xn)-min(xn) 型的仿真在Matlab软件环境下实现.首先,随机选 式中:x为数据样本的原始数据:x。为归一化处理后 取其中的281组样本数据对预测模型进行训练:其 的数据:j表示第j个样本点:n表示第n个输入变 次利用训练好的模型对其余的50组测试数据进行
工程科学学报,第 41 卷,第 8 期 可以获得一组较优的输入层权值矩阵和隐含层偏差 矩阵. (4)模型训练与测试. 将通过上述寻优过程得 到输入层权值矩阵和隐含层偏差矩阵带入到 RELM 模型中,代入数据进行训练和测试. 2 模型的建立与讨论 为了提高转炉冶炼终点锰含量的预测精度,结 合以上算法,作者以国内某钢厂 80 t 转炉生产数据 为建模样本,对转炉冶炼终点锰含量预测模型进行 了研究,分别建立了基于 ELM 转炉冶炼终点锰含量 预测模型、基于 RELM 终点锰含量预测模型和基于 IPSO鄄鄄RELM 终点锰含量预测模型,并与基于经典的 BP 神经网络模型的预测结果进行比较分析,以期获 得一种性能最优的转炉冶炼终点锰含量预测模型. 下文以 IPSO鄄鄄RELM 模型为例介绍模型的建立过程. 2郾 1 IPSO鄄鄄RELM 模型的建立 要建立转炉冶炼终点锰含量 IPSO鄄鄄 RELM 预测 模型,需确定该模型的输入变量. 为此,作者分析了 转炉冶炼过程中不同工艺参数对终点锰成分的影 响,利用 SPSS 统计分析软件对冶炼现场获得的终点 锰含量数据项和其他工艺参数数据项进行了相关性 分析,计算出各影响因素与终点锰含量的皮尔逊 (Pearson)相关系数,分析结果如表 1. 表 1 转炉终点锰含量影响因素的皮尔逊相关系数 Table 1 Pearson correlation coefficients of process parameters in the prediction of end鄄point manganese content for BOF 变量 Pearson 相关系数 变量 Pearson 相关系数 化渣剂加入量 - 0郾 545 ** 铁水 S 质量分数 - 0郾 231 ** 废钢装入量 0郾 376 ** 铁水温度 0郾 231 ** 铁水 Mn 质量分数 0郾 371 ** 铁水 P 质量分数 0郾 217 ** 石灰加入量 0郾 288 ** 氧耗量 0郾 201 ** 轻烧白云石加入量 0郾 256 ** 铁水加入量 0郾 193 ** 注:**表示变量与终点锰含量在 0郾 01 水平上显著相关;*表示 变量与终点锰含量在 0郾 05 水平上显著相关. 相关性的大小与皮尔逊系数绝对值的大小成正 比,基于此,表 1 按照对终点锰含量的影响大小排列 十个因素. 由表 1 可知,以上十个变量均与转炉冶 炼终点锰含量在 0郾 01 水平上显著相关,因此,将以 上十个终点锰含量影响因素作为 IPSO鄄鄄RELM 预测 模型的输入变量,转炉冶炼终点锰含量作为输出变 量,模型含有一个隐含层,RELM 模型的拓扑结构如 图 2 所示. 图 2 RELM 模型拓扑结构图 Fig. 2 Structural diagram of RELM model 为避免模型的各输入项数据因为大小相差悬殊 而影响模型的收敛速度和预测精度,需要对建模的 数据进行归一化处理[21] . 将作为模型输入项和输 出项的原始数据按公式(15)全部映射到[ - 1, + 1] 范围内. x忆jn = xjn - min (xjn ) max (xjn ) - min (xjn ) (15) 式中:xjn为数据样本的原始数据;x忆jn为归一化处理后 的数据;j 表示第 j 个样本点;n 表示第 n 个输入变 量;min (xjn )、max (xjn )分别为原始数据样本中的最 小值和最大值. 对某钢厂采集到的 80 t 转炉生产数据进行预处 理后(删除离散数据、异常数据和重复数据,对缺失 的数据进行填补),得到了 331 组生产数据. 建立的 IPSO鄄鄄RELM 模型以该 331 组生产数据为样本,且模 型的仿真在 Matlab 软件环境下实现. 首先,随机选 取其中的 281 组样本数据对预测模型进行训练;其 次利用训练好的模型对其余的 50 组测试数据进行 ·1056·
张壮等:基于PSO-RELM转炉治炼终点锰含量预测模型 ·1057· 预测:最后,通过比较不同网络结构参数下终点锰含 差范围为±0.025%的命中率作为模型性能评价标 量的预测精度,选择预测精度最高的网络进行保存 准,其中,拟合优度R的数学表达式为: 经过大量的调整模型参数实验后发现,当PS0- RELM模型选用如表2所示的网络结构参数时,模 R2=1- (-y,)2 (16) ∑(,-,)2 型的预测效果最佳 式中:t,(q=1,2,3,…,e)为模型的期望输出值;Y。 表2PSO-RELM模型的基本参数 (g=1,2,3,…,e)为模型的实际输出值;t,(q=1,2, Table 2 Fundamental parameters of IPSO-RELM model 3,…,e)为期望输出的平均值;e为测试数据的样本 参数名称 设置值 参数名称 设置值 组数 输入层节点 10 输出层节点 1 拟合优度的取值范围在[0,1]之间,R越接近1,表 隐含层数 1 种群规模,P 20 示模型输入变量与输出变量之间的相关程度越高,模 隐含层节点数 20 迭代次数,N 50 型的预测精度越高:反之则模型的预测精度就越差 学习因子,4 2.8 最大权重系数,仙a 1.2 这里构建的BP神经网络模型、ELM模型和 学习因子,92 1.2 最小权重系数,@ 0.4 RELM模型都选用含有一个隐含层的3层网络结 构.其中,BP神经网络模型隐含层节点数设为6,隐 2.2四种模型预测结果分析 含层神经元的激活函数选用tansig函数和purelin函 利用50组测试数据对上述已训练好的网络进 数,训练函数选用trainlm函数,模型的训练目标设 行测试,并将PSO-RELM模型的预测值与实测值 定为O.OO01;ELM模型和RELM模型的隐含层节点 进行对比分析.为了更好地验证本模型的算法性 数选用20,激活函数选择sigmoid函数,采用随机的 能,采用相同的实验数据,对本文建立的基于PS0- 输入权值和隐含层偏差, RELM转炉冶炼终点锰含量预测模型与基于BP神 Matlab仿真软件运行后,四种模型预测的结果 经网络、ELM模型和RELM模型的预测结果进行比 见图3~图5和表3.图3显示的是四种模型锰含 较分析,以均方误差(MSE)、拟合优度R2[2]以及误 量预测值与实测值的比较情况,图4显示的是四种 (a) 0.24 ◆一实测值 0.24b ◆一实测值 OBP预测值 OELM预测值 0.22 0.22 0.20 0.20 0.18 0.18 0.16 0.16 0.14 0.14 0.12 0.12 0.10 0.10 10 30 40 30 炉次 炉次 ◆一实测值 (d) 0.24 0.24 ◆一实测值 O RELM预测值 o,PS0-RELM预测值 0.22 0.22 ◆ 0.20 020 0.18 0.18 0.16 0.16 0.14 0.14 0.12 0.12 0.10 0.10 20. 30 40 50 20 30 40 50 炉次 炉次 图3锰含量预测值与实测值的比较.(a)BP:(b)ELM:(c)RELM:(d)PSO-RELM Fig.3 Comparison of predicted and observed end-point manganese contents:(a)BP:(b)ELM;(c)RELM:(d)IPSO-RELM
张 壮等: 基于 IPSO鄄鄄RELM 转炉冶炼终点锰含量预测模型 预测;最后,通过比较不同网络结构参数下终点锰含 量的预测精度,选择预测精度最高的网络进行保存. 经过大量的调整模型参数实验后发现,当 IPSO鄄鄄 RELM 模型选用如表 2 所示的网络结构参数时,模 型的预测效果最佳. 表 2 IPSO鄄鄄RELM 模型的基本参数 Table 2 Fundamental parameters of IPSO鄄鄄RELM model 参数名称 设置值 参数名称 设置值 输入层节点 10 输出层节点 1 隐含层数 1 种群规模,P 20 隐含层节点数 20 迭代次数,N 50 学习因子,c1 2郾 8 最大权重系数,棕max 1郾 2 学习因子,c2 1郾 2 最小权重系数,棕min 0郾 4 图 3 锰含量预测值与实测值的比较. (a) BP; (b) ELM; (c) RELM; (d) IPSO鄄鄄RELM Fig. 3 Comparison of predicted and observed end鄄point manganese contents: (a) BP; (b) ELM; (c) RELM; (d) IPSO鄄鄄RELM 2郾 2 四种模型预测结果分析 利用 50 组测试数据对上述已训练好的网络进 行测试,并将 IPSO鄄鄄 RELM 模型的预测值与实测值 进行对比分析. 为了更好地验证本模型的算法性 能,采用相同的实验数据,对本文建立的基于 IPSO鄄鄄 RELM 转炉冶炼终点锰含量预测模型与基于 BP 神 经网络、ELM 模型和 RELM 模型的预测结果进行比 较分析,以均方误差(MSE)、拟合优度 R 2 [22] 以及误 差范围为 依 0郾 025% 的命中率作为模型性能评价标 准,其中,拟合优度 R 2的数学表达式为: R 2 = 1 - 移 (t q - Yq) 2 移 (t q - t q) 2 (16) 式中:t q(q = 1,2,3,…,e) 为模型的期望输出值;Yq (q = 1,2,3,…,e)为模型的实际输出值;t q(q = 1,2, 3,…,e)为期望输出的平均值;e 为测试数据的样本 组数. 拟合优度的取值范围在[0,1]之间,R 2越接近1,表 示模型输入变量与输出变量之间的相关程度越高,模 型的预测精度越高;反之则模型的预测精度就越差. 这里构建的 BP 神经网络模型、 ELM 模型和 RELM 模型都选用含有一个隐含层的 3 层网络结 构. 其中,BP 神经网络模型隐含层节点数设为 6,隐 含层神经元的激活函数选用 tansig 函数和 purelin 函 数,训练函数选用 trainlm 函数,模型的训练目标设 定为 0郾 0001;ELM 模型和 RELM 模型的隐含层节点 数选用 20,激活函数选择 sigmoid 函数,采用随机的 输入权值和隐含层偏差. Matlab 仿真软件运行后,四种模型预测的结果 见图 3 ~ 图 5 和表 3. 图 3 显示的是四种模型锰含 量预测值与实测值的比较情况,图 4 显示的是四种 ·1057·
·1058· 工程科学学报,第41卷,第8期 (a) 命中率为78% 12 b 命中率为84% ±0.025% ±0.025% 10 6 0.05-0.03-0.010.010.030.050.07 -0.04-0.03-0.02-0.0100.010.020.030.04 终点锰含量预测误差慨 终,点锰含量预测误差% 12 12 (c) d 命中率为88% 命中率为94% 10 ±0.025% 10 ±0.025% 8 6 -0.04-0.03-0.02-0.0100.010.020.03 -0.03-0.02-0.010 0.010.02 终点锰含量预测误差% 终点锰含量预测误差/% 图4锰含量预测误差的分布.(a)BP:(b)ELM:(c)RELM:(d)PSO-RELM Fig.4 Distribution of prediction errors of end-point manganese content:(a)BP;(b)ELM;(c)RELM;(d)IPSO-RELM 模型锰含量预测误差的频数分布. 0.08 一☑-BP神经网络模型预测误差 由图3(a)可以看出,BP的预测效果较差,锰含 ELM模型预测误差 0.06 REIM模型预测误差 量预测值与实测值之间存在较大的误差,图4(a)给 ★一PSO-RELM模型预测误差 0.04 出了BP模型锰含量预测误差的频数分布,由图4 (a)可以得出,转炉终点锰含量预测误差主要分布 0.02 在±0.05%范围内.其中,预测误差分布在 0/ ±0.025%范围内的组数为39,占总测试样本数据 0.02。 的78%:结合图3(a)和图4(a)可知,该BP神经网 络模型对转炉冶炼终点锰含量的预测命中率不理想, -0.04 模型的拟合度偏低,且某些炉次的预测误差较大 0.06 20 30 40 50 从图3(b)可以看出,ELM模型锰含量预测值 炉次 与实测值较为接近,即ELM模型对转炉冶炼终点锰 图5四种模型锰含量预测误差的比较 含量的预测精度较高.图4(b)显示的是ELM对转 Fig.5 Comparison of prediction errors of four models 炉冶炼终点锰含量进行预测后其误差的分布情况. 限学习机后,提高了模型的预测精度和泛化能力 由图4(b)可知,ELM模型预测误差主要分布在± 由图3(d)可知,PSO-RELM模型对转炉冶炼 0.03%范围内,且锰含量预测误差在±0.025%范围 终点锰含量进行预测后所得的预测值与实测值的总 内时,模型的预测精度为84%:与BP神经网络预测 体趋势一致,关于该模型的预测误差频数分布情况 模型相比,ELM模型在转炉冶炼终点锰含量预测精 如图4(d)所示,从4(d)可以看出,除了三组测试数 度方面有了明显的提高 据误差偏大,其余47组测试数据都分布在 从图3(c)和图4(c)可以看到,当预测误差在 ±0.025%范围内,该模型的命中率高达94%,明显 ±0.025%范围内时,RELM模型的预测精度为 高于其他三个锰含量预测模型 88%,与ELM模型相比,RELM模型的预测精度明 图5显示的是上述四种模型终点锰含量预测误 显提高,这是因为将结构风险最小化原理引入到极 差的比较情况,从图中可以看出,PSO-RELM预测
工程科学学报,第 41 卷,第 8 期 图 4 锰含量预测误差的分布. (a) BP; (b) ELM; (c) RELM; (d) IPSO鄄鄄RELM Fig. 4 Distribution of prediction errors of end鄄point manganese content: (a) BP; (b) ELM; (c) RELM; (d) IPSO鄄鄄RELM 模型锰含量预测误差的频数分布. 由图 3(a)可以看出,BP 的预测效果较差,锰含 量预测值与实测值之间存在较大的误差,图 4(a)给 出了 BP 模型锰含量预测误差的频数分布,由图 4 (a)可以得出,转炉终点锰含量预测误差主要分布 在 依 0郾 05% 范 围 内. 其 中, 预 测 误 差 分 布 在 依 0郾 025% 范围内的组数为 39,占总测试样本数据 的 78% ;结合图 3(a)和图 4(a)可知,该 BP 神经网 络模型对转炉冶炼终点锰含量的预测命中率不理想, 模型的拟合度偏低,且某些炉次的预测误差较大. 从图 3( b) 可以看出,ELM 模型锰含量预测值 与实测值较为接近,即 ELM 模型对转炉冶炼终点锰 含量的预测精度较高. 图 4(b)显示的是 ELM 对转 炉冶炼终点锰含量进行预测后其误差的分布情况. 由图 4(b) 可知,ELM 模型预测误差主要分布在 依 0郾 03% 范围内,且锰含量预测误差在 依 0郾 025% 范围 内时,模型的预测精度为 84% ;与 BP 神经网络预测 模型相比,ELM 模型在转炉冶炼终点锰含量预测精 度方面有了明显的提高. 从图 3(c)和图 4( c)可以看到,当预测误差在 依 0郾 025% 范 围 内 时, RELM 模 型 的 预 测 精 度 为 88% ,与 ELM 模型相比,RELM 模型的预测精度明 显提高,这是因为将结构风险最小化原理引入到极 图 5 四种模型锰含量预测误差的比较 Fig. 5 Comparison of prediction errors of four models 限学习机后,提高了模型的预测精度和泛化能力. 由图 3(d)可知,IPSO鄄鄄 RELM 模型对转炉冶炼 终点锰含量进行预测后所得的预测值与实测值的总 体趋势一致,关于该模型的预测误差频数分布情况 如图 4(d)所示,从 4(d)可以看出,除了三组测试数 据误 差 偏 大, 其 余 47 组 测 试 数 据 都 分 布 在 依 0郾 025% 范围内,该模型的命中率高达 94% ,明显 高于其他三个锰含量预测模型. 图 5 显示的是上述四种模型终点锰含量预测误 差的比较情况,从图中可以看出,IPSO鄄鄄 RELM 预测 ·1058·
张壮等:基于PSO-RELM转炉治炼终点锰含量预测模型 ·1059· 模型的预测误差最小,B神经网络模型的预测误差 参考文献 最大.从表3可以看出,这四种预测模型中,PSO- [1]Takawa T,Katayama K,Hoteiya M,et al.Mathematical model of RELM模型的均方误差最小,为2.18×10-8,模型的 end point control for the top and bottom blowing process in BOF. Tmns1SJ,1987,27(12):951 拟合优度最大,为0.72:结合表3以及上述预测 [2]He F,He D F,Xu A J,et al.Hybridmodel of molten steel tem- 误差分析可以看出,四种转炉冶炼终点锰含量预测 perature prediction based on ladle heat status and artificial neural 模型中,PSO-RELM模型的预测精度最高,泛化性 network.J Iron Steel Res Int,2014,21(2):181 能最强,利用该模型对转炉冶炼终点锰含量进行预 [3]Wang H B,Cai J,Feng K.Predicting theendpoint phosphorus 测所得的结果更可靠,可为实际转炉炼钢终点成分 content of molten steel in BOF by two-stage hybrid method.J fron Steel Res Int,2014,21(Suppl 1):65 精确控制提供重要参考 [4]Cox I J,Lewis R W,Ransing R S,et al.Application of neural 表34种算法性能比较 computing in basic oxygen steelmaking.I Mater Process Technol, Table 3 Comparison of performances of four kinds of algorithms 2002,120(1-3):310 [5]Zhang G Y,Wan X F,Lin D,et al.Carbon content and tempera- 均方误差, 误差±0.025% 模型 R2 ture variation of bath based on exhaust gas analysis.fron Steel MSE/10-8 命中率 Res,2006,18(11):56 BP 3.49 0.49 0.78 (张贵玉,万雪峰,林东,等.基于炉气分析的熔池碳含量及 ELM 2.71 0.65 0.84 温度变化研究.钢铁研究学报,2006,18(11):56) RELM 2.64 0.66 0.88 [6]Takawa T,Sato M,Okada T,et al.Development of automatic IPSO-RELM 2.18 0.72 0.94 blowing technique in BOF based on a mathematical model.Tetsu- to-Hagane,1988,74(4):664 (高輸武志,佐藤光信,岡田刚,等.数式毛デ儿仁上名耘炉自 3结论 動吹辣技衔)開凳.铁上鲫,1988,74(4):664) [7]Yang L H,Liu L,He P.[Mn]prediction model for melt in ox- (1)根据冶金基本原理,结合相关性分析确定 ygen converter.Steelmaking,2003,19(1):10 了与转炉冶炼终点锰含量相关的十个因素,将其作 (杨立红,刘浏,何平。转炉冶炼终点锰成分的预报模型.炼 为模型的输入变量,终点锰含量作为输出变量,建立 钢.2003,19(1):10) 了基于ELM的转炉冶炼终点锰含量预测模型.预 [8]Liu K,Liu L,He P.Endpoint phosphorus and manganese content 测误差在±0.025%范围内的命中率为84%,均方 control model based on sublance technique and optimization of de- phosphorization process.fron Steel,2008,43(7):32 误差为2.71×10-8,R2为0.65 (刘锟,刘浏,何平.基于副枪的转炉终点磷锰控制模型与脱 (2)通过引入结构风险最小化理论建立的正则 磷优化.钢铁,2008,43(7):32) 化极限学习机RELM模型,对转炉冶炼终点锰含量 [9] Wang Z,Chang J,Ju Q P,et al.Predictionmodel of end-point 进行预测,预测准确率相对于ELM模型有所提升. manganese content for BOF steelmaking process.IS//Int,2012, 52(9):1585 预测误差在±0.025%范围内的命中率为88%,均 [10]Huang G B.Zhu Q Y,Siew C K.Extreme learning machine: 方误差为2.64×10-8,R2为0.66. Theory and applications.Neurocomputing,2006,70(1-3):489 (3)为减小正则化极限学习机参数选择的随机 [11]Zhao QQ,Hou B L.Parameter identification of a shell transfer 性对模型精度及泛化性能的影响,将正则化极限学 arm using FDA and optimized ELM.Chin J Eng,2017,39(4): 习机结合改进的粒子群优化算法,对隐含层节点参 611 (赵抢抢,侯保林.函数型数据分析与优化极限学习机结合 数进行寻优,建立了IPSO-RELM转炉冶炼终点锰 的弹药传输机械臂参数辨识.工程科学学报,2017,39(4): 含量预测模型.实验结果显示,模型预测误差在 611) ±0.025%范围内的命中率为94%,均方误差为2.18× [12]Deng W Y,Zheng Q H,Chen L.Regularizedextreme learing 10-8,R2为0.72 machine /IEEE Symposium on Computational Intelligence Data Mining.Nashville,2009:389 (4)通过将PSO-RELM预测模型的预测结果 [13]Xiong W T,Yu B J.Sun L.Improved particle swarm optimiza- 同ELM预测模型、RELM预测模型和BP神经网络 tion of rolling schedule on 420 mm 5-stand tandem cold strip 预测模型的预测结果进行比较,得出:本文构建的 mill.J Iron Steel Res,2014,26(11):25 (熊文涛,禹宝军,孙林.改进粒子群算法对1420mm五机架 PSO-RELM预测模型的预测精度最佳,泛化性能最 冷连轧机轧制规程的优化.钢铁研究学报,2014.26(11): 好,可较为精确地预测转炉冶炼终点锰含量,进而可 25) 为转炉炼钢实际生产精准控制提供一种重要参考. [14]Kennedy J,Eberhart R.Particle swarm optimization//Proceed-
张 壮等: 基于 IPSO鄄鄄RELM 转炉冶炼终点锰含量预测模型 模型的预测误差最小,BP 神经网络模型的预测误差 最大. 从表 3 可以看出,这四种预测模型中,IPSO鄄鄄 RELM 模型的均方误差最小,为 2郾 18 伊 10 - 8 ,模型的 拟合优度 R 2最大,为 0郾 72;结合表 3 以及上述预测 误差分析可以看出,四种转炉冶炼终点锰含量预测 模型中,IPSO鄄鄄RELM 模型的预测精度最高,泛化性 能最强,利用该模型对转炉冶炼终点锰含量进行预 测所得的结果更可靠,可为实际转炉炼钢终点成分 精确控制提供重要参考. 表 3 4 种算法性能比较 Table 3 Comparison of performances of four kinds of algorithms 模型 均方误差, MSE/ 10 - 8 R 2 误差 依 0郾 025% 命中率 BP 3郾 49 0郾 49 0郾 78 ELM 2郾 71 0郾 65 0郾 84 RELM 2郾 64 0郾 66 0郾 88 IPSO鄄鄄RELM 2郾 18 0郾 72 0郾 94 3 结论 (1)根据冶金基本原理,结合相关性分析确定 了与转炉冶炼终点锰含量相关的十个因素,将其作 为模型的输入变量,终点锰含量作为输出变量,建立 了基于 ELM 的转炉冶炼终点锰含量预测模型. 预 测误差在 依 0郾 025% 范围内的命中率为 84% ,均方 误差为 2郾 71 伊 10 - 8 ,R 2为 0郾 65. (2)通过引入结构风险最小化理论建立的正则 化极限学习机 RELM 模型,对转炉冶炼终点锰含量 进行预测,预测准确率相对于 ELM 模型有所提升. 预测误差在 依 0郾 025% 范围内的命中率为 88% ,均 方误差为 2郾 64 伊 10 - 8 ,R 2为 0郾 66. (3)为减小正则化极限学习机参数选择的随机 性对模型精度及泛化性能的影响,将正则化极限学 习机结合改进的粒子群优化算法,对隐含层节点参 数进行寻优,建立了 IPSO鄄鄄 RELM 转炉冶炼终点锰 含量预测模型. 实验结果显示,模型预测误差在 依0郾 025%范围内的命中率为94%,均方误差为 2郾 18 伊 10 - 8 ,R 2为 0郾 72. (4)通过将 IPSO鄄鄄 RELM 预测模型的预测结果 同 ELM 预测模型、RELM 预测模型和 BP 神经网络 预测模型的预测结果进行比较,得出:本文构建的 IPSO鄄鄄RELM 预测模型的预测精度最佳,泛化性能最 好,可较为精确地预测转炉冶炼终点锰含量,进而可 为转炉炼钢实际生产精准控制提供一种重要参考. 参 考 文 献 [1] Takawa T, Katayama K, Hoteiya M, et al. Mathematical model of end point control for the top and bottom blowing process in BOF. Trans ISIJ, 1987, 27(12): 951 [2] He F, He D F, Xu A J, et al. Hybridmodel of molten steel tem鄄 perature prediction based on ladle heat status and artificial neural network. J Iron Steel Res Int, 2014, 21(2): 181 [3] Wang H B, Cai J, Feng K. Predicting theendpoint phosphorus content of molten steel in BOF by two鄄stage hybrid method. J Iron Steel Res Int, 2014, 21(Suppl 1): 65 [4] Cox I J, Lewis R W, Ransing R S, et al. Application of neural computing in basic oxygen steelmaking. J Mater Process Technol, 2002, 120(1鄄3): 310 [5] Zhang G Y, Wan X F,Lin D, et al. Carbon content and tempera鄄 ture variation of bath based on exhaust gas analysis. J Iron Steel Res, 2006, 18(11): 56 (张贵玉, 万雪峰, 林东, 等. 基于炉气分析的熔池碳含量及 温度变化研究. 钢铁研究学报, 2006, 18(11): 56) [6] Takawa T, Sato M, Okada T, et al. Development of automatic blowing technique in BOF based on a mathematical model. Tetsu鄄 to鄄Hagane, 1988, 74(4): 664 (高輪武志,佐藤光信,岡田剛,等. 数式肘智蛛账砧针転炉自 動吹錬技術瘴開発. 鉄杖鋼, 1988, 74(4): 664) [7] Yang L H, Liu L, He P. [Mn] ep prediction model for melt in ox鄄 ygen converter. Steelmaking, 2003, 19(1): 10 (杨立红, 刘浏, 何平. 转炉冶炼终点锰成分的预报模型. 炼 钢, 2003, 19(1): 10) [8] Liu K, Liu L, He P. Endpoint phosphorus and manganese content control model based on sublance technique and optimization of de鄄 phosphorization process. Iron Steel, 2008, 43(7): 32 (刘锟, 刘浏, 何平. 基于副枪的转炉终点磷锰控制模型与脱 磷优化. 钢铁, 2008, 43(7): 32) [9] Wang Z, Chang J, Ju Q P, et al. Predictionmodel of end鄄point manganese content for BOF steelmaking process. ISIJ Int, 2012, 52(9): 1585 [10] Huang G B, Zhu Q Y, Siew C K. Extreme learning machine: Theory and applications. Neurocomputing, 2006, 70(1鄄3): 489 [11] Zhao Q Q, Hou B L. Parameter identification of a shell transfer arm using FDA and optimized ELM. Chin J Eng, 2017, 39(4): 611 (赵抢抢, 侯保林. 函数型数据分析与优化极限学习机结合 的弹药传输机械臂参数辨识. 工程科学学报, 2017, 39(4): 611) [12] Deng W Y, Zheng Q H, Chen L. Regularizedextreme learning machine / / IEEE Symposium on Computational Intelligence & Data Mining. Nashville, 2009: 389 [13] Xiong W T, Yu B J, Sun L. Improved particle swarm optimiza鄄 tion of rolling schedule on 420 mm 5鄄stand tandem cold strip mill. J Iron Steel Res, 2014, 26(11): 25 (熊文涛, 禹宝军, 孙林. 改进粒子群算法对 1420mm 五机架 冷连轧机轧制规程的优化. 钢铁研究学报, 2014, 26 (11): 25) [14] Kennedy J, Eberhart R. Particle swarm optimization / / Proceed鄄 ·1059·
·1060· 工程科学学报,第41卷,第8期 ings of ICNN95-International Conference on Neural Netcorks. Chin J Eng,2018,40(7):815 Perth,1995:1942 (陈恒志,杨建平,卢新春,等.基于极限学习机(ELM)的连 [15]Li Q,Xu Y M,Zhang D Z,et al.Global path planning method 铸坯质量预测.工程科学学报,2018,40(7):815) for mobile robots based on the particle swarm algorithm.IUni [19]Na W B.Su Z W,Ji Y F.Research ofsingle well production pre- Sci Technol Beijing,2010,32(3):397 diction based on improved extreme learning machine.Appl Mech (李擎,徐银梅,张德政,等.基于粒子群算法的移动机器人 Mater,2013,333-335:1296 全局路径规划策路.北京科技大学学报,2010,32(3):397) [20]Martinez-Martinez J M,Escandell-Montero P,Soria-Olivas E,et [16]Tao HL.Study on Forecast of Raiheay Traffic Volume Based on al.Regularized extreme learning machine for regression prob- Hybrid Intelligent Algorithm Dissertation ]Lanzhou:Lanzhou lems.Neurocomputing,2011.74(17):3716 Jiaotong University,2012 [21]Hornik K,Stinchcombe M,White H.Multilayer feedforward net- (陶海龙.基于混合智能算法的铁路运量预测研究[学位论 works are universal approximators.Neural Netcorks,1989,2 文].兰州:兰州交通大学,2012) (5):359 [17]Bueno-Crespo A,Garcia-Laencina P J,Sancho-G6mez J L.Neu- [22]Du B,Lin Y.Development andapplication of an universal auto- ral architecture design based on extreme learning machine.Neu- matic modeling tools.Comput Technol Autom,2003,22(2): ral Nettorks,2013,48:19 103 [18]Chen HZ.Yang J P.Lu X C.et al.Quality prediction of the (杜斌,林云.通用智能自动建模软件开发与应用.计算技 continuous casting bloom based on the extreme learning machine. 术与自动化,2003.22(2):103)
工程科学学报,第 41 卷,第 8 期 ings of ICNN蒺 95—International Conference on Neural Networks. Perth, 1995: 1942 [15] Li Q, Xu Y M, Zhang D Z, et al. Global path planning method for mobile robots based on the particle swarm algorithm. J Univ Sci Technol Beijing, 2010, 32(3): 397 (李擎, 徐银梅, 张德政, 等. 基于粒子群算法的移动机器人 全局路径规划策略. 北京科技大学学报, 2010, 32(3): 397) [16] Tao H L. Study on Forecast of Railway Traffic Volume Based on Hybrid Intelligent Algorithm [ Dissertation]. Lanzhou: Lanzhou Jiaotong University, 2012 (陶海龙. 基于混合智能算法的铁路运量预测研究[学位论 文]. 兰州: 兰州交通大学, 2012) [17] Bueno鄄Crespo A, Garc侏a鄄Laencina P J, Sancho鄄G佼mez J L. Neu鄄 ral architecture design based on extreme learning machine. Neu鄄 ral Networks, 2013, 48: 19 [18] Chen H Z, Yang J P, Lu X C, et al. Quality prediction of the continuous casting bloom based on the extreme learning machine. Chin J Eng, 2018, 40(7): 815 (陈恒志, 杨建平, 卢新春, 等. 基于极限学习机(ELM)的连 铸坯质量预测. 工程科学学报, 2018, 40(7): 815) [19] Na W B, Su Z W, Ji Y F. Research ofsingle well production pre鄄 diction based on improved extreme learning machine. Appl Mech Mater, 2013, 333鄄335: 1296 [20] Mart侏nez鄄Mart侏nez J M, Escandell鄄Montero P, Soria鄄Olivas E, et al. Regularized extreme learning machine for regression prob鄄 lems. Neurocomputing, 2011, 74(17): 3716 [21] Hornik K, Stinchcombe M, White H. Multilayer feedforward net鄄 works are universal approximators. Neural Networks, 1989, 2 (5): 359 [22] Du B, Lin Y. Development andapplication of an universal auto鄄 matic modeling tools. Comput Technol Autom, 2003, 22 ( 2 ): 103 (杜斌, 林云. 通用智能自动建模软件开发与应用. 计算技 术与自动化, 2003, 22(2): 103) ·1060·