工程科学学报,第41卷,第1期:67-77,2019年1月 Chinese Journal of Engineering,Vol.41,No.I:67-77,January 2019 D0L:10.13374/j.issn2095-9389.2019.01.007;htp:/journals.ustb.edu.cm 种基于鲁棒随机向量函数链接网络的磨矿粒度集成 建模方法 李德鹏),代伟2)区,赵大勇3),黄罡),马小平 1)中国矿业大学信息与控制工程学院,徐州2211162)东北大学流程工业综合自动化国家重点实验室,沈阳110819 3)中国科学院沈阳自动化研究所,沈阳110016 ☒通信作者,E-mail:weidai@cumt.ed.cn 摘要作为磨矿过程的主要生产质量指标,磨矿粒度是实现磨矿过程闭环优化控制的关键.将磨矿粒度控制在一定范围内 能够提高选别作业的精矿品位和有用矿物的回收率,并减少有用矿物的金属流失,由于经济和技术上的限制,磨矿粒度的实 时测量难以实现.因此,磨矿粒度的在线估计显得尤为重要.然而,目前我国所处理的铁矿石大多数为性质不稳定的赤铁矿, 其矿浆颗粒存在磁团聚现象,所采集的数据存在大量异常值,使得利用数据建立的磨矿粒度模型存在较大误差.同时,传统前 馈神经网络在磨矿粒度数据建模过程中存在收敛速度慢、易于陷入局部最小值等缺点,且单一模型泛化性能较差,现有的集 成学习在异常值干扰下性能严重下降.因此,本文在改进的随机向量函数链接网络(random vector functional link networks,RV- FLN)的基础上,将Bagging算法与自适应加权数据融合技术相结合,提出一种基于鲁棒随机向量函数链接网络的集成建模方 法,用于磨矿粒度集成建模.所提方法首先通过基准回归问题进行了实验研究,然后采用磨矿工业实际数据进行验证,表明其 有效性 关键词磨矿粒度:随机向量函数链接网络:集成学习:鲁棒性:数据融合 分类号TP18 Grinding process particle size modeling method using robust RVFLN-based ensemble learning IDe-peng》,DAI Wei'.a)s,ZHA0Da-yomg》,HUANG Gang,MA Xiao-ping》 1)School of Information and Control Engineering,China University of Mining and Technology,Xuzhou 221116,China 2)State Key Laboratory of Synthetical Automation for Process Industries,Northeastern University,Shenyang 110819,China 3)Shenyang Institute of Automation,Chinese Academy of Sciences,Shenyang 110016,China Corresponding author,E-mail:weidai@cumt.edu.en ABSTRACT As a key production quality index of grinding process,particle size is of great importance to closed-loop optimization and control.This is because controlling particle within a proper range can improve the concentrate grade,enhance the recovery rate of useful minerals,and reduce the loss of metal in the sorting operation;thus,the particle size determines the overall performance of the grinding process.In fact,it is not easy to optimize or control the practical industrial process because the optimal operation largely de- pends on a good measurement of particle size of grinding process;however,it is difficult to realize the real-time measurement of particle size because of limitations of economy or technique.Employing soft sensor techniques is necessary to solve the problem of particle size estimation,which is particularly important for the actual grinding processes.Considering that soft sensors are applicable in many fields, 收稿日期:2018-07-07 基金项目:国家自然科学基金青年资助项目(61603393,61741318);江苏省自然科学基金青年基金资助项目(BK20160275):中国博士后科学 基金资助项目(2015M581885,2018T110571):流程工业综合自动化国家重点实验室开放课题资助项目(PAL-N201706):江苏省研究生科研与 实践创新计划资助项目(SJCX170524)
工程科学学报,第 41 卷,第 1 期:67鄄鄄77,2019 年 1 月 Chinese Journal of Engineering, Vol. 41, No. 1: 67鄄鄄77, January 2019 DOI: 10. 13374 / j. issn2095鄄鄄9389. 2019. 01. 007; http: / / journals. ustb. edu. cn 一种基于鲁棒随机向量函数链接网络的磨矿粒度集成 建模方法 李德鹏1) , 代 伟1,2) 苣 , 赵大勇3 ) , 黄 罡1) , 马小平1) 1) 中国矿业大学信息与控制工程学院, 徐州 221116 2) 东北大学流程工业综合自动化国家重点实验室, 沈阳 110819 3) 中国科学院沈阳自动化研究所, 沈阳 110016 苣 通信作者, E鄄mail: weidai@ cumt. edu. cn 摘 要 作为磨矿过程的主要生产质量指标,磨矿粒度是实现磨矿过程闭环优化控制的关键. 将磨矿粒度控制在一定范围内 能够提高选别作业的精矿品位和有用矿物的回收率,并减少有用矿物的金属流失. 由于经济和技术上的限制,磨矿粒度的实 时测量难以实现. 因此,磨矿粒度的在线估计显得尤为重要. 然而,目前我国所处理的铁矿石大多数为性质不稳定的赤铁矿, 其矿浆颗粒存在磁团聚现象,所采集的数据存在大量异常值,使得利用数据建立的磨矿粒度模型存在较大误差. 同时,传统前 馈神经网络在磨矿粒度数据建模过程中存在收敛速度慢、易于陷入局部最小值等缺点,且单一模型泛化性能较差,现有的集 成学习在异常值干扰下性能严重下降. 因此,本文在改进的随机向量函数链接网络(random vector functional link networks, RV鄄 FLN)的基础上,将 Bagging 算法与自适应加权数据融合技术相结合,提出一种基于鲁棒随机向量函数链接网络的集成建模方 法,用于磨矿粒度集成建模. 所提方法首先通过基准回归问题进行了实验研究,然后采用磨矿工业实际数据进行验证,表明其 有效性. 关键词 磨矿粒度; 随机向量函数链接网络; 集成学习; 鲁棒性; 数据融合 分类号 TP18 收稿日期: 2018鄄鄄07鄄鄄07 基金项目: 国家自然科学基金青年资助项目(61603393,61741318);江苏省自然科学基金青年基金资助项目(BK20160275);中国博士后科学 基金资助项目(2015M581885, 2018T110571);流程工业综合自动化国家重点实验室开放课题资助项目(PAL鄄N201706);江苏省研究生科研与 实践创新计划资助项目(SJCX17_0524) Grinding process particle size modeling method using robust RVFLN鄄based ensemble learning LI De鄄peng 1) , DAI Wei 1,2) 苣 , ZHAO Da鄄yong 3) , HUANG Gang 1) , MA Xiao鄄ping 1) 1) School of Information and Control Engineering, China University of Mining and Technology, Xuzhou 221116, China 2) State Key Laboratory of Synthetical Automation for Process Industries, Northeastern University, Shenyang 110819, China 3) Shenyang Institute of Automation, Chinese Academy of Sciences, Shenyang 110016, China 苣 Corresponding author, E鄄mail: weidai@ cumt. edu. cn ABSTRACT As a key production quality index of grinding process, particle size is of great importance to closed鄄loop optimization and control. This is because controlling particle within a proper range can improve the concentrate grade, enhance the recovery rate of useful minerals, and reduce the loss of metal in the sorting operation; thus, the particle size determines the overall performance of the grinding process. In fact, it is not easy to optimize or control the practical industrial process because the optimal operation largely de鄄 pends on a good measurement of particle size of grinding process; however, it is difficult to realize the real鄄time measurement of particle size because of limitations of economy or technique. Employing soft sensor techniques is necessary to solve the problem of particle size estimation, which is particularly important for the actual grinding processes. Considering that soft sensors are applicable in many fields
·68. 工程科学学报,第41卷,第1期 the data-driven soft sensor will be a useful tool for achieving particle size estimation.However,most of the iron ores processed in China are characterized by hematite with unstable properties,and the slurry particles exhibit magnetic agglomeration,giving rise to a large number of outliers in the collected data.In this case,there are gross errors in the particle size estimation model constructed based on the data and thus unreliable measurements.Meanwhile,the traditional feedforward neural networks have the disadvantages of slow con- vergence speed and easily fall into local minimum during the prediction process.A single model tends to lack superiority in sound gen- eralization,and the performance of existing ensemble learning methods will be worse under outlier interference.Therefore,in this study,based on the improved random vector functional link networks (RVFLN),the Bagging algorithm is incorporated into an adaptive weighted data fusion technique to develop an ensemble learning method for particle size estimation of grinding processes.Experimental studies were first conducted through benchmark regression issues and then validated by the samples collected from an actual grinding process,indicating the effectiveness of the proposed method. KEY WORDS particle size;random vector functional link networks;ensemble leaming;robustness;data fusion 磨矿过程作为矿石选可矿过程中最为关键的工 与泛化性能)].即单个随机向量函数链接网络模 序,起着承上启下的重要作用.该过程主要是将矿 型之间往往会存在模型参数和样本选取上的差异, 石原料粉碎到合适的粒度尺寸,从而能够将有用矿 而集成随机向量函数链接网络可以有效提高模型的 物与脉石单体解离,或者将不同有用矿物相互解离, 预测精度与泛化能力,增强算法的稳定性.集成学 为后续选别作业提供原料.其中,磨矿粒度是磨矿 习是一种新的机器学习范式,通过构建并结合多个 过程中表征生产质量的关键运行指标.因此,在磨 基模型来完成学习任务.1988年,Kearns与Val- 矿过程中,实现磨矿粒度的检测具有重要意义.粒 iant14]首先提出了将多个弱学习器提升为强学习器 度的闭环优化控制是矿物加工行业多年来的研究热 的设想.l990年,Schapirelis]证明了多个弱学习器 点1-],不幸的是,在线粒度分析仪对粒度的实时测 可以构造成一个强学习器.常用的集成学习策略 量往往受到磨矿过程中矿石磁团聚特性的影响,导 有:Boosting16)、Bagging!]等.然而,实际工业数据 致测量的不稳定和不准确.因此,在缺乏可靠测量中往往包含异常值.尽管集成学习通过组合多个基 的情况下实施闭环优化控制通常很困难,甚至是不 模型在一定程度上可以提高模型的鲁棒性,但是当 可行的.为了解决这个问题,粒度估计的相关研究 异常值水平较高时,仍然会导致不准确的估计,使得 被广泛开展.传统方法是基于一些理想假设的第一 传统的集成学习在异常值干扰下性能下降.因此, 原理模型3),往往导致较大的估计误差.因此,采 如何提高集成建模的鲁棒性是目前亟待解决的问 用数据驱动的建模技术来解决粒度估计问题已被广 题.本文将鲁棒随机向量函数链接网络作为基模 泛接受s-7刃 型,根据Bagging的采样方式,以自适应加权数据融 单隐含层前馈网络(single-hidden layer feedfor- 合技术作为基模型的组合方法,从而提出一种基于 ward networks,SLFN)由于具有逼近能力,被广泛应 鲁棒随机向量函数链接网络的集成学习方法用于磨 用于解决回归、分类等问题[8-].传统单层前馈神经 矿粒度估计. 网络的训练基于反向传播(back propagation,BP)算 本文对集成建模的研究首先从其基模型的角度 法[o].BP算法由于自身的迭代过程导致收敛速度 出发,针对如何提高所集成基模型的鲁棒性进行深 慢,并易于陷入局部最小值等缺点,其速度和精度难 入研究,并力图获得训练速度快、差异性大、精确度 以满足在线应用的要求.为了解决这个问题,文献 高、泛化能力好的基模型,从而保证最终的集成模型 [11]提出了一种随机向量函数链接网络(random 可以拥有良好的性能.然后,通过基准回归问题和 vector functional link networks,RVFLN).Igelnik 磨矿生产过程的实际工业数据,验证了所提集成建 Pao]证明了随机向量函数链接网络的随机参数 模方法的有效性 (输入权值和偏置)产生于一个均匀分布的范围内 1磨矿过程与特性分析 时,该网络可以逼近连续函数.文献[12]表明,与传 统的单层前馈神经网络相比,随机向量函数链接网 1.1磨矿过程工艺描述 络学习速度快更加易于实现等.因此,可以使用随 典型一段磨矿过程如图1所示,主要由原矿仓、 机向量函数链接网络来建立磨矿粒度估计模型. 传送带、球磨机、螺旋分级机以及若干仪表和电动执 研究表明,与单一模型相比,在绝大多数情况下 行机构组成.首先,原矿仓中的矿石经皮带输送至 通过对多个模型集成可以显著提高原来模型的精度 球磨机进行研磨,同时在球磨机入口加入与给矿量
工程科学学报,第 41 卷,第 1 期 the data鄄driven soft sensor will be a useful tool for achieving particle size estimation. However, most of the iron ores processed in China are characterized by hematite with unstable properties, and the slurry particles exhibit magnetic agglomeration, giving rise to a large number of outliers in the collected data. In this case, there are gross errors in the particle size estimation model constructed based on the data and thus unreliable measurements. Meanwhile, the traditional feedforward neural networks have the disadvantages of slow con鄄 vergence speed and easily fall into local minimum during the prediction process. A single model tends to lack superiority in sound gen鄄 eralization, and the performance of existing ensemble learning methods will be worse under outlier interference. Therefore, in this study, based on the improved random vector functional link networks (RVFLN), the Bagging algorithm is incorporated into an adaptive weighted data fusion technique to develop an ensemble learning method for particle size estimation of grinding processes. Experimental studies were first conducted through benchmark regression issues and then validated by the samples collected from an actual grinding process, indicating the effectiveness of the proposed method. KEY WORDS particle size; random vector functional link networks; ensemble learning; robustness; data fusion 磨矿过程作为矿石选矿过程中最为关键的工 序,起着承上启下的重要作用. 该过程主要是将矿 石原料粉碎到合适的粒度尺寸,从而能够将有用矿 物与脉石单体解离,或者将不同有用矿物相互解离, 为后续选别作业提供原料. 其中,磨矿粒度是磨矿 过程中表征生产质量的关键运行指标. 因此,在磨 矿过程中,实现磨矿粒度的检测具有重要意义. 粒 度的闭环优化控制是矿物加工行业多年来的研究热 点[1鄄鄄2] . 不幸的是,在线粒度分析仪对粒度的实时测 量往往受到磨矿过程中矿石磁团聚特性的影响,导 致测量的不稳定和不准确. 因此,在缺乏可靠测量 的情况下实施闭环优化控制通常很困难,甚至是不 可行的. 为了解决这个问题,粒度估计的相关研究 被广泛开展. 传统方法是基于一些理想假设的第一 原理模型[3鄄鄄4] ,往往导致较大的估计误差. 因此,采 用数据驱动的建模技术来解决粒度估计问题已被广 泛接受[5鄄鄄7] . 单隐含层前馈网络( single鄄hidden layer feedfor鄄 ward networks, SLFN)由于具有逼近能力,被广泛应 用于解决回归、分类等问题[8鄄鄄9] . 传统单层前馈神经 网络的训练基于反向传播(back propagation, BP)算 法[10] . BP 算法由于自身的迭代过程导致收敛速度 慢,并易于陷入局部最小值等缺点,其速度和精度难 以满足在线应用的要求. 为了解决这个问题,文献 [11]提出了一种随机向量函数链接网络( random vector functional link networks, RVFLN). Igelnik 和 Pao [8] 证明了随机向量函数链接网络的随机参数 (输入权值和偏置)产生于一个均匀分布的范围内 时,该网络可以逼近连续函数. 文献[12]表明,与传 统的单层前馈神经网络相比,随机向量函数链接网 络学习速度快、更加易于实现等. 因此,可以使用随 机向量函数链接网络来建立磨矿粒度估计模型. 研究表明,与单一模型相比,在绝大多数情况下 通过对多个模型集成可以显著提高原来模型的精度 与泛化性能[13] . 即单个随机向量函数链接网络模 型之间往往会存在模型参数和样本选取上的差异, 而集成随机向量函数链接网络可以有效提高模型的 预测精度与泛化能力,增强算法的稳定性. 集成学 习是一种新的机器学习范式,通过构建并结合多个 基模型来完成学习任务. 1988 年,Kearns 与 Val鄄 iant [14]首先提出了将多个弱学习器提升为强学习器 的设想. 1990 年,Schapire [15] 证明了多个弱学习器 可以构造成一个强学习器. 常用的集成学习策略 有:Boosting [16] 、Bagging [17] 等. 然而,实际工业数据 中往往包含异常值. 尽管集成学习通过组合多个基 模型在一定程度上可以提高模型的鲁棒性,但是当 异常值水平较高时,仍然会导致不准确的估计,使得 传统的集成学习在异常值干扰下性能下降. 因此, 如何提高集成建模的鲁棒性是目前亟待解决的问 题. 本文将鲁棒随机向量函数链接网络作为基模 型,根据 Bagging 的采样方式,以自适应加权数据融 合技术作为基模型的组合方法,从而提出一种基于 鲁棒随机向量函数链接网络的集成学习方法用于磨 矿粒度估计. 本文对集成建模的研究首先从其基模型的角度 出发,针对如何提高所集成基模型的鲁棒性进行深 入研究,并力图获得训练速度快、差异性大、精确度 高、泛化能力好的基模型,从而保证最终的集成模型 可以拥有良好的性能. 然后,通过基准回归问题和 磨矿生产过程的实际工业数据,验证了所提集成建 模方法的有效性. 1 磨矿过程与特性分析 1郾 1 磨矿过程工艺描述 典型一段磨矿过程如图 1 所示,主要由原矿仓、 传送带、球磨机、螺旋分级机以及若干仪表和电动执 行机构组成. 首先,原矿仓中的矿石经皮带输送至 球磨机进行研磨,同时在球磨机入口加入与给矿量 ·68·
李德鹏等:一种基于鲁棒随机向量函数链接网络的磨矿粒度集成建模方法 .69· 成比例的水,以稳定球磨机内部矿浆浓度,保证球磨 (1)磨机给可矿量a,对磨矿粒度r的影响. 机保持最佳工作状态.然后,矿浆经球磨机出口处 在磨矿粒度r合格的前提下,通常希望磨机给 排出送入螺旋分级机,在叶片搅拌作用下分成两类 矿量α,越高越好,但单独增加磨机给矿量α,将降低 矿浆,即溢流矿浆和底流矿浆.分级机补水用于调 矿粒与钢球碰撞并破裂的几率.由粉磨动力学方 节分级浓度以使溢流矿浆保持适当比例的粒度.含 程,即 有较大粒度的底流矿浆返回至球磨机中再研磨,而 R,Roexp(-kt") (1) 含有较小粒度的溢流矿浆由螺旋分级机下端溢流口 可知,由于k是与矿粒破裂几率相关的参数,n是与 流出,形成磨矿产品以供后续的选别作业 矿石性质相关的参数,t是研磨时间,因此对于粗粒 原矿仓 .CT 分级机补水 级R。一定的矿石,k变小,则从磨机出口排出的粒度 将随粗粒级R,的增加而变粗.此时,分级机返砂量 球磨机 也随之增多,导致进入磨机的矿浆总量增加,加快矿 浆在磨机内的流动速度,从而减少矿物的研磨时间 t.而t越小,R越大,磨可矿粒度r将变大 传送带 T (2)磨机入口给水流量,对磨矿粒度r的 e,CT) ① 影响. 螺旋分级机 磨矿过程是由矿物的破裂和物料的运输两个相 互制约的子过程组合而成的,磨矿浓度通过影响磨 磨机补水 滋流产品 矿黏度来同时影响这两个过程的参数,其主要通过 磨机入口给水流量α,来调节.图2给出了磨矿速率 一球磨机给矿量,th;a2一球磨机入口给水量,m3.h1: 和磨矿浓度的关系,即分别在磨矿低浓度A区,中 a4一螺旋分级机溢流质量分数:4一球磨机电流,A:2一螺旋分 浓度B区和高浓度C区,由于钢球周围黏着的矿粒 级机电流,A:T一检测仪:W一质量:F一流量:C一电流:D一密度 图1磨矿过程工艺流程 量不同,磨矿速率也不同,且成非线性变化.此外, Fig.I Flow diagram of grinding process 当磨矿旷浓度改变时,矿浆流速变化,磨矿时间t随之 变化,由粉磨动力学方程(1)可知,磨矿粒度r将发 通常,磨矿粒度过大,容易使已单体解离的有用 生改变.磨矿浓度与相对黏度呈非线性关系,而且 矿物过粉碎,难以回收,且增加能耗:而矿石粒度过 随着磨矿粒度的变化而变化.因此磨机入口给水流 小,矿物不能达到单体解离,难以分选.因此,选别 量α,与磨到矿粒度r之间具有复杂非线性特性. 作业要求过粗和微细粒度均要少,而中间易选粒级 要多.在实际磨矿过程中,通常采用磨矿粒度,作 D 为评价磨矿产品质量的重要工艺指标.所谓磨矿粒 度,是指矿石产物中直径小于0.074mm的颗粒在该 零阶破裂区 产物的占比. 一阶破裂区 1.2磨矿过程特性分析 为提高选别作业的精矿品位和有用矿物的回收 率,减少有用矿物的金属流失,要求磨矿粒度r控制 在一定范围内,然而,由于我国所处理的铁矿石大多 磨矿质量分数%小一-一一声大 数为赤铁矿,其矿石性质不稳定,矿浆颗粒存在磁团 图2批次磨矿试验下的磨矿速率与磨矿浓度关系 聚现象,难以采用在线粒度检测仪表实现磨矿粒度 Fig.2 Relationship between grinding rate and mill density based on batch grinding experiment 指标的准确测量,只能靠实验室人工化验的方法获 得,无法满足磨矿粒度闭环优化控制的要求,为此需 (3)分级机溢流质量分数α,对磨矿粒度r的 要采集过程数据,利用影响因素间接估计磨矿粒度 影响. r,建立其软测量模型.影响磨矿粒度r的因素包括 由重力选矿原理可知,分级机是按不同粒级的 磨机给矿量α1,磨机入口给水流量a2,分级机溢流 矿粒在流体中沉降速率的差异而进行分级的,而沉 质量分数α,等操作参数,以及矿石粒度B,和可磨性 降速率直接影响着分级机的分级效率,由于分级机 B,等矿石性质,各影响因素具体分析如下. 矿浆黏度是干涉沉降速率的主要因素,因此决定矿
李德鹏等: 一种基于鲁棒随机向量函数链接网络的磨矿粒度集成建模方法 成比例的水,以稳定球磨机内部矿浆浓度,保证球磨 机保持最佳工作状态. 然后,矿浆经球磨机出口处 排出送入螺旋分级机,在叶片搅拌作用下分成两类 矿浆,即溢流矿浆和底流矿浆. 分级机补水用于调 节分级浓度以使溢流矿浆保持适当比例的粒度. 含 有较大粒度的底流矿浆返回至球磨机中再研磨,而 含有较小粒度的溢流矿浆由螺旋分级机下端溢流口 流出,形成磨矿产品以供后续的选别作业. 琢1—球磨机给矿量, t·h - 1 ;琢2—球磨机入口给水量, m 3·h - 1 ; 琢3—螺旋分级机溢流质量分数;c1—球磨机电流,A;c2—螺旋分 级机电流,A;T—检测仪;W—质量;F—流量;C—电流;D—密度 图 1 磨矿过程工艺流程 Fig. 1 Flow diagram of grinding process 通常,磨矿粒度过大,容易使已单体解离的有用 矿物过粉碎,难以回收,且增加能耗;而矿石粒度过 小,矿物不能达到单体解离,难以分选. 因此,选别 作业要求过粗和微细粒度均要少,而中间易选粒级 要多. 在实际磨矿过程中,通常采用磨矿粒度 r 作 为评价磨矿产品质量的重要工艺指标. 所谓磨矿粒 度,是指矿石产物中直径小于 0郾 074 mm 的颗粒在该 产物的占比. 1郾 2 磨矿过程特性分析 为提高选别作业的精矿品位和有用矿物的回收 率,减少有用矿物的金属流失,要求磨矿粒度 r 控制 在一定范围内,然而,由于我国所处理的铁矿石大多 数为赤铁矿,其矿石性质不稳定,矿浆颗粒存在磁团 聚现象,难以采用在线粒度检测仪表实现磨矿粒度 指标的准确测量,只能靠实验室人工化验的方法获 得,无法满足磨矿粒度闭环优化控制的要求,为此需 要采集过程数据,利用影响因素间接估计磨矿粒度 r,建立其软测量模型. 影响磨矿粒度 r 的因素包括 磨机给矿量 琢1 ,磨机入口给水流量 琢2 ,分级机溢流 质量分数 琢3等操作参数,以及矿石粒度 B1和可磨性 B2等矿石性质,各影响因素具体分析如下. (1)磨机给矿量 琢1对磨矿粒度 r 的影响. 在磨矿粒度 r 合格的前提下,通常希望磨机给 矿量 琢1越高越好,但单独增加磨机给矿量 琢1将降低 矿粒与钢球碰撞并破裂的几率. 由粉磨动力学方 程,即 Rt = R0 exp( - kt n ) (1) 可知,由于 k 是与矿粒破裂几率相关的参数,n 是与 矿石性质相关的参数,t 是研磨时间,因此对于粗粒 级 R0一定的矿石,k 变小,则从磨机出口排出的粒度 将随粗粒级 Rt的增加而变粗. 此时,分级机返砂量 也随之增多,导致进入磨机的矿浆总量增加,加快矿 浆在磨机内的流动速度,从而减少矿物的研磨时间 t. 而 t 越小,Rt越大,磨矿粒度 r 将变大. (2) 磨机入口给水流量 琢2 对磨矿粒度 r 的 影响. 磨矿过程是由矿物的破裂和物料的运输两个相 互制约的子过程组合而成的,磨矿浓度通过影响磨 矿黏度来同时影响这两个过程的参数,其主要通过 磨机入口给水流量 琢2来调节. 图 2 给出了磨矿速率 和磨矿浓度的关系,即分别在磨矿低浓度 A 区,中 浓度 B 区和高浓度 C 区,由于钢球周围黏着的矿粒 量不同,磨矿速率也不同,且成非线性变化. 此外, 当磨矿浓度改变时,矿浆流速变化,磨矿时间 t 随之 变化,由粉磨动力学方程(1)可知,磨矿粒度 r 将发 生改变. 磨矿浓度与相对黏度呈非线性关系,而且 随着磨矿粒度的变化而变化. 因此磨机入口给水流 量 琢2与磨矿粒度 r 之间具有复杂非线性特性. 图 2 批次磨矿试验下的磨矿速率与磨矿浓度关系 Fig. 2 Relationship between grinding rate and mill density based on batch grinding experiment (3) 分级机溢流质量分数 琢3 对磨矿粒度 r 的 影响. 由重力选矿原理可知,分级机是按不同粒级的 矿粒在流体中沉降速率的差异而进行分级的,而沉 降速率直接影响着分级机的分级效率,由于分级机 矿浆黏度是干涉沉降速率的主要因素,因此决定矿 ·69·
·70· 工程科学学报,第41卷,第1期 浆黏度的溢流质量分数a,是影响磨矿粒度r的关键 流c1、分级机电流c2、磨机给矿量α1、磨机入口给水 过程变量,图3给出了分级机溢流质量分数与磨矿 流量α,、分级机溢流质量分数α,等数据可以预测磨 粒度r之间的非线性关系 矿粒度,即实现以下的映射关系: {←f1c1,c2,a1,2,a} (3) 一△一排矿粒度= 口-排矿粒度=} 其中,∫为未知的非线性函数,难以用精确地数学模 型来表示,但可以采用数据驱动的方法对其进行逼 近.考虑到磨矿过程中受矿石磁团聚特性影响,导 致测量的不稳定和不准确,影响建模精度,本文提出 了一种鲁棒随机向量函数链接网络集成建模方法, 用于降低甚至消除异常值影响. 分级机溢流质量分数% 2基于鲁棒随机向量函数链接网络的集成 图3分级机溢流质量分数与磨矿粒度的关系 建模 Fig.3 Relationship between classifier overflow concentration and particle size 2.1鲁棒集成建模策略 (4)矿石粒度B,和可磨性B,对磨矿粒度r的 本文所提出的鲁棒集成学习策略如图4所示. 影响 首先基于Bagging的采样方式,获得s组子样本数据 矿石粒度B,表示原矿中所有矿粒大小的总体 集:然后将这些不同的样本数据集用于训练并构建 分布.在相同的操作参数下,磨矿粒度r与可矿石粒 s组鲁棒基模型:以自适应加权数据融合策略作为 度B,成正相关的变化趋势,即矿石粒度B粗则磨矿 基模型的组合方法,对不同基模型的输出分配权值. 粒度r粗,矿石粒度B,细则磨矿粒度r细 其中,鲁棒模型基于传统随机向量函数链接网络,并 矿石的可磨性B2由矿石的硬度和韧性共同决 针对异常值数据,将加权最小二乘(weighted least 定.矿石硬度大则难磨,反之则易磨.同时矿石韧 squares,WLS)技术与非参数核密度估计(non-para- 性大,也不易磨碎.通常采用邦德(Bond)功指数来 metric kernel density estimation,.NKDE)[9]方法相结 衡量矿石的可磨性,即 合;而集成建模策略基于Bagging的采样方式,将其 与数据融合技术相结合,一方面保证了基模型之间 W-W 10 10 (2) 互相独立能够并行建模,另一方面自适应加权数据 其中,Q和F分别为给矿和磨矿产品中按80%矿粒 融合方法有效评估了基模型对于集成建模的贡 通过筛孔的尺寸,m:W为磨碎功耗,kWht:W 献度. 即为邦德功指数.从上式可以看出,当给矿粒度B, 2.2基于鲁棒随机向量函数链接网络的基模型 不变,即Q不变时,对于相同的功耗W,矿石的邦德 作为一种随机学习算法,随机向量函数链接网 功指数W不同,则F不同,即磨矿粒度r不同 络的特点是两步训练过程:随机分配隐含层参数 由于矿石粒度B,和可磨性B,难以在线标定与 (输入权值和偏置):通过最小二乘法求解线性方程 检测,因此无法作为磨矿粒度估计模型的辅助变量. 来评估输出权值.从而,随机向量函数链接网络在 为此需要寻找能够反映矿石粒度B,和可磨性B,变 学习速度、建模精度和算法实现上都有优势8.] 化的数据.由特性分析可知,当给矿粒度B,和可磨 但是,实际工业过程中的样本数据往往存在异常值, 性B,发生变化时,磨机排矿粒度也随之发生改变. 这种情况下传统最小二乘难以实现输出权值的稳健 由于分级机的溢流粒度和底流粒度均与磨机排矿粒 估计. 度密切相关,通常磨机排矿粒度变粗或变细,分级机 为此,本文采用加权最小二乘方法来计算成本 的溢流粒度和底流粒度也将发生相同的变化.而底 函数,并引入非参数核密度估计来计算惩罚权值,从 流粒度的粗细决定了分级机返砂矿浆中的固体含 而得到改进的鲁棒随机向量函数链接网络,具体模 量,其变化将直接导致分级机返砂量发生改变.文 型如下. 献[18]指出电流随着返砂量的增加而增加,两者呈 鲁棒随机向量函数链接网络的结构如图5所 近似线性关系.因此分级机电流c,可在一定程度上 示,其输出包括两部分:输入到输出的直接连接(di- 反映出矿石性质的变化.同理,磨机电流℃,也可在 rect links)和非线性映射.考虑给定的多输入单输 定程度上获知矿石性质的变化.因此利用磨机电 出训练样本数据集S={(x,y:)Ii=1,…,N}C
工程科学学报,第 41 卷,第 1 期 浆黏度的溢流质量分数 琢3是影响磨矿粒度 r 的关键 过程变量,图 3 给出了分级机溢流质量分数与磨矿 粒度 r 之间的非线性关系. 图 3 分级机溢流质量分数与磨矿粒度的关系 Fig. 3 Relationship between classifier overflow concentration and particle size (4)矿石粒度 B1 和可磨性 B2 对磨矿粒度 r 的 影响. 矿石粒度 B1表示原矿中所有矿粒大小的总体 分布. 在相同的操作参数下,磨矿粒度 r 与矿石粒 度 B1成正相关的变化趋势,即矿石粒度 B1粗则磨矿 粒度 r 粗,矿石粒度 B1细则磨矿粒度 r 细. 矿石的可磨性 B2由矿石的硬度和韧性共同决 定. 矿石硬度大则难磨,反之则易磨. 同时矿石韧 性大,也不易磨碎. 通常采用邦德(Bond)功指数来 衡量矿石的可磨性,即 WI = W ( 10 Q - 10 ) F (2) 其中,Q 和 F 分别为给矿和磨矿产品中按 80% 矿粒 通过筛孔的尺寸,滋m;W 为磨碎功耗,kW·h·t - 1 ;WI 即为邦德功指数. 从上式可以看出,当给矿粒度 B1 不变,即 Q 不变时,对于相同的功耗 W,矿石的邦德 功指数 WI不同,则 F 不同,即磨矿粒度 r 不同. 由于矿石粒度 B1和可磨性 B2难以在线标定与 检测,因此无法作为磨矿粒度估计模型的辅助变量. 为此需要寻找能够反映矿石粒度 B1和可磨性 B2变 化的数据. 由特性分析可知,当给矿粒度 B1和可磨 性 B2发生变化时,磨机排矿粒度也随之发生改变. 由于分级机的溢流粒度和底流粒度均与磨机排矿粒 度密切相关,通常磨机排矿粒度变粗或变细,分级机 的溢流粒度和底流粒度也将发生相同的变化. 而底 流粒度的粗细决定了分级机返砂矿浆中的固体含 量,其变化将直接导致分级机返砂量发生改变. 文 献[18]指出电流随着返砂量的增加而增加,两者呈 近似线性关系. 因此分级机电流 c2可在一定程度上 反映出矿石性质的变化. 同理,磨机电流 c1也可在 一定程度上获知矿石性质的变化. 因此利用磨机电 流 c1 、分级机电流 c2 、磨机给矿量 琢1 、磨机入口给水 流量 琢2 、分级机溢流质量分数 琢3等数据可以预测磨 矿粒度,即实现以下的映射关系: { ^r}饮f{c1 , c2 ,琢1 , 琢2 , 琢3 } (3) 其中,f 为未知的非线性函数,难以用精确地数学模 型来表示,但可以采用数据驱动的方法对其进行逼 近. 考虑到磨矿过程中受矿石磁团聚特性影响,导 致测量的不稳定和不准确,影响建模精度,本文提出 了一种鲁棒随机向量函数链接网络集成建模方法, 用于降低甚至消除异常值影响. 2 基于鲁棒随机向量函数链接网络的集成 建模 2郾 1 鲁棒集成建模策略 本文所提出的鲁棒集成学习策略如图 4 所示. 首先基于 Bagging 的采样方式,获得 s 组子样本数据 集;然后将这些不同的样本数据集用于训练并构建 s 组鲁棒基模型;以自适应加权数据融合策略作为 基模型的组合方法,对不同基模型的输出分配权值. 其中,鲁棒模型基于传统随机向量函数链接网络,并 针对异常值数据,将加权最小二乘( weighted least squares, WLS)技术与非参数核密度估计(non鄄para鄄 metric kernel density estimation, NKDE) [19]方法相结 合;而集成建模策略基于 Bagging 的采样方式,将其 与数据融合技术相结合,一方面保证了基模型之间 互相独立能够并行建模,另一方面自适应加权数据 融合方法有效评估了基模型对于集成建模的贡 献度. 2郾 2 基于鲁棒随机向量函数链接网络的基模型 作为一种随机学习算法,随机向量函数链接网 络的特点是两步训练过程:随机分配隐含层参数 (输入权值和偏置);通过最小二乘法求解线性方程 来评估输出权值. 从而,随机向量函数链接网络在 学习速度、建模精度和算法实现上都有优势[8,12] . 但是,实际工业过程中的样本数据往往存在异常值, 这种情况下传统最小二乘难以实现输出权值的稳健 估计. 为此,本文采用加权最小二乘方法来计算成本 函数,并引入非参数核密度估计来计算惩罚权值,从 而得到改进的鲁棒随机向量函数链接网络,具体模 型如下. 鲁棒随机向量函数链接网络的结构如图 5 所 示,其输出包括两部分:输入到输出的直接连接(di鄄 rect links) 和非线性映射. 考虑给定的多输入单输 出训练样本数据集 S = {( xi,yi ) | i = 1,…,N} 奂 ·70·
李德鹏等:一种基于鲁棒随机向量函数链接网络的磨矿粒度集成建模方法 71· 集成模型 --- 数据卧合集成策略 ○鲁棒基模型1 ○鲁棒基模型2 ○鲁棒基模型s 训练数据集1 训练数据集2 训练数据集 样本数据集1 样本数据集2 样本数据集s 其于Bagr 的采样方式 原始数据集 图4鲁棒集成学习策路的结构图 Fig.4 Structural diagram of ensemble leamning strategy R×R,那么带有L个隐含层节点的鲁棒随机向量 为第i个训练样本对于建模的贡献度,y:表示第i个 函数链接网络模型的输出可以表示为: 训练样本输出值,拓展输入矩阵A=[X,H]Nxa+b 2h,(,4x)(4) 包含输入矩阵X和隐含层输出矩阵H: [h(v,bx)..h(v,bx) 其中,04(k=1,2,…,d)表示从输人到输出的直接 H= (6) 连接权值;02,G=1,2,…,L)表示隐含层与输出节 点之间的权值:激活函数h表示隐含层特征映射, Lh(y1,b1,xw)…h(vL,bL,xx)JwxL 通常采用径向基函数或者sigmoid曲线函数;y,和b 输出权值B=[W,W2]",模型输出Y=[Y,…, 分别表示从输入层到隐含层的输入权值和偏置,即 Yw],其中W1={01k}(k=1,2,…,d),W2={02} 隐含层随机参数. G=1,2,…,L).于是有:Y=AB=[X,H][W W.]T=XW+HW, 输出层 由此可建立如下的权值优化模型: ·输出权值 iet' min:2 ○隐含层 9+∑02,(6)=y- s.t: 直接连接 (7) (●输人层 其中,£:为训练过程中第i个样本输出与模型输出 之间的残差.将上述优化模型转化为以下对偶优化 图5鲁棒随机向量函数链接网络的结构图 问题: Fig.5 Structural diagram of robust RVFLN Ws:l2- 以鲁棒随机向量函数链接网络基模型输出误差 Bea= 2 构造如下成本函数: (+-+6) (8) (AB-Y)P(AB-Y) (5) 其中,a:表示第i个样本的拉格朗日乘子.根据Ka 其中,P=diag{P1,…,P,…,Pw}是惩罚权值矩阵,P: rush-Kuhn-Tucker(KKT)理论,对上述凸二次优化
李德鹏等: 一种基于鲁棒随机向量函数链接网络的磨矿粒度集成建模方法 图 4 鲁棒集成学习策略的结构图 Fig. 4 Structural diagram of ensemble learning strategy R d 伊 R,那么带有 L 个隐含层节点的鲁棒随机向量 函数链接网络模型的输出可以表示为: y(x) = 移 d k = 1 w1,kxk + 移 L j = 1 w2,jhj(vj,bj,x) (4) 其中,w1,k(k = 1,2,…,d)表示从输入到输出的直接 连接权值;w2,j(j = 1,2,…,L)表示隐含层与输出节 点之间的权值;激活函数 hj 表示隐含层特征映射, 通常采用径向基函数或者 sigmoid 曲线函数;vj 和 bj 分别表示从输入层到隐含层的输入权值和偏置,即 隐含层随机参数. 图 5 鲁棒随机向量函数链接网络的结构图 Fig. 5 Structural diagram of robust RVFLN 以鲁棒随机向量函数链接网络基模型输出误差 构造如下成本函数: J = 移 N i =1 pi 移 d k =1 w1,k xi,k + 移 L j =1 w2,jhj(vj,bj,xi) -yi 2 = (A茁 - Y) TP(A茁 - Y) (5) 其中,P = diag{p1 ,…,pi,…,pN }是惩罚权值矩阵,pi 为第 i 个训练样本对于建模的贡献度,yi 表示第 i 个 训练样本输出值,拓展输入矩阵 A = [X,H] N 伊 (d + L) 包含输入矩阵 X 和隐含层输出矩阵 H: H = h(v1 ,b1 ,x1 ) … h(vL ,bL ,x1 ) 左 左 左 h(v1 ,b1 ,xN) … h(vL ,bL ,xN é ë ê ê ê ù û ú ú ú ) N 伊 L (6) 输出权值 茁 = [W1 W2 ] T ,模型输出 Y = [ Y1 ,…, YN] T ,其中 W1 = {w1,k}(k = 1,2,…,d),W2 = {w2,j} (j = 1,2,…,L). 于是有:Y = A茁 = [X,H] [ W1 W2 ] T = XW1 + HW2 . 由此可建立如下的权值优化模型: min: 1 2 移 N i = 1 pi椰着i椰2 s. t: 移 d k = 1 w1,k xi,k +移 L j = 1 w2,jhj(vj,bj,xi) = yi - 着i,坌i (7) 其中,着i 为训练过程中第 i 个样本输出与模型输出 之间的残差. 将上述优化模型转化为以下对偶优化 问题: Jl2 (茁,着,琢) = 1 2 移 N i = 1 椰着i椰2 - 移 N i =1 琢i ( 移 d k =1 w1,k xi,k + 移 L j =1 w2,jhj(vj,bj,xi) - yi + 着i ) (8) 其中,琢i 表示第 i 个样本的拉格朗日乘子. 根据 Ka鄄 rush鄄Kuhn鄄Tucker (KKT) 理论,对上述凸二次优化 ·71·
·72· 工程科学学报,第41卷,第1期 问题进行求解: 链接网络基模型的泛化能力较差.为解决这个问 aJ 题,本文提出了一种基于鲁棒随机向量函数链接网 =0→A'am=0 (9) aβ 络的磨矿粒度集成建模方法. s=0-a=Pe 2.3基于Bagging与自适应加权数据融合算法的 de (10) 鲁棒集成建模方法 8s=0→4B-Y-e=0 Boosting和Bagging是两种常用的集成策略.其 aB (11) 中,Boosting是一种序列化方法:其首先将所有原始 由公式(9)和(10)可得: 样本用于第一个基模型的构建,并根据该模型精度 A'PE=0 (12) 将未达到容忍误差时所对应的样本筛选出来,处理 将等式(11)两边同时左乘A'P,则: 后用于下一个基模型的构建;而Bagging是一种并 APAB-ATPY-APE=0 (13) 行化方法:通过均匀采样,即随机地从原始样本中有 于是,得出优化后的权值如下: 放回地多次抽取,每次抽取相同个数的样本,因此各 B·=(ATPA)ATPY (14) 个子样本之间是相互独立的,从而使得各个基模型 其中,(ATPA)为矩阵ATPA的Moore-Penrose广 之间相互独立,可以通过并行训练快速建模.此外, 义逆[20] 针对实际工业中具有异常值的建模样本,若采用 以上为鲁棒随机向量函数链接网络基模型框 Boosting,上一个基模型会把包含异常值的样本留给 架,这里的惩罚权值P可以通过非参数核密度估计 下一个基模型,则基模型的性能会越来越差,因此 来获得,它代表了不同样本对于建模的贡献度.由 Boosting不适用于异常值存在的条件.鉴于此,本文 于异常值的残差分布总是偏离整体样本的残差分 以Bagging的集成策略构建基模型. 布,即异常值的残差密度较低,因此可以根据残差的 基模型之间的组合可以采用自适应加权数据融 概率密度函数来评估样本的可靠性.从而,异常值 合算法来实现.自适应加权数据融合的基本思想: 所对应样本的贡献度很小,甚至接近零具体过程 在最优条件下,即总方差最小时,根据基模型的输 描述如下: 出,以自适应的方式寻找它们对应的最优加权因子, 先初始化P为单位对角阵,根据公式(14)计算 使得融合后的结果达到最优.自适应加权数据融合 输出权值,得到鲁棒随机向量函数链接网络训练过 模型见图4,其中,,2,…,,表示s个独立基模型 程残差的概率分布,即: 的输出,不同基模型对应的加权因子分别为y1,y, …,Y,y则是数据融合的结果.具体过程描述如下 01.k+ 02h,(y,b,x:)-y: 设s个鲁棒随机向量函数链接网络基模型的方 (15) 差分别为σ,σ,…,σ,真实值为y,则融合后的模 然后,通过非参数核密度估计方法得到残差的概率 型输出夕满足下面的关系: 密度函数: 言) (16) (19) 其中,N为训练样本总个数,h=L.06GN-是窗口 ∑y.=1 宽度,G是残差的标准差,中是高斯核函数: 总方差σ2为: 中(x)= 1。2 (17) σ2=E[(y-y)2]= √2π 因此,可求出惩罚权值P: E[(三w-店成]= 1 1e( p,=f(e)=亦名2m (18) [(店w-)]= 注1:鲁棒随机向量函数链接网络引入加权最 E[三w-)2+2三g-9)g-)] 小二乘求解成本函数,并通过非参数核密度估计来 a=1,b=1 获得惩罚权值,从而提高模型的鲁棒性.可靠性高 (20) 的样本具有较高的惩罚权值,反之亦然,从而减弱异 其中,E表示数学期望.由于y1,2,…,,彼此相互 常值对建模的影响.然而,单个鲁棒随机向量函数 独立,且为y的无偏估计,则有:
工程科学学报,第 41 卷,第 1 期 问题进行求解: 鄣Jl2 鄣茁 = 0寅A T琢 = 0 (9) 鄣Jl2 鄣着 = 0寅琢 = P着 (10) 鄣Jl2 鄣茁 = 0寅A茁 - Y - 着 = 0 (11) 由公式(9)和(10)可得: A TP着 = 0 (12) 将等式(11)两边同时左乘 A TP,则: A TPA茁 - A TPY - A TP着 = 0 (13) 于是,得出优化后的权值如下: 茁 * = (A TPA) 覮A TPY (14) 其中, ( A TPA) 覮 为矩阵 A TPA 的 Moore鄄Penrose 广 义逆[20] . 以上为鲁棒随机向量函数链接网络基模型框 架,这里的惩罚权值 P 可以通过非参数核密度估计 来获得,它代表了不同样本对于建模的贡献度. 由 于异常值的残差分布总是偏离整体样本的残差分 布,即异常值的残差密度较低,因此可以根据残差的 概率密度函数来评估样本的可靠性. 从而,异常值 所对应样本的贡献度很小,甚至接近零. 具体过程 描述如下: 先初始化 P 为单位对角阵,根据公式(14)计算 输出权值,得到鲁棒随机向量函数链接网络训练过 程残差的概率分布,即: 着i = 移 d k = 1 w1,k xi,k + 移 L j = 1 w2,jhj(vj,bj,xi) - yi (15) 然后,通过非参数核密度估计方法得到残差的概率 密度函数: f(x) = 1 hN 移 N l = 1 准 ( x - 着l ) h (16) 其中,N 为训练样本总个数,h = 1郾 06滓^N - 1 / 5是窗口 宽度,滓^ 是残差的标准差,准 是高斯核函数: 准(x) = 1 2仔 e - 1 2 x 2 (17) 因此,可求出惩罚权值 pi: pi = f(着i) = 1 hN 移 N l = 1 1 2仔 e - 1 2 着i - 着l ( ) h 2 (18) 注 1:鲁棒随机向量函数链接网络引入加权最 小二乘求解成本函数,并通过非参数核密度估计来 获得惩罚权值,从而提高模型的鲁棒性. 可靠性高 的样本具有较高的惩罚权值,反之亦然,从而减弱异 常值对建模的影响. 然而,单个鲁棒随机向量函数 链接网络基模型的泛化能力较差. 为解决这个问 题,本文提出了一种基于鲁棒随机向量函数链接网 络的磨矿粒度集成建模方法. 2郾 3 基于 Bagging 与自适应加权数据融合算法的 鲁棒集成建模方法 Boosting 和 Bagging 是两种常用的集成策略. 其 中,Boosting 是一种序列化方法:其首先将所有原始 样本用于第一个基模型的构建,并根据该模型精度 将未达到容忍误差时所对应的样本筛选出来,处理 后用于下一个基模型的构建;而 Bagging 是一种并 行化方法:通过均匀采样,即随机地从原始样本中有 放回地多次抽取,每次抽取相同个数的样本,因此各 个子样本之间是相互独立的,从而使得各个基模型 之间相互独立,可以通过并行训练快速建模. 此外, 针对实际工业中具有异常值的建模样本,若采用 Boosting,上一个基模型会把包含异常值的样本留给 下一个基模型,则基模型的性能会越来越差,因此 Boosting 不适用于异常值存在的条件. 鉴于此,本文 以 Bagging 的集成策略构建基模型. 基模型之间的组合可以采用自适应加权数据融 合算法来实现. 自适应加权数据融合的基本思想: 在最优条件下,即总方差最小时,根据基模型的输 出,以自适应的方式寻找它们对应的最优加权因子, 使得融合后的结果达到最优. 自适应加权数据融合 模型见图 4,其中,y^ 1 ,y^ 2 ,…,y^ s 表示 s 个独立基模型 的输出,不同基模型对应的加权因子分别为 酌1 ,酌2 , …,酌s,y^ 则是数据融合的结果. 具体过程描述如下. 设 s 个鲁棒随机向量函数链接网络基模型的方 差分别为 滓 2 1 ,滓 2 2 ,…,滓 2 s ,真实值为 y,则融合后的模 型输出 y^ 满足下面的关系: y^ = 移 s a = 1 酌a y^ a 移 s a = 1 酌a = ì î í ïï ïï 1 (19) 总方差 滓 2 为: 滓 2 = E[(y - y^) 2 ] = E [ ( 移 s a = 1 酌a y - 移 s a = 1 酌a y^ a ) ] 2 = E [ ( 移 s a = 1 酌a (y - y^ a ) ) ] 2 = E [ 移 s a = 1 酌 2 a (y - y^ a ) 2 + 2 移 s a = 1,b = 1 a屹b (y - y^ a )(y - y^ b) ] (20) 其中,E 表示数学期望. 由于 y^ 1 ,y^ 2 ,…,y^ s 彼此相互 独立,且为 y^ 的无偏估计,则有: ·72·
李德鹏等:一种基于鲁棒随机向量函数链接网络的磨矿粒度集成建模方法 ·73· E(y-yn)(心y-y。)=0,(a=1,…s;b=1,…,s;a≠b) 基模型个数s为8的条件下,将其与直接平均法的 (21) 集成随机向量函数链接网络和数据融合的集成随机 因此,σ2可以写成: 向量函数链接网络进行了对比实验.实验结果基于 =E[2-)]=20(2) 一个函数近似和三个基准数据回归问题,仿真在 MATLAB2016a环境下运行,所用PC的CPU为5, 其中,σ(a=1,2,…,s)是第a个鲁棒随机向量函 3.4GHz,内存为8 GB RAM. 数链接网络基模型测试输出的方差 2.5.1函数近似 从(22)式可知,总方差2是加权因子的多元 采用以下非线性复合函数: 二次函数,存在最小值σ,求解如下: fx)=0.2e-(or-42+0.5e-(m-40)2 in min 0.3e-a-202,x∈[0,1] (26) (23) 首先随机产生5000个不同的样本数据作为原 ∑Y。=1 始数据集,然后根据Bagging的采样方法,每轮有放 根据多元函数求极值理论,可求得σ时第a 回地从中随机抽取500个训练数据,得到10组训练 个鲁棒随机向量函数链接网络基模型所对应的最优 数据:再随机生成200个不同的样本,作为集成模型 加权因子: 的测试数据.为了验证随机向量函数链接网络的鲁 Yi=- ,(a=1,…,s) (24) 棒性,在训练样本中加入了异常值.本实验中对于 每个训练数据集加入的异常值水平专分别为0%、 10%、20%和30%. 相应地,总方差的最小值为 在数据预处理阶段,输入和输出数据均被归一 1 d'mnin= (25) 化至区间[-1,1],所有的实验结果均基于50次独 立试验.比较实验中,集成建模性能包括模型精度 和训练时间.其中,模型精度使用50次实验均方根 2.4算法步骤 给定一个训练样本集,{(x:,y:)Ii=1,…,N}C 误差(root mean squares error,RMSE)的均值mean 表示:训练时间用t(s)表示.相关参数的设置通过 R2x R. 交叉验证法在具体的实验中给出. 步骤1:设置隐含层节点数L,在区间[-入,+ 表1为50次独立实验的结果,不同异常值水平 入]和[-入,+入]内分别随机生成输入权值y,和偏 下三种集成建模方法中最佳的模型性能用粗体表 置b,其中j=1,2,…,L; 步骤2:计算隐含层输出矩阵H,得到拓展输入 示.由表1可知,在没有异常值干扰下,即异常值水 矩阵A; 平专=0时,三种方法的模型精度基本相同.随着专 步骤3:根据公式(15)计算残差,代入公式 的不断增加,虽然三种方法的建模精度均有所下降, (18)求P:并构造对角矩阵P: 但本文所提方法受其影响最小.与其他两种方法相 步骤4:根据公式(14)来计算输出权值B·; 比,在稍微增加训练时间的情况下,数据融合鲁棒随 步骤5:重复步骤1~4,构建一组s个鲁棒随机 机向量函数链接网络集成模方法具有更高的模型精 向量函数链接网络,并求出每个基模型输出的方差; 度.此外,图6为额外的一次独立实验,它给出了三 步骤6:根据公式(24)求出每一个鲁棒随机向 种集成建模方法在异常值水平飞=20%时的测试结 量函数链接网络基模型所对应的最优加权因子; 果.从图6中可以看出,在该异常值水平下,直接平 步骤7:根据公式(19)求出集成模型数据融合 均和数据融合随机向量函数链接网络的预测值已经 后的输出. 出现了明显的波动,表明模型误差较大:而本文所提 注2:集成时需要对基模型个数进行设定,文献 方法的预测值能够很好的拟合真实值,表明了其有 [21]提出了一种基于进化算法尺寸控制选择性集 效性.考虑到文章的可读性,其他异常值水平下的 成,给出了一个重要的结论:最佳基模型的个数范围 结论与=20%时相同,且与表1中的实验结果一 为2~8. 致,在此省略 2.5性能评估 需要指出的是,三种集成建模方法基模型的构 为了验证本文所提集成建模方法的有效性,在 建方式均为并行,本文所提方法在训练速度上稍微
李德鹏等: 一种基于鲁棒随机向量函数链接网络的磨矿粒度集成建模方法 E(y - y^ a )(y - y^ b) =0,(a =1,…,s;b =1,…,s;a屹b) (21) 因此,滓 2 可以写成: 滓 2 = E [ 移 s a = 1 酌 2 a (y - y^ a ) 2 ] = 移 s a = 1 酌 2 a滓 2 a (22) 其中,滓 2 a (a = 1,2,…,s) 是第 a 个鲁棒随机向量函 数链接网络基模型测试输出的方差. 从(22)式可知,总方差 滓 2 是加权因子的多元 二次函数,存在最小值 滓 2 min ,求解如下: 滓 2 min = min (移 s a = 1 酌 2 a滓 2 a ) 移 s a = 1 酌a = ì î í ï ï ï ï 1 (23) 根据多元函数求极值理论,可求得 滓 2 min时第 a 个鲁棒随机向量函数链接网络基模型所对应的最优 加权因子: 酌 * a = 1 滓 2 a移 s a = 1 1 滓 2 a , (a = 1,…,s) (24) 相应地,总方差的最小值为 滓 2 min = 1 移 s a = 1 1 滓 2 a (25) 2郾 4 算法步骤 给定一个训练样本集,{(xi,yi) | i = 1,…,N}奂 R d 伊 R. 步骤 1:设置隐含层节点数 L,在区间[ - 姿, + 姿] d 和[ - 姿, + 姿]内分别随机生成输入权值 vj 和偏 置 bj,其中 j = 1,2,…,L; 步骤 2:计算隐含层输出矩阵 H,得到拓展输入 矩阵 A; 步骤 3: 根据公式 (15 ) 计算残差, 代入公式 (18)求 pi 并构造对角矩阵 P; 步骤 4:根据公式(14)来计算输出权值 茁 * ; 步骤 5:重复步骤 1 ~ 4,构建一组 s 个鲁棒随机 向量函数链接网络,并求出每个基模型输出的方差; 步骤 6:根据公式(24)求出每一个鲁棒随机向 量函数链接网络基模型所对应的最优加权因子; 步骤 7:根据公式(19)求出集成模型数据融合 后的输出. 注 2:集成时需要对基模型个数进行设定,文献 [21]提出了一种基于进化算法尺寸控制选择性集 成,给出了一个重要的结论:最佳基模型的个数范围 为 2 ~ 8. 2郾 5 性能评估 为了验证本文所提集成建模方法的有效性,在 基模型个数 s 为 8 的条件下,将其与直接平均法的 集成随机向量函数链接网络和数据融合的集成随机 向量函数链接网络进行了对比实验. 实验结果基于 一个函数近似和三个基准数据回归问题,仿真在 MATLAB 2016a 环境下运行,所用 PC 的 CPU 为 i5, 3郾 4 GHz,内存为 8 GB RAM. 2郾 5郾 1 函数近似 采用以下非线性复合函数: f(x) = 0郾 2e - (10x - 4) 2 + 0郾 5e - (80x - 40) 2 + 0郾 3e - (80x - 20) 2 ,x沂[0,1] (26) 首先随机产生 5000 个不同的样本数据作为原 始数据集,然后根据 Bagging 的采样方法,每轮有放 回地从中随机抽取 500 个训练数据,得到 10 组训练 数据;再随机生成 200 个不同的样本,作为集成模型 的测试数据. 为了验证随机向量函数链接网络的鲁 棒性,在训练样本中加入了异常值. 本实验中对于 每个训练数据集加入的异常值水平 孜 分别为 0% 、 10% 、20% 和 30% . 在数据预处理阶段,输入和输出数据均被归一 化至区间[ - 1,1],所有的实验结果均基于 50 次独 立试验. 比较实验中,集成建模性能包括模型精度 和训练时间. 其中,模型精度使用 50 次实验均方根 误差( root mean squares error, RMSE) 的均值 mean 表示;训练时间用 t( s)表示. 相关参数的设置通过 交叉验证法在具体的实验中给出. 表 1 为 50 次独立实验的结果,不同异常值水平 下三种集成建模方法中最佳的模型性能用粗体表 示. 由表 1 可知,在没有异常值干扰下,即异常值水 平 孜 = 0 时,三种方法的模型精度基本相同. 随着 孜 的不断增加,虽然三种方法的建模精度均有所下降, 但本文所提方法受其影响最小. 与其他两种方法相 比,在稍微增加训练时间的情况下,数据融合鲁棒随 机向量函数链接网络集成模方法具有更高的模型精 度. 此外,图 6 为额外的一次独立实验,它给出了三 种集成建模方法在异常值水平 孜 = 20% 时的测试结 果. 从图 6 中可以看出,在该异常值水平下,直接平 均和数据融合随机向量函数链接网络的预测值已经 出现了明显的波动,表明模型误差较大;而本文所提 方法的预测值能够很好的拟合真实值,表明了其有 效性. 考虑到文章的可读性,其他异常值水平下的 结论与 孜 = 20% 时相同,且与表 1 中的实验结果一 致,在此省略. 需要指出的是,三种集成建模方法基模型的构 建方式均为并行,本文所提方法在训练速度上稍微 ·73·
.74 工程科学学报,第41卷,第1期 表1函数近似集成建模性能比较 Table 1 Performance comparison of ensemble leaming for function approximation mean,t/s 数据集 模型参数,模型参数,一 集成建模方法 异常值水平 异常值水平 异常值水平 异常值水平 L 0 10% 20% 30% 直接平均随机向量函数 500 20 8.2×10-4,0.1430.008.0.138 0.011.0.156 0.013,0.147 链接网络集成 非线性 数据融合随机向量函数 500 20 8.1×10-4,0.1430.007,0.140 0.010.0.145 0.012,0.144 复合函数 链接网络集成 数据融合鲁棒随机向量 500 50 8.9×10-4,0.4080.003,0.409 0.005.0.411 0.008.0.419 函数链接网络集成 a 。真实值 (b) 。真实值 0.5 一预测值 0.5 一预测值 03 0.2 0.1 0.10 0.1 0.4 0.6 0.8 1.0 0.2 0.4 0.6 0.8 1.0 Ic) 。真实值 0.5 一预测值 0.4 0.3 0.2 010 0.2 0.4 0.60.81.0 图6=20%时函数近似比较试验.(a)直接平均随机向量函数链接网络集成:(b)数据融合随机向量函数链接网络集成:(c)数据融合 鲁棒随机向量函数链接网络集成 Fig.6 Comparison experiments of function approximation at=0%(a)RVFLN-based direct average ensemble leaming:(b)RVFLN-based data fusion ensemble learning;(c)robust RVFLN-based data fusion ensemble learning 逊色于其他两种方法的原因为:在构建基模型时,鲁 California at Irvine,UCI)机器学习数据集的三个实 棒随机向量函数链接网络比传统随机向量函数链接 际基准回归案例,包括combined cycle power plant, 网络多了非参数核密度估计评估样本数据对于建模 concrete和wine.基于50次独立实验,图7给出了 贡献度的过程:在基模型组合方式上,直接加权法虽 三种方法在不同异常值水平下的模型性能.这里的 然简单,在一定程度上提高算法的稳定性,但分配给 异常值水平是相对于原始数据而言,并在其基础上 每个基模型相同的权重是不合理的,而自适应加 所额外添加的离群点比例.实验中,针对三个实际 权数据融合的方法则是根据每个基模型精度的差 数据集,集成模型参数(L,入)的设置通过交叉验证 异,并保证集成后模型总方差最小的情况下,给基 法得出,分别为(1000,50)、(40,1)和(50,0.5). 模型分配不同的权值.实验结果表明,本文所提方 如图7所示,随着异常值水平的增加,测试均方根误 法能够以较快的速度集成建模,有效提高模型的 差均呈现出整体递增的趋势.不同之处在于,本文 鲁棒性 所提方法受异常值影响较小,能够在一定程度上有 2.5.2基准数据 效降低异常值的影响,且具有良好的泛化性能,对于 这部分给出了来自加州大学欧文(University of 实际的复杂工业过程建模有着重要意义
工程科学学报,第 41 卷,第 1 期 表 1 函数近似集成建模性能比较 Table 1 Performance comparison of ensemble learning for function approximation 数据集 集成建模方法 模型参数, L 模型参数, 姿 mean,t / s 异常值水平 0 异常值水平 10% 异常值水平 20% 异常值水平 30% 直接平均随机向量函数 链接网络集成 500 20 8郾 2 伊 10 - 4 , 0郾 143 0郾 008, 0郾 138 0郾 011, 0郾 156 0郾 013, 0郾 147 非线性 复合函数 数据融合随机向量函数 链接网络集成 500 20 8郾 1 伊 10 - 4 , 0郾 143 0郾 007, 0郾 140 0郾 010, 0郾 145 0郾 012, 0郾 144 数据融合鲁棒随机向量 函数链接网络集成 500 50 8郾 9 伊 10 - 4 , 0郾 408 0郾 003, 0郾 409 0郾 005, 0郾 411 0郾 008, 0郾 419 图 6 孜 = 20% 时函数近似比较试验 郾 (a) 直接平均随机向量函数链接网络集成;(b) 数据融合随机向量函数链接网络集成;(c) 数据融合 鲁棒随机向量函数链接网络集成 Fig. 6 Comparison experiments of function approximation at 孜 = 20% : (a) RVFLN鄄based direct average ensemble learning; (b) RVFLN鄄based data fusion ensemble learning; (c) robust RVFLN鄄based data fusion ensemble learning 逊色于其他两种方法的原因为:在构建基模型时,鲁 棒随机向量函数链接网络比传统随机向量函数链接 网络多了非参数核密度估计评估样本数据对于建模 贡献度的过程;在基模型组合方式上,直接加权法虽 然简单,在一定程度上提高算法的稳定性,但分配给 每个基模型相同的权重是不合理的,而自适应加 权数据融合的方法则是根据每个基模型精度的差 异,并保证集成后模型总方差最小的情况下,给基 模型分配不同的权值. 实验结果表明,本文所提方 法能够以较快的速度集成建模,有效提高模型的 鲁棒性. 2郾 5郾 2 基准数据 这部分给出了来自加州大学欧文(University of California at Irvine, UCI)机器学习数据集的三个实 际基准回归案例,包括 combined cycle power plant, concrete 和 wine. 基于 50 次独立实验,图 7 给出了 三种方法在不同异常值水平下的模型性能. 这里的 异常值水平是相对于原始数据而言,并在其基础上 所额外添加的离群点比例. 实验中,针对三个实际 数据集,集成模型参数( L, 姿)的设置通过交叉验证 法得出,分别为(1000, 50)、(40, 1)和(50, 0郾 5). 如图 7 所示,随着异常值水平的增加,测试均方根误 差均呈现出整体递增的趋势. 不同之处在于,本文 所提方法受异常值影响较小,能够在一定程度上有 效降低异常值的影响,且具有良好的泛化性能,对于 实际的复杂工业过程建模有着重要意义. ·74·
李德鹏等:一种基于鲁棒随机向量函数链接网络的磨矿粒度集成建模方法 ·75· 本节基于一个函数近似和三组基准数据回归问 进行了对比实验.实验结果验证了基于鲁棒随机向 题,将所提方法与直接平均法的集成随机向量函数 量函数链接网络集成建模方法的有效性,并将其用 链接网络和数据融合的集成随机向量函数链接网络 于实际工业过程进行磨矿粒度估计 10 12.6 (a)◆直接平均RVFLN集成 ◆一直接平均RVFLN集成 数据融合RVFLN集成 ▲一数据融合RVFLN集成 9 。数据融合鲁棒 12.4 -数据融合鲁棒RVFLN集成 RVFLN集成 8 12 12.0 6 11.8 10 20 11.66 10 20 30 异常值水平 异常值水平% 0.74 ◆直接平均RVFLN集成 0.73 ▲数据融合RVFLN集成 -数据融合鲁棒RVFLN集成 0.72 0.71 0.70 0.69 0.686 10 20 异常值水平% 图7基准回归比较试验.(a)combined cycle power plant:(b)concrete;(c)wine Fig.7 Comparison experiments of benchmark regression:(a)combined cycle power plant;(b)concrete;(c)wine 3磨矿粒度估计 值水平下进行了50次独立实验,结果见表2.考虑 到文章的可读性,图8只给出了专=30%时三种集 通过使用实际工业赤铁矿磨矿过程的数据,将 成方法的模型性能.需要指出的是,这里的异常值 本文所提方法应用于磨矿粒度估计.采样时,从原 水平是相对于原始数据而言,为了进一步体现所提 始数据中随机选取8组,每组500个作为训练数据; 方法的鲁棒性,在原始数据集上额外添加的不同比 300个作为测试数据.具体的磨矿过程和特性分析 例的离群点 见第1章.同2.4节性能评估,这部分在不同异常 表2磨矿粒度集成建模性能比较 Table 2 Performance comparison of ensemble leaming for particle size of grinding process mean,t/s 模型参数,模型参数, 数据集 集成建模方法 异常值水平 异常值水平 异常值水平 异常值水平 L 0 10% 20% 30% 直接平均随机向量函数 50 0.095,0.063 0.183,0.063 0.212.0.062 0.231,0.063 链接网络集成 实际工业 数据融合随机向量函数 磨矿过程 链接网络集成 5s0 0.086,0.063 0.168,0.062 0.201,0.623 0.224,0.063 数据融合鲁棒随机向量 50 0.009,0.118 0.035,0.113 0.072.0.120 0.106,0.119 函数链接网络集成 由表2可知,虽然数据融合鲁棒随机向量函数 异常值水平的增加,本文所提方法的建模性能波动 链接网络集成建模在训练时间上有轻微增加,但在 最小,体现了良好的鲁棒性.其中,=30%时实验 不同异常值水平下,其均方根误差均最低:而且随着 结果见图8,三种集成方法用于磨矿粒度的估计值
李德鹏等: 一种基于鲁棒随机向量函数链接网络的磨矿粒度集成建模方法 本节基于一个函数近似和三组基准数据回归问 题,将所提方法与直接平均法的集成随机向量函数 链接网络和数据融合的集成随机向量函数链接网络 进行了对比实验. 实验结果验证了基于鲁棒随机向 量函数链接网络集成建模方法的有效性,并将其用 于实际工业过程进行磨矿粒度估计. 图 7 基准回归比较试验. (a) combined cycle power plant;(b) concrete;(c) wine Fig. 7 Comparison experiments of benchmark regression: (a) combined cycle power plant; (b) concrete; (c) wine 3 磨矿粒度估计 通过使用实际工业赤铁矿磨矿过程的数据,将 本文所提方法应用于磨矿粒度估计. 采样时,从原 始数据中随机选取 8 组,每组 500 个作为训练数据; 300 个作为测试数据. 具体的磨矿过程和特性分析 见第 1 章. 同 2郾 4 节性能评估,这部分在不同异常 值水平下进行了 50 次独立实验,结果见表 2. 考虑 到文章的可读性,图 8 只给出了 孜 = 30% 时三种集 成方法的模型性能. 需要指出的是,这里的异常值 水平是相对于原始数据而言,为了进一步体现所提 方法的鲁棒性,在原始数据集上额外添加的不同比 例的离群点. 表 2 磨矿粒度集成建模性能比较 Table 2 Performance comparison of ensemble learning for particle size of grinding process 数据集 集成建模方法 模型参数, L 模型参数, 姿 mean,t / s 异常值水平 0 异常值水平 10% 异常值水平 20% 异常值水平 30% 直接平均随机向量函数 链接网络集成 50 1 0郾 095, 0郾 063 0郾 183, 0郾 063 0郾 212, 0郾 062 0郾 231, 0郾 063 实际工业 磨矿过程 数据融合随机向量函数 链接网络集成 50 1 0郾 086, 0郾 063 0郾 168, 0郾 062 0郾 201, 0郾 623 0郾 224, 0郾 063 数据融合鲁棒随机向量 函数链接网络集成 50 1 0郾 009, 0郾 118 0郾 035, 0郾 113 0郾 072, 0郾 120 0郾 106, 0郾 119 由表 2 可知,虽然数据融合鲁棒随机向量函数 链接网络集成建模在训练时间上有轻微增加,但在 不同异常值水平下,其均方根误差均最低;而且随着 异常值水平的增加,本文所提方法的建模性能波动 最小,体现了良好的鲁棒性. 其中,孜 = 30% 时实验 结果见图 8,三种集成方法用于磨矿粒度的估计值 ·75·
·76· 工程科学学报,第41卷,第1期 被分别给出.虽然三种方法在一定程度上都能实现 过实际工业过程的磨矿粒度估计结果可知,本文所 粒度的估计,但从粒度的实际值与估计值的拟合程 提方法取得了良好的效果.再次表明,数据融合鲁 度来看,数据融合鲁棒随机向量函数链接网络集成 棒随机向量函数链接网络集成建模方法具有良好的 效果最好,数据融合随机向量函数链接网络集成次 泛化性能和预测精度,并因其较好的鲁棒性适用于 之,直接平均随机向量函数链接网络集成较差.通 异常值干扰的环境下 64 64 a 。实际值*估计值 (b) 。实际值*估计值 62 62 60 四60 58 58 54 52 52 50 50 100 150 00 50 150200 250 输人样本数 输人样本数 。实际值估计值 0 50 100150200250 300 输入样本数 图8专=30%时磨矿粒度估计,(a)直接平均随机向量函数链接网络集成:(b)数据融合随机向量函数链接网络集成:(©)数据融合鲁棒 随机向量函数链接网络集成 Fig.8 Particle size estimation of grinding process at f=30%:(a)RVFLN-based direct average ensemble learning;(b)RVFLN-based data fusion ensemble learning:(c)robust RVFLN-based data fusion ensemble leaming 模方法在异常值水平为30%时仍能取得较好的结 4结论 果.从而,本文所提方法能够应用到实际磨矿过程 (1)以鲁棒随机向量函数链接网络作为基模 中实现粒度估计. 型,它通过随机分配隐含层参数,并将加权最小二乘 技术与非参数核密度估计方法相结合,能够确保模 参考文献 型在异常值干扰的条件下的逼近能力,并且在学习 [1]Chen X S,Li Q,Fei S M.Supervisory expert control for ball mill 速度和建模精度上均比传统前馈神经树络有优势, grinding circuits.Expert Syst Appl,2008,34(3):1877 (2)与单一模型相比,在绝大多数情况下通过 [2]Zhou P,Dai W,Chai T Y.Multivariable disturbance observer based advanced feedback control design and its application to a 对多个模型集成可以显著提高原来模型的精度与泛 grinding circuit.IEEE Trans Control Syst Technol,2014,22(4): 化性,且传统的集成学习方法在异常值干扰下性能 1474 下降.因此,本文提出了一种基于鲁棒随机向量函 [3]Wang X L,Gui W H,Yang C H,et al.Wet grindability of an in- 数链接网络的自适应数据融合集成建模方法.实验 dustrial ore and its breakage parameters estimation using population 结果表明,与其他两种集成建模方法相比,所提方法 balances.Int J Miner Proc ss,2011,98(1-2):113 稳定性好、精度高,并且具有良好的鲁棒性 [4]Meyer E J,Craig I K,The development of dynamic models for a (3)实际工业过程中的样本数据往往存在异常 dense medium separation circuit in coal beneficiation,Miner Eng. 2010,23(10):791 值.在本文实验中,将所提方法采用磨矿生产过程 [5] Sun Z,Wang H G,Zhang Z K.Soft sensing of overflow particle 的实际工业数据进行集成建模.结果表明,基于鲁 size distributions in hydroeyclones using a combined method.Tsin- 棒随机向量函数链接网络的自适应数据融合集成建 ghua Sci Technol,2008,13(1):47
工程科学学报,第 41 卷,第 1 期 被分别给出. 虽然三种方法在一定程度上都能实现 粒度的估计,但从粒度的实际值与估计值的拟合程 度来看,数据融合鲁棒随机向量函数链接网络集成 效果最好,数据融合随机向量函数链接网络集成次 之,直接平均随机向量函数链接网络集成较差. 通 过实际工业过程的磨矿粒度估计结果可知,本文所 提方法取得了良好的效果. 再次表明,数据融合鲁 棒随机向量函数链接网络集成建模方法具有良好的 泛化性能和预测精度,并因其较好的鲁棒性适用于 异常值干扰的环境下. 图 8 孜 = 30% 时磨矿粒度估计 郾 (a) 直接平均随机向量函数链接网络集成;(b) 数据融合随机向量函数链接网络集成;( c) 数据融合鲁棒 随机向量函数链接网络集成 Fig. 8 Particle size estimation of grinding process at 孜 = 30% : (a) RVFLN鄄based direct average ensemble learning; (b) RVFLN鄄based data fusion ensemble learning; (c) robust RVFLN鄄based data fusion ensemble learning 4 结论 (1)以鲁棒随机向量函数链接网络作为基模 型,它通过随机分配隐含层参数,并将加权最小二乘 技术与非参数核密度估计方法相结合,能够确保模 型在异常值干扰的条件下的逼近能力,并且在学习 速度和建模精度上均比传统前馈神经网络有优势. (2)与单一模型相比,在绝大多数情况下通过 对多个模型集成可以显著提高原来模型的精度与泛 化性,且传统的集成学习方法在异常值干扰下性能 下降. 因此,本文提出了一种基于鲁棒随机向量函 数链接网络的自适应数据融合集成建模方法. 实验 结果表明,与其他两种集成建模方法相比,所提方法 稳定性好、精度高,并且具有良好的鲁棒性. (3)实际工业过程中的样本数据往往存在异常 值. 在本文实验中,将所提方法采用磨矿生产过程 的实际工业数据进行集成建模. 结果表明,基于鲁 棒随机向量函数链接网络的自适应数据融合集成建 模方法在异常值水平为 30% 时仍能取得较好的结 果. 从而,本文所提方法能够应用到实际磨矿过程 中实现粒度估计. 参 考 文 献 [1] Chen X S, Li Q, Fei S M. Supervisory expert control for ball mill grinding circuits. Expert Syst Appl, 2008, 34(3): 1877 [2] Zhou P, Dai W, Chai T Y. Multivariable disturbance observer based advanced feedback control design and its application to a grinding circuit. IEEE Trans Control Syst Technol, 2014, 22(4): 1474 [3] Wang X L, Gui W H, Yang C H, et al. Wet grindability of an in鄄 dustrial ore and its breakage parameters estimation using population balances. Int J Miner Process, 2011, 98(1鄄2): 113 [4] Meyer E J, Craig I K, The development of dynamic models for a dense medium separation circuit in coal beneficiation, Miner Eng, 2010, 23 (10): 791 [5] Sun Z, Wang H G, Zhang Z K. Soft sensing of overflow particle size distributions in hydrocyclones using a combined method. Tsin鄄 ghua Sci Technol, 2008, 13(1): 47 ·76·