基于全局优化支持向量机的多类别高炉故障诊断

针对高炉故障诊断系统快速性和准确性的要求，提出基于全局优化最小二乘支持向量机的策略.首先，采用变尺度离散粒子群对最小二乘支持向量机的参数和故障特征的选取进行优化；然后，利用核主元分析法对选取的特征向量进行压缩整理；最后，构造了以Fisher线性判别率为标准的启发式纠错输出编码.仿真结果表明，通过对故障训练样本有意义地分割重组，用较少的最小二乘支持向量机分类器，得到较高的故障判断准确率且增强了整个系统的实时性.

团购合买资源类别：文库，文档格式：PDF，文档页数：9，文件大小：1.93MB

工程科学学报，第39卷.第1期：39-47,2017年1月 Chinese Journal of Engineering,Vol.39,No.1:39-47,January 2017 D0L:10.13374/j.issn2095-9389.2017.01.005;htp://journals.usth.edu.cm 基于全局优化支持向量机的多类别高炉故障诊断张海刚12)，张森12)四，尹怡欣12) 1)北京科技大学自动化学院，北京1000832)北京科技大学钢铁流程先进控制教育部重点实验室，北京100083 ☒通信作者，E-mail:zhangsen(@usth.cdu.cn 摘要针对高炉故障诊断系统快速性和准确性的要求，提出基于全局优化最小二乘支持向量机的策略.首先，采用变尺度离散粒子群对最小二乘支持向量机的参数和故障特征的选取进行优化：然后，利用核主元分析法对选取的特征向量进行压缩整理：最后，构造了以Fisher线性判别率为标准的启发式纠错输出编码.仿真结果表明，通过对故障训练样本有意义地分割重组，用较少的最小二乘支持向量机分类器，得到较高的故障判断准确率且增强了整个系统的实时性关键词高炉：故障诊断：最小二乘分析：支持向量机：全局优化分类号T549 Multi-class fault diagnosis of BF based on global optimization LS-SVM ZHANG Hai-gang2),ZHANG Sen)YIN Yi-xin2) 1)School of Automation and Electrical Engineering,University of Science and Technology Beijing,Beijing 100083.China 2)Key Laboratory of Advanced Control of Iron and Steel Process (Ministry of Education),University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:zhangsen@ustb.edu.cn ABSTRACT Aiming at the requirement of high speed and precision in blast furnace fault diagnosis systems,a new strategy based on global optimization least-squares support vector machines (LS-SVM)was proposed to solve this problem.Firstly,the variable metric discrete particle swarm optimization algorithm was employed to optimize the feature selection and LS-SVM parameters.Secondly,the feature vector was compressed by kernel principal component analysis.Finally,the heuristic error correcting output codes were con- structed on the basis of Fisher linear discriminate rate.In the fault diagnosis scheme,fewer IS-SVM classifiers were applied through meaningful partitions and recombination of fault training samples.Simulation results show that the proposed fault diagnosis method can not only improve the fault detection accurate rate,but also enhance the timeliness of the entire system. KEY WORDS blast furnaces;fault diagnosis;least-squares analysis;support vector machines;global optimization 钢铁工业是我国国民经济的基础产业和支柱产到节能减排的目的.高炉炉况故障诊断在高炉自动化业).高炉炼铁在钢铁工业中处于举足轻重的地位. 控制的研究中一直是热点话题，准确及时的故障诊断高炉炼铁系统生产设备繁多，具有多耦合、大延时、非技术能够确定高炉的稳定生产，降低故障所带来的经线性等特点.尽管在高炉本体上安装了很多自动化的济损失[2) 检测装置，然而由于高炉运行炉况复杂，无法建立准确在高炉生产中，由于缺少准确的机理模型，往往从的机理模型，在高炉自动控制决策过程中，仍将其当为数据驱动角度建立高炉故障诊断模型).基于专家系 “黑箱”系统进行处理.高炉生产追求稳定，稳定炉况统的故障诊断方法，计算机模仿专家经验，进行故障决不仅能够保证铁水质量，而且能够提高煤气利用率，达策[.虽然引进国外的专家系统有一定的效果，但是收稿日期：2016-03-16 基金项目：国家自然科学基金资助项目(61333002,61673056)

工程科学学报,第 39 卷,第 1 期:39鄄鄄47,2017 年 1 月 Chinese Journal of Engineering, Vol. 39, No. 1: 39鄄鄄47, January 2017 DOI: 10. 13374 / j. issn2095鄄鄄9389. 2017. 01. 005; http: / / journals. ustb. edu. cn 基于全局优化支持向量机的多类别高炉故障诊断张海刚1,2) , 张森1,2) 苣 , 尹怡欣1,2) 1) 北京科技大学自动化学院, 北京 100083 2) 北京科技大学钢铁流程先进控制教育部重点实验室, 北京 100083 苣通信作者, E鄄mail: zhangsen@ ustb. edu. cn 摘要针对高炉故障诊断系统快速性和准确性的要求,提出基于全局优化最小二乘支持向量机的策略. 首先,采用变尺度离散粒子群对最小二乘支持向量机的参数和故障特征的选取进行优化;然后,利用核主元分析法对选取的特征向量进行压缩整理;最后,构造了以 Fisher 线性判别率为标准的启发式纠错输出编码. 仿真结果表明,通过对故障训练样本有意义地分割重组,用较少的最小二乘支持向量机分类器,得到较高的故障判断准确率且增强了整个系统的实时性. 关键词高炉; 故障诊断; 最小二乘分析; 支持向量机; 全局优化分类号 TF549 Multi鄄class fault diagnosis of BF based on global optimization LS鄄SVM ZHANG Hai鄄gang 1,2) , ZHANG Sen 1,2) 苣 , YIN Yi鄄xin 1,2) 1) School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing 100083, China 2) Key Laboratory of Advanced Control of Iron and Steel Process ( Ministry of Education), University of Science and Technology Beijing, Beijing 100083, China 苣 Corresponding author, E鄄mail: zhangsen@ ustb. edu. cn ABSTRACT Aiming at the requirement of high speed and precision in blast furnace fault diagnosis systems, a new strategy based on global optimization least鄄squares support vector machines (LS鄄SVM) was proposed to solve this problem. Firstly, the variable metric discrete particle swarm optimization algorithm was employed to optimize the feature selection and LS鄄SVM parameters. Secondly, the feature vector was compressed by kernel principal component analysis. Finally, the heuristic error correcting output codes were con鄄 structed on the basis of Fisher linear discriminate rate. In the fault diagnosis scheme, fewer LS鄄SVM classifiers were applied through meaningful partitions and recombination of fault training samples. Simulation results show that the proposed fault diagnosis method can not only improve the fault detection accurate rate, but also enhance the timeliness of the entire system. KEY WORDS blast furnaces; fault diagnosis; least鄄squares analysis; support vector machines; global optimization 收稿日期: 2016鄄鄄03鄄鄄16 基金项目: 国家自然科学基金资助项目(61333002, 61673056) 钢铁工业是我国国民经济的基础产业和支柱产业[1] . 高炉炼铁在钢铁工业中处于举足轻重的地位. 高炉炼铁系统生产设备繁多,具有多耦合、大延时、非线性等特点. 尽管在高炉本体上安装了很多自动化的检测装置,然而由于高炉运行炉况复杂,无法建立准确的机理模型,在高炉自动控制决策过程中,仍将其当为 “黑箱冶系统进行处理. 高炉生产追求稳定,稳定炉况不仅能够保证铁水质量,而且能够提高煤气利用率,达到节能减排的目的. 高炉炉况故障诊断在高炉自动化控制的研究中一直是热点话题,准确及时的故障诊断技术能够确定高炉的稳定生产,降低故障所带来的经济损失[2] . 在高炉生产中,由于缺少准确的机理模型,往往从数据驱动角度建立高炉故障诊断模型[3] . 基于专家系统的故障诊断方法,计算机模仿专家经验,进行故障决策[4] . 虽然引进国外的专家系统有一定的效果,但是

·40· 工程科学学报，第39卷，第1期其价格昂贵，并且国内大多数高炉检测设备落后，操作次，与随机策略需要大量的分类器相比，有意义的重组管理水平低，造成重要参数的数据不完整，不准确，导显著减少了分类器的数量，从而得到较好的性能且提致国外专家系统难以适合我国国情.文献[5]基于人高了训练的速度：工神经网络建立了高炉故障诊断模型，取得了不错的我们首先详细介绍本文提出的全局优化最小二乘效果.但由于其建立在大数定理的渐近理论之上，要支持向量机分类算法，其次我们建立高炉智能故障诊求学习样本足够多，收敛速度比较慢且容易陷入局部断模型，最后展示基于真实生产数据的故障仿真结果极值或过学习的困境，在实际应用中隐含层的层数及 1基于全局优化最小二乘支持向量机的多每层神经元数目如何确定也无规律可循.李振[)将贝叶斯技术运用到高炉故障诊断中，设计了因果关系贝类别分类方法叶斯网络诊断模型.然而高炉的智能故障诊断面临的 1.1最小二乘支持向量机是典型故障样本少、特征参数呈非线性耦合且维数较支持向量机(SVM)能较好地解决小样本、非线性高的模式识别难题，所建立的贝叶斯模型往往达不到以及高维数的模式识别问题.支持向量机通过结构风期望的精度.除此之外，高炉处于复杂的工业生产环险最小化原理来提高泛化能力，可以用于解决二元分境中，样本数据往往受到噪声干扰，这要求故障诊断算类问题，已在模式识别、信号处理和函数逼近领域得到法有很强的鲁棒性.高炉故障具有不同的形式，属于应用s-).最小二乘支持向量机(least-squares support 多分类问题，设计合理有效的故障检测分类器至关重 vector machine,LS-SVM)是Suykens和Vandewallets]在要.同时高炉生产对于故障检测的及时性也有一定的 Vapnik的标准支持向量机的基础上提出的一种改进要求)]，及时准确的进行故障检测报警，不仅能够减少方法.最小二乘支持向量机在优化问题中引入误差的损失，而且能够保证高炉顺行，延长高炉寿命平方项，用等式约束取代原先支持向量机的不等式约本文针对冶炼过程中出现的悬料、崩料和管道行束条件，将耗时的二次规划问题转化为线性方程组的程三种典型故障，提出基于全局优化支持向量机的多求解，大幅度地简化了训练过程. 类别高炉故障诊断方法.一方面，在智能故障诊断系给定具有N个n维样本向量的训练集T={(x, 统的构建过程中，为了降低特征空间的维数，减少存储 y),（x22),…,(xw,yx)},其中x∈R是第k个输空间的占用，提高机器学习的效率，需要对高炉的故障入向量，y∈Y={1,-1}是第k个输人向量在二元分特征参数进行自动的筛选.在数据预处理阶段，我们类问题中的类标签.当样本在输入空间不能被线性分采用核主成分分析(kernel principal component analy- 开时，选择一个非线性映射中(·)：R→H,把样本向 ss,KPCA)方法对高炉故障特征数据进行降维处理，量从输入空间R”映射到特征空间H.当在特征空间保留和高炉故障关联性较高的特征数据，提高检测准 H构建最优超平面时，训练算法只需要计算该空间向确率.另外核函数的参数选择和支持向量机的惩罚因量间的内积，即中(x:)中(x),通过引人核函数K(x, 子影响着故障诊断系统的训练效果，为了避免人为设 x)=Φ(x:)中(x),使得高维空间的内积运算转化为定参数的弊端，需要系统自发地对参数的最优值进行原始输入空间核函数的计算.支持向量分类机的目标寻找.本文在粒子群算法[)的基础上，提出变尺度离是在特征空间中构建最优线性决策函数：散粒子群参数优化方法，通过加强最优粒子的影响力， y(x)=sgn(wΦ(x)+b). (1) 增强了系统的稳定性.另一方面，高炉故障诊断本质其中，(·)是从输入向量到高维特征空间的非线性映上是多类别分类问题，而支持向量机是针对二元分类射，仙是最优分类超平面的法向量，b为偏移量. 问题的学习方法，通常的处理方式是将复杂的多元分假设训练集在特征空间中是线性可分的，最优分类问题分解为多个简单的二元分类问题.纠错输出编类超平面应满足如下条件：码是一种分解重组多元分类问题的通用方法，其中一 y[wΦ(x)+b]≥1，k=1,2,…,N. (2) 对多、密集随机编码法与一对一、稀疏随机编码法分别当训练集在特征空间中为线性不可分时，任何分类超是经典的二元和三元编码方法的实例[).然而，以上平面都必然有错误的划分，因此不能要求所有训练点方法的编码矩阵是预先定义好的，在编码矩阵的创建均满足约束条件(2).为此，对第个训练点(x,y)引过程中，没有考虑到训练样本的数据特征，使得训练过人松弛变量5≥0，把约束条件放宽为：程具有一定的盲目性.本文采用以Fisher线性判别率为标准的启发式纠错输出编码，该方法具有两个方面 (y[wΦ(x)+b]≥1-≥0，k=1,2,…,N; 的优势：首先，启发式的编码过程允许类集合按照最大 5≥0， k=1,2,…,N 的判别率重新组织，从而使编码矩阵的拓扑结构同一 (3) 对一和一对多方法固定的方式相比变得更加灵活.其专=(5,2，…，专、)体现了训练集被错分的情况，而由专

工程科学学报,第 39 卷,第 1 期其价格昂贵,并且国内大多数高炉检测设备落后,操作管理水平低,造成重要参数的数据不完整,不准确,导致国外专家系统难以适合我国国情. 文献[5]基于人工神经网络建立了高炉故障诊断模型,取得了不错的效果. 但由于其建立在大数定理的渐近理论之上,要求学习样本足够多,收敛速度比较慢且容易陷入局部极值或过学习的困境,在实际应用中隐含层的层数及每层神经元数目如何确定也无规律可循. 李振[6]将贝叶斯技术运用到高炉故障诊断中,设计了因果关系贝叶斯网络诊断模型. 然而高炉的智能故障诊断面临的是典型故障样本少、特征参数呈非线性耦合且维数较高的模式识别难题,所建立的贝叶斯模型往往达不到期望的精度. 除此之外,高炉处于复杂的工业生产环境中,样本数据往往受到噪声干扰,这要求故障诊断算法有很强的鲁棒性. 高炉故障具有不同的形式,属于多分类问题,设计合理有效的故障检测分类器至关重要. 同时高炉生产对于故障检测的及时性也有一定的要求[5] ,及时准确的进行故障检测报警,不仅能够减少损失,而且能够保证高炉顺行,延长高炉寿命. 本文针对冶炼过程中出现的悬料、崩料和管道行程三种典型故障,提出基于全局优化支持向量机的多类别高炉故障诊断方法. 一方面,在智能故障诊断系统的构建过程中,为了降低特征空间的维数,减少存储空间的占用,提高机器学习的效率,需要对高炉的故障特征参数进行自动的筛选. 在数据预处理阶段,我们采用核主成分分析( kernel principal component analy鄄 sis, KPCA)方法对高炉故障特征数据进行降维处理, 保留和高炉故障关联性较高的特征数据,提高检测准确率. 另外核函数的参数选择和支持向量机的惩罚因子影响着故障诊断系统的训练效果,为了避免人为设定参数的弊端,需要系统自发地对参数的最优值进行寻找. 本文在粒子群算法[7] 的基础上,提出变尺度离散粒子群参数优化方法,通过加强最优粒子的影响力, 增强了系统的稳定性. 另一方面,高炉故障诊断本质上是多类别分类问题,而支持向量机是针对二元分类问题的学习方法,通常的处理方式是将复杂的多元分类问题分解为多个简单的二元分类问题. 纠错输出编码是一种分解重组多元分类问题的通用方法,其中一对多、密集随机编码法与一对一、稀疏随机编码法分别是经典的二元和三元编码方法的实例[7] . 然而,以上方法的编码矩阵是预先定义好的,在编码矩阵的创建过程中,没有考虑到训练样本的数据特征,使得训练过程具有一定的盲目性. 本文采用以 Fisher 线性判别率为标准的启发式纠错输出编码,该方法具有两个方面的优势:首先,启发式的编码过程允许类集合按照最大的判别率重新组织,从而使编码矩阵的拓扑结构同一对一和一对多方法固定的方式相比变得更加灵活. 其次,与随机策略需要大量的分类器相比,有意义的重组显著减少了分类器的数量,从而得到较好的性能且提高了训练的速度. 我们首先详细介绍本文提出的全局优化最小二乘支持向量机分类算法,其次我们建立高炉智能故障诊断模型,最后展示基于真实生产数据的故障仿真结果. 1 基于全局优化最小二乘支持向量机的多类别分类方法 1郾 1 最小二乘支持向量机支持向量机(SVM)能较好地解决小样本、非线性以及高维数的模式识别问题. 支持向量机通过结构风险最小化原理来提高泛化能力,可以用于解决二元分类问题,已在模式识别、信号处理和函数逼近领域得到应用[8鄄鄄9] . 最小二乘支持向量机( least鄄squares support vector machine, LS鄄SVM)是 Suykens 和 Vandewalle [8]在 Vapnik 的标准支持向量机的基础上提出的一种改进方法. 最小二乘支持向量机在优化问题中引入误差的平方项,用等式约束取代原先支持向量机的不等式约束条件,将耗时的二次规划问题转化为线性方程组的求解,大幅度地简化了训练过程. 给定具有 N 个 n 维样本向量的训练集 T = {( x1 , y1 ),(x2 ,y2 ),…,( xN ,yN )}, 其中 xk沂R n 是第 k 个输入向量,yk沂Y = {1, - 1}是第 k 个输入向量在二元分类问题中的类标签. 当样本在输入空间不能被线性分开时,选择一个非线性映射椎(·):R n寅H,把样本向量从输入空间 R n 映射到特征空间 H. 当在特征空间 H 构建最优超平面时,训练算法只需要计算该空间向量间的内积,即椎(xi ) 椎( xj ),通过引入核函数资( xi, xj) = 椎(xi)椎( xj ),使得高维空间的内积运算转化为原始输入空间核函数的计算. 支持向量分类机的目标是在特征空间中构建最优线性决策函数: y(x) = sgn (棕 T椎(x) + b). (1) 其中,椎(·)是从输入向量到高维特征空间的非线性映射,棕是最优分类超平面的法向量,b 为偏移量. 假设训练集在特征空间中是线性可分的,最优分类超平面应满足如下条件: yk[棕 T椎(xk) + b]逸1,k = 1,2,…,N. (2) 当训练集在特征空间中为线性不可分时,任何分类超平面都必然有错误的划分,因此不能要求所有训练点均满足约束条件(2). 为此,对第个训练点( xk,yk ) 引入松弛变量孜k逸0,把约束条件放宽为: yk[棕 T椎(xk) + b]逸1 - 孜k逸0, k = 1,2,…,N; 孜{ k逸0, k = 1,2,…,N. (3) 孜 = (孜1 ,孜2 ,…,孜N )体现了训练集被错分的情况,而由孜 ·40·

张海刚等：基于全局优化支持向量机的多类别高炉故障诊断 .41 可以构造出表述训练集被错划的程度.根据结构风险识别算法中最小化原则，最小二乘支持向量机在目标函数中选取 1.2.1纠错输出编码 2作为损失函数，寻找最优超平面的问题转化为下列纠错输出编码(error correcting output codes, 二次规划问题 ECOC)是处理多元分类问题的通用框架，它能够通过 /minJ(a,5)=w'w+2名i, 1 编码减少数据样本维数，提高样本质量，从而可以保证采用较少的支持向量机分类器建立故障诊断模型，解 s.l.y[wΦ(x)+b]=1-5≥0，k=1,2,…,N. 决支持向量机多元分类问题[).总体来讲，可以把纠 (4) 错输出编码方法分解为两个不同的阶段：编码和解码. 其中，c是为了均衡目标函数所引进的惩罚系数.求解在编码阶段，对于一组给定类别的训练样本集合，为每式(4)，需引入Lagrangian函数L(w,b,专；a.)即个类别设计一套单独的码字（代表每个类的编码的比 L(0,b,5;a)=J八w,5)- 特序列)，码字的每个位置标示了某一类的训练样本在相应的二元分类器中的标签归属.在解码阶段，寻 ∑a[w'(x)+b]+-l. (5) 找与实验样本分类结果最匹配的码字，指定输人向量其中a为Lagrangian乘子.根据Karush-Kuhn-Tucker 的类别标签，从而得到最终的分类决策.通过拆分重 (KKT)优化条件[o]可得组原始的类别集合并且将二元分类方法嵌入以实际问 (0L=0→w= 立a(x 题为导向的纠错编码设计过程，有效的解决了复杂的 d w 多分类问题 aL 在编码步骤中，对于给定的待学习的N类样本集 ab =0=立=0， k1 合，在为每个类分配一行独一无二的长度为n的码字 RaL =0→4=c5,k=1,2,…,N, (6) 时，形成了n个不同的二元分类问题.码字的每个比 agk 特位根据某类训练样本集在相应二元分类器的归属， aL =0=→y[wΦ(x)+b]+5-1=0, 被编码为+1（正例）或者-1（负例）.将码字按照矩 d&k 阵的行向量排列起来，可以得到一个二元的N×n编 =1,2,…,N 码矩阵M,其中M,∈{-1，+1}.在此基础上，Allwein 引人某个核函数K(·)后，最优化问题最终转化成式等[)在编码过程中引入了0符号，这意味着在某些分 (7)线性方程组的求解类器中某些类的样本是不被考虑的，通过忽略这些类 0 1 b 的样本对分类器的影响，三元的纠错输出编码结构丰 K(x1,x)+ K()+- 富了类别划分的多样性，最后得到三元编码矩阵M, 其中Mg∈{-1,0，+1. 在解码步骤中，应用n个二元分类器，可以得到每 K(Xxx)+- ·K(x,xx)+ 个测试样本长度为n的输出编码，根据输出编码与各 C (7) 个码字之间的距离测度可以决定其类别的归属。常用解方程组得到最优解α‘=（α，a,,…,a)和b·得的距离测度是汉明距离，对于任意的测试样本的分类到决策函数结果可以用如下公式表示 y=sgn [ -sign(Mf(x)）l aiyik(x,x;)+b (9) L.2 Fisher线性判别纠错输出编码其中，f(x)表示测试样本在第j个分类器中的分类高炉故障形式多样，不同故障有不同的表现形式. 结果[ 在本文中，我们考虑三种高炉典型故障形式：悬料、崩为了寻找码字长度简短并具有高分辨力的编码矩料和管道行程，是一种多分类问题.在实际的应用过阵，总体的算法描述如下：程中，支持向量机被证明是强有力的二元分类方第一步，创建列向量编码二叉树，利用以Fisher线法).然而，当需要处理多元分类问题时，支持向量性判别率为标准的浮动搜索法，递归地寻找第k个父机不能直接用来处理这种信息.在支持向量机算法处节点的类集合S,中具有最大判别率的两个分区{，理多分类问题中，往往将多元分类问题转化为一对多 oil. 的二元分类问题.然而这种转化往往会增加分类器的第二步，根据得到的分割结果{p,9}为编码矩个数，增加训练时间.在这一小节中，我们介绍Fisher 阵M的第k列赋值. 线性判别纠错输出编码，并将其应用到高炉的多故障其中，第一步创建了列向量编码二叉树.表1描

张海刚等: 基于全局优化支持向量机的多类别高炉故障诊断可以构造出表述训练集被错划的程度. 根据结构风险最小化原则,最小二乘支持向量机在目标函数中选取孜 2 作为损失函数,寻找最优超平面的问题转化为下列二次规划问题 min 棕,b,孜 J(棕,孜k) = 1 2 棕 T棕 + 1 2 c移 N k =1 孜 2 k, s. t. yk[棕 T椎(xk) + b] = 1 - 孜k 逸0, k = 1,2,…, { N. (4) 其中,c 是为了均衡目标函数所引进的惩罚系数. 求解式(4),需引入 Lagrangian 函数 L(棕,b,孜;琢k)即 L(棕,b,孜;琢k) = J(棕,孜k) - 移 N k = 1 琢k{yk[棕 T椎(xk) + b] + 孜k - 1}. (5) 其中琢k 为 Lagrangian 乘子. 根据 Karush鄄鄄Kuhn鄄鄄Tucker (KKT)优化条件[10]可得鄣 L 鄣棕 = 0圯棕 = 移 N k = 1 琢k yk椎(xk), 鄣 L 鄣 b = 0圯移 N k = 1 琢k yk = 0, 鄣 L 鄣孜k = 0圯琢k = c孜k, k = 1,2,…,N, 鄣 L 鄣琢k = 0圯yk[棕 T椎(xk) + b] + 孜k - 1 = 0, k = 1,2,…, ì î í ï ï ï ï ï ï ï ï ï ï N. (6) 引入某个核函数资(·) 后,最优化问题最终转化成式 (7)线性方程组的求解 0 1 … 1 1 资(x1 ,x1 )+ 1 c … 资(x1 ,xN)+ 1 c 左左埙 1 资(xN,x1 )+ 1 c … 资(xN,xN)+ 1 é ë ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú c b 琢1 左琢 é ë ê ê ê ê ê ù û ú ú ú ú ú N = 0 y1 左 y é ë ê ê ê ê ê ù û ú ú ú ú ú N . (7) 解方程组得到最优解琢 * = (琢 * 1 ,琢 * 2 ,…,琢 * N ) 和 b * 得到决策函数 y = sgn [ 移 N k = 1 琢 * k y * k 资(x,xi) + b ] * . (8) 1郾 2 Fisher 线性判别纠错输出编码高炉故障形式多样,不同故障有不同的表现形式. 在本文中,我们考虑三种高炉典型故障形式:悬料、崩料和管道行程,是一种多分类问题. 在实际的应用过程中,支持向量机被证明是强有力的二元分类方法[11] . 然而,当需要处理多元分类问题时,支持向量机不能直接用来处理这种信息. 在支持向量机算法处理多分类问题中,往往将多元分类问题转化为一对多的二元分类问题. 然而这种转化往往会增加分类器的个数,增加训练时间. 在这一小节中,我们介绍 Fisher 线性判别纠错输出编码,并将其应用到高炉的多故障识别算法中. 1郾 2郾 1 纠错输出编码纠错输出编码 ( error correcting output codes, ECOC)是处理多元分类问题的通用框架,它能够通过编码减少数据样本维数,提高样本质量,从而可以保证采用较少的支持向量机分类器建立故障诊断模型,解决支持向量机多元分类问题[12] . 总体来讲,可以把纠错输出编码方法分解为两个不同的阶段:编码和解码. 在编码阶段,对于一组给定类别的训练样本集合,为每个类别设计一套单独的码字(代表每个类的编码的比特序列),码字的每个位置标示了某一类的训练样本在相应的二元分类器中的标签归属. 在解码阶段,寻找与实验样本分类结果最匹配的码字,指定输入向量的类别标签,从而得到最终的分类决策. 通过拆分重组原始的类别集合并且将二元分类方法嵌入以实际问题为导向的纠错编码设计过程,有效的解决了复杂的多分类问题. 在编码步骤中,对于给定的待学习的 N 类样本集合,在为每个类分配一行独一无二的长度为 n 的码字时,形成了 n 个不同的二元分类问题. 码字的每个比特位根据某类训练样本集在相应二元分类器的归属, 被编码为 + 1(正例) 或者 - 1(负例). 将码字按照矩阵的行向量排列起来,可以得到一个二元的 N 伊 n 编码矩阵 M,其中 Mij沂{ - 1, + 1}. 在此基础上,Allwein 等[13]在编码过程中引入了 0 符号,这意味着在某些分类器中某些类的样本是不被考虑的,通过忽略这些类的样本对分类器的影响,三元的纠错输出编码结构丰富了类别划分的多样性,最后得到三元编码矩阵 M, 其中 Mij沂{ - 1,0, + 1}. 在解码步骤中,应用 n 个二元分类器,可以得到每个测试样本长度为 n 的输出编码,根据输出编码与各个码字之间的距离测度可以决定其类别的归属. 常用的距离测度是汉明距离,对于任意的测试样本的分类结果可以用如下公式表示 y^ = arg min r = 1,2,…,N移 n j = [ 1 1 - sign(Mrj f j(x)) ] 2 . (9) 其中,f j ( x) 表示测试样本在第 j 个分类器中的分类结果[14] . 为了寻找码字长度简短并具有高分辨力的编码矩阵,总体的算法描述如下: 第一步,创建列向量编码二叉树,利用以 Fisher 线性判别率为标准的浮动搜索法,递归地寻找第 k 个父节点的类集合 Sk 中具有最大判别率的两个分区{渍 1 k, 渍 2 k}. 第二步,根据得到的分割结果{ 渍 1 k,渍 2 k } 为编码矩阵 M 的第 k 列赋值. 其中,第一步创建了列向量编码二叉树. 表 1 描 ·41·

·42· 工程科学学报，第39卷，第1期述了创建列向量编码二叉树的算法.每一个树节点定 IC.C.C.C.C.C.C.C] 义了一个类集合分割的问题，每个节点的分割必须满足使判别率最大化的条件.通过最大化数据x和为分 C.C.C] 割结果所创建的类标签d之间的交互信息可以得到最终的列代码.算法中d是一个离散的随机变量，因此 IC.C (C.C.C 给定类集合S的一个分割结果{p,}=BP(S),d N 按如下形式定义： C..C IC 1, C d=d(x,BP(S))= if xECIC;EPL, (-1,if xEC;IC;Ei C (10) 表1列向量编码二叉树创建方法 Table 1 Binary tree creation methods of column vectors 图1八元分类问题列向量编码二叉树列向量编码二叉树 Fig.1 Binary tree based on column vector coding for the 8-class classification problem 初始化：创建类集合{c的初始分制{6，} {e6,6}=1⑦，{C,C2,…,Cv.1 L0={6},k=1 步骤1S。是L4-1的第一个元素，L=L4-1/S。解码步骤2寻找最优的二元分割：BP(S) 1.=吗(x,d(BP(S)) 其中1(·)是交互信息准则，x是训练样本向量，d是与 C 分类标签相关的离散随机变量. C, 步骤3L2={U},如果11>1，ie{1,2} C C. 步骤4如果1L1≠0 别 C k=k+1返回步骤1 C C 将二叉树视为寻找码字的手段，第二步是填充纠 C. 错输出编码矩阵的过程.利用除了叶节点外的每个根 h hs 节点得到的列代码，组成了编码矩阵M.列代码作为 LS-SVM二元分类器矩阵M的列向量依次排列.为了创建每一个列代码，可以使用父节点和子节点的关系进行描述.对于给定图2纠错输出编码矩阵的类C,和节点k的类集合k:{pUp},其中pi和p Fig.2 Coding matrix for the error correction output 分别是节点k的子节点，矩阵M按如下方式填充：类器h区分{C,C6}和{C2}. 0, ifC,年p:； 1.2.2 Fisher线性判别浮动搜索法 M(r,i)= +1,ifC,∈9； (11) 在本小节，我们设计了一种Fisher线性判别率为 (-1,if c,eo. 标准的启发式纠错输出编码，并将其运用到判别纠错注意到列的数量n和内部节点的数量一致.容易输出编码算法中.该算法能够利用较少的支持向量机得出，在任何的二叉树中，如果叶节点的数量是N。,内分类器，实现高炉故障的多分类问题部节点的数量是N。-1,因此可以确定码字的长度是回顾表1中描述的算法，为了将类集合分割成两 N。-1. 个部分，需要一个最大化判别率的过程。但是，最好的图1展示了一个八元分类问题列向量编码二叉树分割子集需要在所有可能的分割中无遗漏的寻找，由构造的过程于这种方法是不切实际的，所以必须使用一种次优的图2显示了判别纠错输出编码矩阵的结果.其中策略.浮动搜索方法是一种次优的顺序搜索方法，能白色的方格表示相应的位置被编码为+1，黑色的方格够缓解穷举搜索法在进行分割选择时，产生的高额计表示-1，灰色的方格表示0.因此，C。类的码字是{1，算代价.而且，这种方法允许搜索方向是变化的，从而 0,-1,0-1,0,1}.编码矩阵的第i列定义了一个二元解决了许多顺序搜索方法的主要限制. 分类问题，将相应的二元分类器h,进行训练.例如，分表2中的方法为顺序前向浮动搜索法(sequential

工程科学学报,第 39 卷,第 1 期述了创建列向量编码二叉树的算法. 每一个树节点定义了一个类集合分割的问题,每个节点的分割必须满足使判别率最大化的条件. 通过最大化数据 x 和为分割结果所创建的类标签 d 之间的交互信息可以得到最终的列代码. 算法中 d 是一个离散的随机变量,因此给定类集合 Sk 的一个分割结果{ 渍 1 k,渍 2 k } = BP( Sk ),d 按如下形式定义: d = d(x,BP(Sk)) = 1, if x沂Ci | Ci沂渍 1 k, - 1, if x沂Ci | Ci沂渍 2 k { . (10) 表 1 列向量编码二叉树创建方法 Table 1 Binary tree creation methods of column vectors 列向量编码二叉树初始化: 创建类集合{ci}的初始分割{渍 1 0 ,渍 2 0 } {渍 1 0 ,渍 2 0 } = {芰,{C1 ,C2 ,…,CNc }} L0 = {渍 2 0 },k = 1 步骤 1 Sk 是 Lk - 1的第一个元素,L忆k = Lk - 1 / Sk 步骤 2 寻找最优的二元分割:BP(Sk) {渍 1 k ,渍 2 k } = arg max BP(Sk ) (I(x,d(BP(Sk)))) 其中 I(·)是交互信息准则,x 是训练样本向量,d 是与分类标签相关的离散随机变量. 步骤 3 Lk = {L忆k胰渍 i k},如果| 渍 i k | > 1,坌i沂{1,2} 步骤 4 如果| Lk |屹0 k = k + 1 返回步骤 1 将二叉树视为寻找码字的手段,第二步是填充纠错输出编码矩阵的过程. 利用除了叶节点外的每个根节点得到的列代码,组成了编码矩阵 M. 列代码作为矩阵 M 的列向量依次排列. 为了创建每一个列代码, 可以使用父节点和子节点的关系进行描述. 对于给定的类 Cr 和节点 k 的类集合 k:{渍 1 k胰渍 2 k },其中渍 1 k 和渍 2 k 分别是节点 k 的子节点,矩阵 M 按如下方式填充: M(r,i) = 0, if Cr埸渍i; + 1, if Cr沂渍 1 i ; - 1, if Cr沂渍 2 i ì î í ïï ïï . (11) 注意到列的数量 n 和内部节点的数量一致. 容易得出,在任何的二叉树中,如果叶节点的数量是 Nc,内部节点的数量是 Nc - 1,因此可以确定码字的长度是 Nc - 1. 图 1 展示了一个八元分类问题列向量编码二叉树构造的过程. 图 2 显示了判别纠错输出编码矩阵的结果. 其中白色的方格表示相应的位置被编码为 + 1,黑色的方格表示 - 1,灰色的方格表示 0. 因此,C6 类的码字是{1, 0, - 1,0 - 1,0,1}. 编码矩阵的第 i 列定义了一个二元分类问题,将相应的二元分类器 hi 进行训练. 例如,分图 1 八元分类问题列向量编码二叉树 Fig. 1 Binary tree based on column vector coding for the 8鄄class classification problem 图 2 纠错输出编码矩阵 Fig. 2 Coding matrix for the error correction output 类器 h5 区分{C5 ,C6 }和{C2 }. 1郾 2郾 2 Fisher 线性判别浮动搜索法在本小节,我们设计了一种 Fisher 线性判别率为标准的启发式纠错输出编码,并将其运用到判别纠错输出编码算法中. 该算法能够利用较少的支持向量机分类器,实现高炉故障的多分类问题. 回顾表 1 中描述的算法,为了将类集合分割成两个部分,需要一个最大化判别率的过程. 但是,最好的分割子集需要在所有可能的分割中无遗漏的寻找,由于这种方法是不切实际的,所以必须使用一种次优的策略. 浮动搜索方法是一种次优的顺序搜索方法,能够缓解穷举搜索法在进行分割选择时,产生的高额计算代价. 而且,这种方法允许搜索方向是变化的,从而解决了许多顺序搜索方法的主要限制. 表 2 中的方法为顺序前向浮动搜索法( sequential ·42·

张海刚等：基于全局优化支持向量机的多类别高炉故障诊断 ·43· floating forward selection,SFFS).这种方法以空的类集产的需求.在此我们采用粒子群算法(particle swarm 合X。开始并在新集合的判别率增加时被逐渐填充. optimization,PSO)对于最小二乘支持向量机分类器的在填充阶段，对于类集合X.最有意义的类被纳入进学习参数进行优化.粒子群算法起源于对鸟群寻找食来.在条件排除步骤，如果判别率继续增长则最差的类物行为的模仿].标准粒子群优化算法主要针对连被移除续参数进行搜索运算，但高炉全局参数优化是离散的表2顺序前向浮动搜索法组合优化问题，为此需采用离散粒子群优化算法 Table 2 SFFS method 假设一个由m个粒子组成的群体在D维的搜索 SFFS算法空间以一定的速度飞行，粒子i在第：次迭代中的状态输人： Y={y少j=1,2,…,D/能够使用的类集合/ 属性设置如下：x=(xa,xa,…,xn),xa∈[L4,Ua]为输出： X4={xj=1,2,…,IYI,x∈Y 第i个粒子(i=1,2,…,m,d=1,2,…,D)的维位置矢初始化： X。=☑：k=0 量，L4和U,分别为搜索空间的下限和上限，根据适应终止条件：当判别率不再增长J(X2)≈J(X-1) 度函数计算x:当前的适应值，即可衡量粒子位置的优第一步（填充） x`=吗XU）劣；y,=(a,a,…,n),a∈[Dn,ax]为i粒子的的 Xi,1=XUx',k=k+1 飞行速度，即粒子移动的距离，和分别为最小和第二步（排除） x”=arg maxJ(X-x) 最大速度；P.=(PaPa,Pn)为粒子自身迄今为止搜如果(X-x“)>J八X-1)那么素到的最优位置；P,=(P,…PD)为整个粒子群迄今 X+1=X-x“,k=k+1 为止搜索到的最优位置.对于离散组合优化问题，粒返回第二步，否则返回第一步子在每一个维度均被限定为0或1，更新粒子的位置意味着改变某一位的状态为0或1，对于速度矢量，其为了避免高维空间庞大的计算量，选择Fisher线相应位表示的是x取0或1的概率，在每次迭代中，粒性判别率作为分割类集合的标准.假设C,和C2是二子根据以下等式更新速度和位置：分类问题的两个类.定义Fisher线性判别率为 v(1+1)=wv(t)+cr(Pia-xa())+ J(w)=- m1-m212 (16) (12) c2'2(Pm-xu(t)). s+5号 (1,p<sigmoid(v(t+1)); 式中m,和m2是样本的均值，s,和s2是C,和C2各 xa(t+1)= (0,p=sigmoid(v(t+1)). (17) 自的方差.定义类内散射矩阵S。和类间散射矩阵式中：是迭代次数；r2和p为[0,1]之间的随机数， S。为：用于保持群体的多样性；C1和c2为学习因子，使粒子 S=是x-m,)x-m'+王(x-m)x-m)八，具有自我总结和向群体中优秀个体学习的能力，从而 S.=(m1-m2)(m1-m2). 向自己的历史最优点以及群体内历史最优点靠近，通 (13) 常取c1=c2=2;0为惯性权重，其大小决定了粒子对根据上面的结果，J(w)可以被写成当前速度继承的多少，选择一个合适的有助于粒子 wS w 群算法均衡它的探索能力与开发能力：sigmoid数是常 J(w)= wSw (14) 用的一种模糊函数，其表达式为类间散射矩阵S,可以被看作是一个类的密度指标. 1 并且，类间散射矩阵S。可以被看作是一个类的位置指 S(t)=sigmoid(())=1+exp( 标因此，可以定义判别率 (18) 在离散粒子群优化方法(discrete particle swarm 15) optimization,DSP0)中，每个粒子平等的更新，忽视了 1.3变尺度离散粒子群最优粒子的优势.在现实世界中，大多数社会性动物高炉生产环境复杂，生产数据往往遭到工业噪声都存在等级现象，最好的个体往往享受着某些特权的干扰，这对于故障识别算法有强鲁棒性的要求.另因此根据粒子的表现好坏，应采用不同的进化策略. 外，高炉运行状态繁多，各种炉况之间相互转化，设计首先，运用式(18)计算概率向量，即prob=Sa 稳定可靠的故障分类器至关重要.最小二乘支持向量然后，根据如下原则更新粒子的概率向量，位置矢量和机分类算法中学习参数的选择，对于故障分类精度影速度矢量：(1)对于获胜的粒子，根据式(16)和式(17) 响严重.合适的学习参数不仅能够提高分类器的故障分别更新其概率向量，位置矢量和速度矢量：(2)对于识别精度，而且能够保证分类器稳定运行，满足高炉生失败粒子，速度矢量和位置矢量按如下等式更新

张海刚等: 基于全局优化支持向量机的多类别高炉故障诊断 floating forward selection, SFFS). 这种方法以空的类集合 X0 开始并在新集合的判别率增加时被逐渐填充. 在填充阶段,对于类集合 Xk 最有意义的类被纳入进来. 在条件排除步骤,如果判别率继续增长则最差的类被移除. 表 2 顺序前向浮动搜索法 Table 2 SFFS method SFFS 算法输入: Y = {yj | j = 1,2,…,D} / / 能够使用的类集合/ / 输出: Xk = {xj | j = 1,2,…, | Y | ,xj沂Y} 初始化: X0 = 芰;k = 0 终止条件: 当判别率不再增长 J(Xk)抑J(Xk - 1 ) 第一步(填充) x + = arg max x沂Y - Xk J(Xk胰x) Xk + 1 = Xk胰x + ,k = k + 1 第二步(排除) x - = arg max x沂Xk J(Xk - x) 如果 J(Xk - x - ) > J(Xk - 1 )那么 Xk + 1 = Xk - x - ,k = k + 1 返回第二步,否则返回第一步为了避免高维空间庞大的计算量,选择 Fisher 线性判别率作为分割类集合的标准. 假设 C1 和 C2 是二分类问题的两个类. 定义 Fisher 线性判别率为 J(棕) = | m1 - m2 | 2 s 2 1 + s 2 2 . (12) 式中 m1 和 m2 是样本的均值,s1 和 s2 是 C1 和 C2 各自的方差. 定义类内散射矩阵 S棕和类间散射矩阵 Sb 为: S棕 =移x沂C1 (x - m1) (x - m1) T +移x沂C2 (x - m2) (x - m2) T , Sb = (m1 - m2) (m1 - m2) T { . (13) 根据上面的结果,J(棕)可以被写成 J(棕) = 棕 T Sb棕棕 T S棕棕 . (14) 类间散射矩阵 S棕可以被看作是一个类的密度指标. 并且,类间散射矩阵 Sb 可以被看作是一个类的位置指标. 因此,可以定义判别率 J忆 = trSb trS棕 . (15) 1郾 3 变尺度离散粒子群高炉生产环境复杂,生产数据往往遭到工业噪声的干扰,这对于故障识别算法有强鲁棒性的要求. 另外,高炉运行状态繁多,各种炉况之间相互转化,设计稳定可靠的故障分类器至关重要. 最小二乘支持向量机分类算法中学习参数的选择,对于故障分类精度影响严重. 合适的学习参数不仅能够提高分类器的故障识别精度,而且能够保证分类器稳定运行,满足高炉生产的需求. 在此我们采用粒子群算法( particle swarm optimization, PSO)对于最小二乘支持向量机分类器的学习参数进行优化. 粒子群算法起源于对鸟群寻找食物行为的模仿[15] . 标准粒子群优化算法主要针对连续参数进行搜索运算,但高炉全局参数优化是离散的组合优化问题,为此需采用离散粒子群优化算法. 假设一个由 m 个粒子组成的群体在 D 维的搜索空间以一定的速度飞行,粒子 i 在第 t 次迭代中的状态属性设置如下:xi = ( xi1 ,xi2 ,…,xiD ),xid沂[ Ld ,Ud ] 为第 i 个粒子(i = 1,2,…,m,d = 1,2,…,D)的维位置矢量,Ld 和 Ud 分别为搜索空间的下限和上限,根据适应度函数计算 xi 当前的适应值,即可衡量粒子位置的优劣;vi = ( vi1 ,vi2 ,…,viD ),vid沂[ vmin ,vmax ]为 i 粒子的的飞行速度,即粒子移动的距离,vmin和 vmax分别为最小和最大速度;pi = (pi1 ,pi2 ,…,piD )为粒子自身迄今为止搜索到的最优位置;pg = (pg1 ,…,pgD )为整个粒子群迄今为止搜索到的最优位置. 对于离散组合优化问题,粒子在每一个维度均被限定为 0 或 1,更新粒子的位置意味着改变某一位的状态为 0 或 1,对于速度矢量,其相应位表示的是 xid取0 或1 的概率,在每次迭代中,粒子根据以下等式更新速度和位置: vid (t + 1) = wvid (t) + c1 r1 (pid - xid (t)) + c2 r2 (pgd - xid (t)). (16) xid (t + 1) = 1, 籽 < sigmoid(vid (t + 1)); 0, 籽逸sigmoid(v { id (t + 1)). (17) 式中:t 是迭代次数;r1 、r2 和籽为[0,1]之间的随机数, 用于保持群体的多样性;c1 和 c2 为学习因子,使粒子具有自我总结和向群体中优秀个体学习的能力,从而向自己的历史最优点以及群体内历史最优点靠近,通常取 c1 = c2 = 2;w 为惯性权重,其大小决定了粒子对当前速度继承的多少,选择一个合适的 w 有助于粒子群算法均衡它的探索能力与开发能力;sigmoid 数是常用的一种模糊函数,其表达式为 Sid (t) = sigmoid(vid (t)) = 1 1 + exp( - vid (t)) . (18) 在离散粒子群优化方法 ( discrete particle swarm optimization, DSPO)中,每个粒子平等的更新,忽视了最优粒子的优势. 在现实世界中,大多数社会性动物都存在等级现象,最好的个体往往享受着某些特权. 因此根据粒子的表现好坏,应采用不同的进化策略. 首先,运用式(18) 计算概率向量,即 probid = Sid . 然后,根据如下原则更新粒子的概率向量,位置矢量和速度矢量:(1)对于获胜的粒子,根据式(16)和式(17) 分别更新其概率向量,位置矢量和速度矢量;(2)对于失败粒子,速度矢量和位置矢量按如下等式更新. ·43·

44 工程科学学报，第39卷，第1期 prob"(+1)=prob"(+ 1 ,ifx(t)=1; 图3所示. 开始 ml(u+)=m(0-京i若(0=0 高炉生产现场传感器采样原始数据 (19) (t+1)=S-(prob(t+1)). (20) 对数据进行预处理得到输人向量N,组成训练样本集T (1,if n<prob"(t+1) xa(t+1)= (21) (0,ifn≥prob(t+1). 设置离散粒子群优化方法的最大迭代次数：和种群数目m, 初始化=0，随机生成粒子H的初始速度和位置式中，H,是层次因子，η为[0,1]之间的随机数. 生为了克服粒子过早成熟，在离散粒子群优化方法否是否产生变异？一中引入突变因素.随着迭代次数增加时，最优的结果没有得到改善，将执行突变操作是立对粒子执行突变操作 1,if专<Pm并且xa=0; xa(t+1)= (22) 0,if专<Pm并且xa=1. 父利用核主成分分析法去除输入向量N的噪声和元余，式中，Pm是突变概率，是[0,1]之间的随机数. 得到压缩后的特征参数集 2高炉智能故障诊断模型对样本采用五倍交叉验证，依据isher 线性判别率生成DECOC的编码矩阵本文依据高炉冶炼原理和在长期生产实践中积累根据编码矩阵训练V个最小二乘支持向量机二元分类器的故障征兆描述，结合宝钢2500m3高炉自身先进检测技术的优势，对冶炼过程中出现的悬料、崩料和管道行计算适应度函数的值程三种典型故障进行诊断分析. 在进行故障分析时，为了更好地反映真实的炉况确定个体最优粒子和全局最优粒子以及winner和loser 状态，不能仅仅依赖高炉现场数据的瞬时值，而是要考虑一段时间内数据的整体特征.宝钢现场数据采集系依据不同的尺度更新粒子的位置统采样间隔为1$，依据悬料、崩料和管道行程故障出现时在一段时间内产生的异常现象，以900个采样点 =+1 为周期，计算数据的均值、方差和变化率，最终确定炉况诊断系统的特征参数向量为F=(GQ,CQ,HP,TP, 是否停止迭代？欧 △P,K),其中GQ为煤气流量，CQ为冷风流量，HP为热风压力，TP为炉顶压力，△P为压差，K为透气性指是业输出最优粒子开数，各参数都由样本均值、方差和变化率组成. 先进的检测技术为故障诊断带来更多的信息支结束持，宝钢2500m3高炉在炉顶不同的位置安装有六个微波雷达，用于测量当前料面上六个不同位置的料线深图3高炉智能故障诊断流程 Fig.3 Intelligent fault diagnosis scheme for BF 度，雷达数据能够反映径向料面和料速变化的规律. 在炉喉斜桥方向开始沿圆周每隔90°安装一根测温由于生产环境和检测手段的限制，采样数据往往梁，其上共有17个十字测温点，能自动连续地测出炉变得极其复杂、混乱和冗余.未经预处理的采样数据喉径向温度，根据温度变化，能判断煤气流在炉喉的径会导致所提取的特征参数受到不同程度的噪声污染，向分布.在应用改进的均值滤波方法去除六点雷达数从而影响诊断推理的精度.由于特征参数选择的随意据的噪声并采用二维滑动多项式曲面拟合对径向的十性且数量众多，构成样本向量的不同特征参数之间常字测温数据进行预处理6]，最终得到炉况诊断系统的常具有一定的非线性相关性，大量的数据不但占用巨环境信息向量为E=(Rad,Rad2,…,Rad,CT,RT,大的存储空间和计算时间，加重了诊断推理机的负担， △T),其中Rad,i=1,2,…,6为六点雷达各自的波被动降低了系统的实时性，而且有用的知识往往会淹没在值，CT为中心点温度均值，RT为边沿温度均值，△T为大量的冗余数据中.为了分析重要的特征，抑制无用边沿中心温度差.综合上述参数集，形成最终的高炉的信息，需要进行特征提取.本文选用核主元分析诊断输人向量N=(F,E).高炉智能故障诊断流程如法[]对数据进行压缩和信息抽取，可以有效地找出数

工程科学学报,第 39 卷,第 1 期 prob loser id (t + 1) = prob loser id (t) + 1 Hf , if x winner id (t) = 1; prob loser id (t + 1) = prob loser id (t) - 1 Hf , if x winner id (t) = 0 ì î í ï ï ï ï . (19) v loser id (t + 1) = S - 1 (prob loser id (t + 1)). (20) xid (t + 1) = 1, if 浊 < prob loser id (t + 1); 0, if 浊逸prob loser { id (t + 1). (21) 式中,Hf 是层次因子,浊为[0,1]之间的随机数. 为了克服粒子过早成熟,在离散粒子群优化方法中引入突变因素. 随着迭代次数增加时,最优的结果没有得到改善,将执行突变操作. xid (t + 1) = 1, if 孜 < pm 并且 xid = 0; 0, if 孜 < pm 并且 x { id = 1. (22) 式中,pm 是突变概率,孜是[0,1]之间的随机数. 2 高炉智能故障诊断模型本文依据高炉冶炼原理和在长期生产实践中积累的故障征兆描述,结合宝钢 2500 m 3高炉自身先进检测技术的优势,对冶炼过程中出现的悬料、崩料和管道行程三种典型故障进行诊断分析. 在进行故障分析时,为了更好地反映真实的炉况状态,不能仅仅依赖高炉现场数据的瞬时值,而是要考虑一段时间内数据的整体特征. 宝钢现场数据采集系统采样间隔为 1 s,依据悬料、崩料和管道行程故障出现时在一段时间内产生的异常现象,以 900 个采样点为周期,计算数据的均值、方差和变化率,最终确定炉况诊断系统的特征参数向量为 F = (GQ,CQ,HP,TP, 驻P,K),其中 GQ 为煤气流量,CQ 为冷风流量,HP 为热风压力,TP 为炉顶压力,驻P 为压差,K 为透气性指数,各参数都由样本均值、方差和变化率组成. 先进的检测技术为故障诊断带来更多的信息支持,宝钢 2500 m 3高炉在炉顶不同的位置安装有六个微波雷达,用于测量当前料面上六个不同位置的料线深度,雷达数据能够反映径向料面和料速变化的规律. 在炉喉斜桥方向开始沿圆周每隔 90毅安装一根测温梁,其上共有 17 个十字测温点,能自动连续地测出炉喉径向温度,根据温度变化,能判断煤气流在炉喉的径向分布. 在应用改进的均值滤波方法去除六点雷达数据的噪声并采用二维滑动多项式曲面拟合对径向的十字测温数据进行预处理[16] ,最终得到炉况诊断系统的环境信息向量为 E = (Rad1 ,Rad2 ,…,Rad6 ,CT,RT, 驻T),其中 Radi,i = 1,2,…,6 为六点雷达各自的波动值,CT 为中心点温度均值,RT 为边沿温度均值,驻T 为边沿中心温度差. 综合上述参数集,形成最终的高炉诊断输入向量 IN = (F,E). 高炉智能故障诊断流程如图 3 所示. 图 3 高炉智能故障诊断流程 Fig. 3 Intelligent fault diagnosis scheme for BF 由于生产环境和检测手段的限制,采样数据往往变得极其复杂、混乱和冗余. 未经预处理的采样数据会导致所提取的特征参数受到不同程度的噪声污染, 从而影响诊断推理的精度. 由于特征参数选择的随意性且数量众多,构成样本向量的不同特征参数之间常常具有一定的非线性相关性,大量的数据不但占用巨大的存储空间和计算时间,加重了诊断推理机的负担, 降低了系统的实时性,而且有用的知识往往会淹没在大量的冗余数据中. 为了分析重要的特征,抑制无用的信息,需要进行特征提取. 本文选用核主元分析法[17]对数据进行压缩和信息抽取,可以有效地找出数 ·44·

张海刚等：基于全局优化支持向量机的多类别高炉故障诊断 ·45· 据中最主要的元素和结构，能够消除特征参数间的冗 0.45 余以及噪声对特征参数的干扰，将原有的复杂数据降 0.40 维，把众多指标转化为少数几个综合指标，同时保留甚 0.35 至强化了该数据的主要特征，揭示了隐藏在复杂数据 ÷0.30 0.25 背后的简单结构，从而使数据更容易处理 0.20 在整个诊断系统中，假设c=(c,c2,…,cn)是n个 0.15 最小二乘支持向量机二元分类器的惩罚系数，c:被限 0.10 定在{2°，2，…，20}；0=(01,02，…，0。，c)是n+ 0.05 ☑ 1个径向基核函数的宽度参数，σ，被限定在123,22，第一主元第二主元第三主元其他主元 …,2}:f={∫，…∫m}是m个特征参数的特征选择主成分变量集∫=1表示第i个参数被选中，∫=0表示第i个参图4核主成分分析仿真结果 Fig.4 Simulation results of the KPCA method 数未被选中.组合上述参数集，形成一个混合向量H =(c,σ，)，需运用变尺度离散粒子群优化方法对其进 1000 行优化 800 -Cz 适应度函数是系统总体表现的衡量标准，根据系 =G, 统的训练准确率、支持向量的数量和参数选择的个数 600 评判每个粒子表现的优劣.现设定如下形式的适应度中图 400 函数： ines=4)[只言(a>0)]广. 200 50100150200250 300 [片豆>0]： (23) 变尺度离散粒子群优化方法迭代次数式中，f(A-.)表示对训练集的数据运用n重交叉检图5惩罚因子优化过程 Fig.5 Optimization process of penalty factor 验的平均正确率，言N(“>0)表示支持向量在所 40 —0 有训练样本中占的比例，品三N(>0)表示速中的 3.5 30 特征参数在所有参数中占的比例. 2.5 3实验仿真 20 1.5 为了检验本文提出的基于全局优化支持向量机的多类别故障诊断方法，选取宝钢高炉生产过程中具有代表性的500组炉况数据，其中正常炉况数据200组， 0.5 悬料、崩料和管道行程异常炉况各100组，利用其中 50 100150200 250 300 400组数据作为训练样本，剩余100组作为测试样本. 变尺度离散粒子群优化方法迭代次数在故障检测模型中，我们提取高炉特征数据N= 图6宽度参数优化过程 (F,E).该特征数据含有15维特征，采用核主成分分 Fig.6 Optimization process of width parameter 析方法对其进行降维处理.图4展示了核主成分分析法在粒子寻优的初期具有极大的搜索范围，粒子的变方法的仿真结果图.从图中可以看到每个主元所代表异性能够有效地防止粒子陷入局部极值，在搜索的后数据特征的比重.我们提取前三个主元所代表的特征期，该算法能够在小范围内对最优值进行调整，最终得数据作为模型的输人.前三个主元代表了95.5%的特到的最优参数如表3所示征属性，能够满足模型的要求. 表3最优参数值设置变尺度离散粒子群优化方法最大迭代次数为 Table 3 Optimal parameters 300次，最小二乘支持向量机分类器的惩罚因子= 参量 LS-SVM LS-SVM2 LS-SVM2 KPCA (c1,c2,c3)和径向基核函数的宽度参数0=(01,02， O3,·xc)的自寻优过程分别如图5和图6所示. 127 74 38 3.135 由图5和图6可以看出变尺度离散粒子群优化方 0.367 1.544 1.735

张海刚等: 基于全局优化支持向量机的多类别高炉故障诊断据中最主要的元素和结构,能够消除特征参数间的冗余以及噪声对特征参数的干扰,将原有的复杂数据降维,把众多指标转化为少数几个综合指标,同时保留甚至强化了该数据的主要特征,揭示了隐藏在复杂数据背后的简单结构,从而使数据更容易处理. 在整个诊断系统中,假设 c = (c1 ,c2 ,…,cn )是 n 个最小二乘支持向量机二元分类器的惩罚系数,ci 被限定在{2 0 ,2 1 ,…,2 10 };滓 = (滓1 ,滓2 ,…,滓n ,滓KPCA )是 n + 1 个径向基核函数的宽度参数,滓i 被限定在{2 - 3 ,2 - 2 , …,2 5 };f = {f 1 ,f 2 ,…,fm }是 m 个特征参数的特征选择集,f i = 1 表示第 i 个参数被选中,f i = 0 表示第 i 个参数未被选中. 组合上述参数集,形成一个混合向量 H = (c,滓,f),需运用变尺度离散粒子群优化方法对其进行优化. 适应度函数是系统总体表现的衡量标准,根据系统的训练准确率、支持向量的数量和参数选择的个数评判每个粒子表现的优劣. 现设定如下形式的适应度函数: fitness = f(Atest - n ) [ 1 N 移 N i = 1 N(琢i > 0) ] - 1 [ · 1 m 移 m i = 1 N(f i > 0) ] - 1 . (23) 式中,f(Atest - n )表示对训练集的数据运用 n 重交叉检验的平均正确率, 1 N 移 N i = 1 N(琢i > 0)表示支持向量在所有训练样本中占的比例, 1 m 移 m i = 1 N( f i > 0)表示选中的特征参数在所有参数中占的比例. 3 实验仿真为了检验本文提出的基于全局优化支持向量机的多类别故障诊断方法,选取宝钢高炉生产过程中具有代表性的 500 组炉况数据,其中正常炉况数据 200 组, 悬料、崩料和管道行程异常炉况各 100 组,利用其中 400 组数据作为训练样本,剩余 100 组作为测试样本. 在故障检测模型中,我们提取高炉特征数据 IN = (F,E). 该特征数据含有 15 维特征,采用核主成分分析方法对其进行降维处理. 图 4 展示了核主成分分析方法的仿真结果图. 从图中可以看到每个主元所代表数据特征的比重. 我们提取前三个主元所代表的特征数据作为模型的输入. 前三个主元代表了 95郾 5% 的特征属性,能够满足模型的要求. 设置变尺度离散粒子群优化方法最大迭代次数为 300 次,最小二乘支持向量机分类器的惩罚因子 c = (c1 ,c2 ,c3 )和径向基核函数的宽度参数滓 = (滓1 ,滓2 , 滓3 ,滓KPCA )的自寻优过程分别如图 5 和图 6 所示. 由图 5 和图 6 可以看出变尺度离散粒子群优化方图 4 核主成分分析仿真结果 Fig. 4 Simulation results of the KPCA method 图 5 惩罚因子优化过程 Fig. 5 Optimization process of penalty factor 图 6 宽度参数优化过程 Fig. 6 Optimization process of width parameter 法在粒子寻优的初期具有极大的搜索范围,粒子的变异性能够有效地防止粒子陷入局部极值,在搜索的后期,该算法能够在小范围内对最优值进行调整,最终得到的最优参数如表 3 所示. 表 3 最优参数值 Table 3 Optimal parameters 参量 LS鄄SVM1 LS鄄SVM2 LS鄄SVM3 KPCA c 127 74 38 — 滓 3郾 135 0郾 367 1郾 544 1郾 735 ·45·

46· 工程科学学报，第39卷，第1期进一步，对高炉故障训练样本采用Fisher线性判征统计参数，从数据预处理和参数优化两个方面着手，别纠错输出编码法得到编码矩阵，如表4所示应用变尺度离散粒子群优化方法提升了最小二乘支持表4高炉故障编码矩阵向量机二元分类器的整体性能，进而通过启发式的纠 Table 4 Coding matrix of BF faults 错输出编码设计，将二元分类器推广至多元故障分类，类别分类器1 分类器2 分类器3 使用较少的分类器，在提升系统实时性的同时得到了正常 +1 0 0 良好的诊断效果，为高炉故障的在线监控提出了一种悬料 -1 +1 可行的方法料 -1 +1 0 参考文献管道行程 -1 -1 -1 [1]Liang J B.The Blast Furnace Condition Diagnosis System Design 在测试阶段，本文将基于参数优化的纠错输出编 and Implementation based on the Gas Flow Rate Dissertation ] 码多类别故障诊断方法与传统的无参数优化(c=10, Changsha:Central South University,2009 σ=0.4)的一对一、一对多、密集随机编码和稀疏随机 (梁剑波.基于煤气流量的高炉炉况诊断系统设计及实现[学位论文].长沙：中南大学，2009) 编码四种方法进行对比，进行1000次实验后得到平均 [2]Li Q H.Fuzzy ldentification Prediction and Control to B.F Iron- 结果如表5所示 making Process [Dissertation ]Zhejiang:Zhejiang University, 表5不同纠错输出编码方法结果比较 2005 Table 5 Comparison results of different ECOC methods (李启会.高炉治炼过程的模糊辨识、预测与控制[学位论码字特征压准确率/ 文].浙江：浙江大学，2005) 编码方法长度码元缩率/% % [3]Gao C H,Jian L,Chen J M,et al.Data-driven modeling and 纠错输出编码 3 3 37.1 88.3 predictive algorithm for complex blast fumace ironmaking process. 一对多 4 3 100 67.1 Acta Autom Sin,2009.35(6):725 一对一 6 3 (郜传厚，渐令，陈积明，等.复杂高炉炼铁过程的数据驱动 100 84.7 建模及预测算法.自动化学报，2009,35(6)：725) 密集随机编码 10 100 76.7 [4] Liu L M,Wang A N,Sha M,et al.Fault diagnostics of blast fur- 稀疏随机编码 14 100 78.2 nace based on CIS-SVM /2010 Chinese Conference on Pattern Recognition.IEEE,2010 由表5可以看出故障样本经过特征参数的筛选和 [5]Yang J,Xu Q,Yu C B,et.al.Study on fault diagnosis of blast 压缩之后，显著降低了样本的维数且提高了样本的质 fumace based on ICA-QNN /Proceedings of the 29th Chinese 量，减轻了最小二乘支持向量机分类器的运算负担，增 Control Conference.Beijing,2010:4014 强了系统的分类性能.与其他四种方法相比纠错输出 (杨佳，许强，余成波，等.基于ICA-QNN的高炉故障诊断编码方法提供了最为紧凑的编码，码字长度代表着采研究/第29届中国控制会议.北京，2010：4014) 用最小二乘支持向量机分类器的个数.通过表5可以 [6]Li Z.Research of Blast Furnace Fault Diagnosis based on Bayesian 看出，通过纠错输出编码后，我们采用三个最小二乘支 Netwcorks Dissertation ]Wuhan:Wuhan University of Science 持向量机的分类器就可以实现高炉故障的识别.相比 and Technology,2015 (李振.基于贝叶斯网络(Bayesian Network=)方法的高炉故障于其他算法，分类器的个数得到了很好的抑制，降低了诊断研究[学位论文].武汉：武汉科技大学，2015) 故障识别时间.利用Fisher判别率对类集合的重新整 [7] Pujol 0,Radeva P,Vitria J.Discriminant ECOC:a heuristic 合，帮助分类器得到了较高的准确率.就系统的复杂 method for application dependent design of eror correcting output 性而言，一对多方法与纠错输出编码法最为接近，但是 codes.IEEE Trans Pattern Anal Mach Intell,2006,28(6):1007 前者的准确率却是较低的，因为这种方法容易受到不 [8]Suykens J A K,Vandewalle J.Least squares support vector ma- 同类别训练样本数量不均衡的影响.虽然随机编码方 chine classifiers.Neural Process Lett,1999,9(3):293 法也得到了可以接受的效果.但是，由于它们需要构 [9]Xu M,Wang S T,Gu X.TL-SVM:A transfer learning algo 造的分类器数量过多，严重影响了系统的实时性，不利 rithm.Control Decis,2014,29(1):141 于高炉生产现场炉况的在线监测.相比而言，一对一 (许敏，王士同，顾鑫.TL-SVM:一种迁移学习新算法.控制方法得到了与纠错输出编码相近的分类结果，并且其与决策，2014,29(1)：141) 编码构造方式固定，构造过程简单，可以作为一种备用 [10]Gestel T V,Suykens JA K,Lanckriet G.et al.Multiclass IS- SVMs:moderated outputs and coding-decoding schemes.Neural 的高炉故障诊断系统的编码选择. Process Lett,2002,15(1)45 4结论 [11]Liu L M,Wang A N,Sha M,et.al.Multi-class classification methods of cost-conscious IS-SVM for fault diagnosis of blast 本文针对特定高炉选取与典型故障密切相关的特 furnace.J Iron Steel Res Int,2011,18(10):17

工程科学学报,第 39 卷,第 1 期进一步,对高炉故障训练样本采用 Fisher 线性判别纠错输出编码法得到编码矩阵,如表 4 所示. 表 4 高炉故障编码矩阵 Table 4 Coding matrix of BF faults 类别分类器 1 分类器 2 分类器 3 正常 + 1 0 0 悬料 - 1 - 1 + 1 崩料 - 1 + 1 0 管道行程 - 1 - 1 - 1 在测试阶段,本文将基于参数优化的纠错输出编码多类别故障诊断方法与传统的无参数优化( c = 10, 滓 = 0郾 4)的一对一、一对多、密集随机编码和稀疏随机编码四种方法进行对比,进行 1000 次实验后得到平均结果如表 5 所示. 表 5 不同纠错输出编码方法结果比较 Table 5 Comparison results of different ECOC methods 编码方法码字长度码元特征压缩率/ % 准确率/ % 纠错输出编码 3 3 37郾 1 88郾 3 一对多 4 2 100 67郾 1 一对一 6 3 100 84郾 7 密集随机编码 10 2 100 76郾 7 稀疏随机编码 14 3 100 78郾 2 由表 5 可以看出故障样本经过特征参数的筛选和压缩之后,显著降低了样本的维数且提高了样本的质量,减轻了最小二乘支持向量机分类器的运算负担,增强了系统的分类性能. 与其他四种方法相比纠错输出编码方法提供了最为紧凑的编码,码字长度代表着采用最小二乘支持向量机分类器的个数. 通过表 5 可以看出,通过纠错输出编码后,我们采用三个最小二乘支持向量机的分类器就可以实现高炉故障的识别. 相比于其他算法,分类器的个数得到了很好的抑制,降低了故障识别时间. 利用 Fisher 判别率对类集合的重新整合,帮助分类器得到了较高的准确率. 就系统的复杂性而言,一对多方法与纠错输出编码法最为接近,但是前者的准确率却是较低的,因为这种方法容易受到不同类别训练样本数量不均衡的影响. 虽然随机编码方法也得到了可以接受的效果. 但是,由于它们需要构造的分类器数量过多,严重影响了系统的实时性,不利于高炉生产现场炉况的在线监测. 相比而言,一对一方法得到了与纠错输出编码相近的分类结果,并且其编码构造方式固定,构造过程简单,可以作为一种备用的高炉故障诊断系统的编码选择. 4 结论本文针对特定高炉选取与典型故障密切相关的特征统计参数,从数据预处理和参数优化两个方面着手, 应用变尺度离散粒子群优化方法提升了最小二乘支持向量机二元分类器的整体性能,进而通过启发式的纠错输出编码设计,将二元分类器推广至多元故障分类, 使用较少的分类器,在提升系统实时性的同时得到了良好的诊断效果,为高炉故障的在线监控提出了一种可行的方法. 参考文献 [1] Liang J B. The Blast Furnace Condition Diagnosis System Design and Implementation based on the Gas Flow Rate [ Dissertation]. Changsha: Central South University, 2009 (梁剑波. 基于煤气流量的高炉炉况诊断系统设计及实现[学位论文]. 长沙: 中南大学, 2009) [2] Li Q H. Fuzzy Identification Prediction and Control to B. F Iron鄄 making Process [ Dissertation ]. Zhejiang: Zhejiang University, 2005 (李启会. 高炉冶炼过程的模糊辨识、预测与控制[学位论文]. 浙江: 浙江大学, 2005) [3] Gao C H, Jian L, Chen J M, et al. Data鄄driven modeling and predictive algorithm for complex blast furnace ironmaking process. Acta Autom Sin, 2009, 35(6): 725 (郜传厚, 渐令, 陈积明, 等. 复杂高炉炼铁过程的数据驱动建模及预测算法. 自动化学报, 2009, 35(6): 725) [4] Liu L M, Wang A N, Sha M, et al. Fault diagnostics of blast fur鄄 nace based on CLS鄄鄄 SVM / / 2010 Chinese Conference on Pattern Recognition. IEEE, 2010 [5] Yang J, Xu Q, Yu C B, et. al. Study on fault diagnosis of blast furnace based on ICA鄄鄄 QNN / / Proceedings of the 29th Chinese Control Conference. Beijing, 2010: 4014 (杨佳, 许强, 余成波, 等. 基于 ICA鄄鄄 QNN 的高炉故障诊断研究 / / 第 29 届中国控制会议. 北京, 2010: 4014) [6] Li Z. Research of Blast Furnace Fault Diagnosis based on Bayesian Networks [ Dissertation]. Wuhan: Wuhan University of Science and Technology, 2015 (李振. 基于贝叶斯网络(Bayesian Networks)方法的高炉故障诊断研究[学位论文]. 武汉: 武汉科技大学, 2015) [7] Pujol O, Radeva P, Vitria J. Discriminant ECOC: a heuristic method for application dependent design of error correcting output codes. IEEE Trans Pattern Anal Mach Intell, 2006, 28(6): 1007 [8] Suykens J A K, Vandewalle J. Least squares support vector ma鄄 chine classifiers. Neural Process Lett, 1999, 9(3): 293 [9] Xu M, Wang S T, Gu X. TL鄄鄄 SVM: A transfer learning algo鄄 rithm. Control Decis, 2014, 29(1): 141 (许敏, 王士同, 顾鑫. TL鄄鄄SVM: 一种迁移学习新算法. 控制与决策, 2014, 29(1): 141) [10] Gestel T V, Suykens J A K, Lanckriet G, et al. Multiclass LS鄄鄄 SVMs: moderated outputs and coding鄄decoding schemes. Neural Process Lett, 2002, 15(1): 45 [11] Liu L M, Wang A N, Sha M, et. al. Multi鄄class classification methods of cost鄄conscious LS鄄鄄 SVM for fault diagnosis of blast furnace. J Iron Steel Res Int, 2011, 18(10): 17 ·46·

点击下载完整版文档（PDF格式）

已到末页，全文结束

点击下载（PDF格式）

浏览记录