工程科学学报,第39卷.第1期:39-47,2017年1月 Chinese Journal of Engineering,Vol.39,No.1:39-47,January 2017 D0L:10.13374/j.issn2095-9389.2017.01.005;htp://journals.usth.edu.cm 基于全局优化支持向量机的多类别高炉故障诊断 张海刚12),张森12)四,尹怡欣12) 1)北京科技大学自动化学院,北京1000832)北京科技大学钢铁流程先进控制教育部重点实验室,北京100083 ☒通信作者,E-mail:zhangsen(@usth.cdu.cn 摘要针对高炉故障诊断系统快速性和准确性的要求,提出基于全局优化最小二乘支持向量机的策略.首先,采用变尺度 离散粒子群对最小二乘支持向量机的参数和故障特征的选取进行优化:然后,利用核主元分析法对选取的特征向量进行压缩 整理:最后,构造了以Fisher线性判别率为标准的启发式纠错输出编码.仿真结果表明,通过对故障训练样本有意义地分割重 组,用较少的最小二乘支持向量机分类器,得到较高的故障判断准确率且增强了整个系统的实时性 关键词高炉:故障诊断:最小二乘分析:支持向量机:全局优化 分类号T549 Multi-class fault diagnosis of BF based on global optimization LS-SVM ZHANG Hai-gang2),ZHANG Sen)YIN Yi-xin2) 1)School of Automation and Electrical Engineering,University of Science and Technology Beijing,Beijing 100083.China 2)Key Laboratory of Advanced Control of Iron and Steel Process (Ministry of Education),University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:zhangsen@ustb.edu.cn ABSTRACT Aiming at the requirement of high speed and precision in blast furnace fault diagnosis systems,a new strategy based on global optimization least-squares support vector machines (LS-SVM)was proposed to solve this problem.Firstly,the variable metric discrete particle swarm optimization algorithm was employed to optimize the feature selection and LS-SVM parameters.Secondly,the feature vector was compressed by kernel principal component analysis.Finally,the heuristic error correcting output codes were con- structed on the basis of Fisher linear discriminate rate.In the fault diagnosis scheme,fewer IS-SVM classifiers were applied through meaningful partitions and recombination of fault training samples.Simulation results show that the proposed fault diagnosis method can not only improve the fault detection accurate rate,but also enhance the timeliness of the entire system. KEY WORDS blast furnaces;fault diagnosis;least-squares analysis;support vector machines;global optimization 钢铁工业是我国国民经济的基础产业和支柱产 到节能减排的目的.高炉炉况故障诊断在高炉自动化 业).高炉炼铁在钢铁工业中处于举足轻重的地位. 控制的研究中一直是热点话题,准确及时的故障诊断 高炉炼铁系统生产设备繁多,具有多耦合、大延时、非 技术能够确定高炉的稳定生产,降低故障所带来的经 线性等特点.尽管在高炉本体上安装了很多自动化的 济损失[2) 检测装置,然而由于高炉运行炉况复杂,无法建立准确 在高炉生产中,由于缺少准确的机理模型,往往从 的机理模型,在高炉自动控制决策过程中,仍将其当为 数据驱动角度建立高炉故障诊断模型).基于专家系 “黑箱”系统进行处理.高炉生产追求稳定,稳定炉况 统的故障诊断方法,计算机模仿专家经验,进行故障决 不仅能够保证铁水质量,而且能够提高煤气利用率,达 策[.虽然引进国外的专家系统有一定的效果,但是 收稿日期:2016-03-16 基金项目:国家自然科学基金资助项目(61333002,61673056)
工程科学学报,第 39 卷,第 1 期:39鄄鄄47,2017 年 1 月 Chinese Journal of Engineering, Vol. 39, No. 1: 39鄄鄄47, January 2017 DOI: 10. 13374 / j. issn2095鄄鄄9389. 2017. 01. 005; http: / / journals. ustb. edu. cn 基于全局优化支持向量机的多类别高炉故障诊断 张海刚1,2) , 张 森1,2) 苣 , 尹怡欣1,2) 1) 北京科技大学自动化学院, 北京 100083 2) 北京科技大学钢铁流程先进控制教育部重点实验室, 北京 100083 苣 通信作者, E鄄mail: zhangsen@ ustb. edu. cn 摘 要 针对高炉故障诊断系统快速性和准确性的要求,提出基于全局优化最小二乘支持向量机的策略. 首先,采用变尺度 离散粒子群对最小二乘支持向量机的参数和故障特征的选取进行优化;然后,利用核主元分析法对选取的特征向量进行压缩 整理;最后,构造了以 Fisher 线性判别率为标准的启发式纠错输出编码. 仿真结果表明,通过对故障训练样本有意义地分割重 组,用较少的最小二乘支持向量机分类器,得到较高的故障判断准确率且增强了整个系统的实时性. 关键词 高炉; 故障诊断; 最小二乘分析; 支持向量机; 全局优化 分类号 TF549 Multi鄄class fault diagnosis of BF based on global optimization LS鄄SVM ZHANG Hai鄄gang 1,2) , ZHANG Sen 1,2) 苣 , YIN Yi鄄xin 1,2) 1) School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing 100083, China 2) Key Laboratory of Advanced Control of Iron and Steel Process ( Ministry of Education), University of Science and Technology Beijing, Beijing 100083, China 苣 Corresponding author, E鄄mail: zhangsen@ ustb. edu. cn ABSTRACT Aiming at the requirement of high speed and precision in blast furnace fault diagnosis systems, a new strategy based on global optimization least鄄squares support vector machines (LS鄄SVM) was proposed to solve this problem. Firstly, the variable metric discrete particle swarm optimization algorithm was employed to optimize the feature selection and LS鄄SVM parameters. Secondly, the feature vector was compressed by kernel principal component analysis. Finally, the heuristic error correcting output codes were con鄄 structed on the basis of Fisher linear discriminate rate. In the fault diagnosis scheme, fewer LS鄄SVM classifiers were applied through meaningful partitions and recombination of fault training samples. Simulation results show that the proposed fault diagnosis method can not only improve the fault detection accurate rate, but also enhance the timeliness of the entire system. KEY WORDS blast furnaces; fault diagnosis; least鄄squares analysis; support vector machines; global optimization 收稿日期: 2016鄄鄄03鄄鄄16 基金项目: 国家自然科学基金资助项目(61333002, 61673056) 钢铁工业是我国国民经济的基础产业和支柱产 业[1] . 高炉炼铁在钢铁工业中处于举足轻重的地位. 高炉炼铁系统生产设备繁多,具有多耦合、大延时、非 线性等特点. 尽管在高炉本体上安装了很多自动化的 检测装置,然而由于高炉运行炉况复杂,无法建立准确 的机理模型,在高炉自动控制决策过程中,仍将其当为 “黑箱冶系统进行处理. 高炉生产追求稳定,稳定炉况 不仅能够保证铁水质量,而且能够提高煤气利用率,达 到节能减排的目的. 高炉炉况故障诊断在高炉自动化 控制的研究中一直是热点话题,准确及时的故障诊断 技术能够确定高炉的稳定生产,降低故障所带来的经 济损失[2] . 在高炉生产中,由于缺少准确的机理模型,往往从 数据驱动角度建立高炉故障诊断模型[3] . 基于专家系 统的故障诊断方法,计算机模仿专家经验,进行故障决 策[4] . 虽然引进国外的专家系统有一定的效果,但是
·40· 工程科学学报,第39卷,第1期 其价格昂贵,并且国内大多数高炉检测设备落后,操作 次,与随机策略需要大量的分类器相比,有意义的重组 管理水平低,造成重要参数的数据不完整,不准确,导 显著减少了分类器的数量,从而得到较好的性能且提 致国外专家系统难以适合我国国情.文献[5]基于人 高了训练的速度: 工神经网络建立了高炉故障诊断模型,取得了不错的 我们首先详细介绍本文提出的全局优化最小二乘 效果.但由于其建立在大数定理的渐近理论之上,要 支持向量机分类算法,其次我们建立高炉智能故障诊 求学习样本足够多,收敛速度比较慢且容易陷入局部 断模型,最后展示基于真实生产数据的故障仿真结果 极值或过学习的困境,在实际应用中隐含层的层数及 1基于全局优化最小二乘支持向量机的多 每层神经元数目如何确定也无规律可循.李振[)将贝 叶斯技术运用到高炉故障诊断中,设计了因果关系贝 类别分类方法 叶斯网络诊断模型.然而高炉的智能故障诊断面临的 1.1最小二乘支持向量机 是典型故障样本少、特征参数呈非线性耦合且维数较 支持向量机(SVM)能较好地解决小样本、非线性 高的模式识别难题,所建立的贝叶斯模型往往达不到 以及高维数的模式识别问题.支持向量机通过结构风 期望的精度.除此之外,高炉处于复杂的工业生产环 险最小化原理来提高泛化能力,可以用于解决二元分 境中,样本数据往往受到噪声干扰,这要求故障诊断算 类问题,已在模式识别、信号处理和函数逼近领域得到 法有很强的鲁棒性.高炉故障具有不同的形式,属于 应用s-).最小二乘支持向量机(least-squares support 多分类问题,设计合理有效的故障检测分类器至关重 vector machine,LS-SVM)是Suykens和Vandewallets]在 要.同时高炉生产对于故障检测的及时性也有一定的 Vapnik的标准支持向量机的基础上提出的一种改进 要求)],及时准确的进行故障检测报警,不仅能够减少 方法.最小二乘支持向量机在优化问题中引入误差的 损失,而且能够保证高炉顺行,延长高炉寿命 平方项,用等式约束取代原先支持向量机的不等式约 本文针对冶炼过程中出现的悬料、崩料和管道行 束条件,将耗时的二次规划问题转化为线性方程组的 程三种典型故障,提出基于全局优化支持向量机的多 求解,大幅度地简化了训练过程. 类别高炉故障诊断方法.一方面,在智能故障诊断系 给定具有N个n维样本向量的训练集T={(x, 统的构建过程中,为了降低特征空间的维数,减少存储 y),(x22),…,(xw,yx)},其中x∈R是第k个输 空间的占用,提高机器学习的效率,需要对高炉的故障 入向量,y∈Y={1,-1}是第k个输人向量在二元分 特征参数进行自动的筛选.在数据预处理阶段,我们 类问题中的类标签.当样本在输入空间不能被线性分 采用核主成分分析(kernel principal component analy- 开时,选择一个非线性映射中(·):R→H,把样本向 ss,KPCA)方法对高炉故障特征数据进行降维处理, 量从输入空间R”映射到特征空间H.当在特征空间 保留和高炉故障关联性较高的特征数据,提高检测准 H构建最优超平面时,训练算法只需要计算该空间向 确率.另外核函数的参数选择和支持向量机的惩罚因 量间的内积,即中(x:)中(x),通过引人核函数K(x, 子影响着故障诊断系统的训练效果,为了避免人为设 x)=Φ(x:)中(x),使得高维空间的内积运算转化为 定参数的弊端,需要系统自发地对参数的最优值进行 原始输入空间核函数的计算.支持向量分类机的目标 寻找.本文在粒子群算法[)的基础上,提出变尺度离 是在特征空间中构建最优线性决策函数: 散粒子群参数优化方法,通过加强最优粒子的影响力, y(x)=sgn(wΦ(x)+b). (1) 增强了系统的稳定性.另一方面,高炉故障诊断本质 其中,(·)是从输入向量到高维特征空间的非线性映 上是多类别分类问题,而支持向量机是针对二元分类 射,仙是最优分类超平面的法向量,b为偏移量. 问题的学习方法,通常的处理方式是将复杂的多元分 假设训练集在特征空间中是线性可分的,最优分 类问题分解为多个简单的二元分类问题.纠错输出编 类超平面应满足如下条件: 码是一种分解重组多元分类问题的通用方法,其中一 y[wΦ(x)+b]≥1,k=1,2,…,N. (2) 对多、密集随机编码法与一对一、稀疏随机编码法分别 当训练集在特征空间中为线性不可分时,任何分类超 是经典的二元和三元编码方法的实例[).然而,以上 平面都必然有错误的划分,因此不能要求所有训练点 方法的编码矩阵是预先定义好的,在编码矩阵的创建 均满足约束条件(2).为此,对第个训练点(x,y)引 过程中,没有考虑到训练样本的数据特征,使得训练过 人松弛变量5≥0,把约束条件放宽为: 程具有一定的盲目性.本文采用以Fisher线性判别率 为标准的启发式纠错输出编码,该方法具有两个方面 (y[wΦ(x)+b]≥1-≥0,k=1,2,…,N; 的优势:首先,启发式的编码过程允许类集合按照最大 5≥0, k=1,2,…,N 的判别率重新组织,从而使编码矩阵的拓扑结构同一 (3) 对一和一对多方法固定的方式相比变得更加灵活.其 专=(5,2,…,专、)体现了训练集被错分的情况,而由专
工程科学学报,第 39 卷,第 1 期 其价格昂贵,并且国内大多数高炉检测设备落后,操作 管理水平低,造成重要参数的数据不完整,不准确,导 致国外专家系统难以适合我国国情. 文献[5]基于人 工神经网络建立了高炉故障诊断模型,取得了不错的 效果. 但由于其建立在大数定理的渐近理论之上,要 求学习样本足够多,收敛速度比较慢且容易陷入局部 极值或过学习的困境,在实际应用中隐含层的层数及 每层神经元数目如何确定也无规律可循. 李振[6]将贝 叶斯技术运用到高炉故障诊断中,设计了因果关系贝 叶斯网络诊断模型. 然而高炉的智能故障诊断面临的 是典型故障样本少、特征参数呈非线性耦合且维数较 高的模式识别难题,所建立的贝叶斯模型往往达不到 期望的精度. 除此之外,高炉处于复杂的工业生产环 境中,样本数据往往受到噪声干扰,这要求故障诊断算 法有很强的鲁棒性. 高炉故障具有不同的形式,属于 多分类问题,设计合理有效的故障检测分类器至关重 要. 同时高炉生产对于故障检测的及时性也有一定的 要求[5] ,及时准确的进行故障检测报警,不仅能够减少 损失,而且能够保证高炉顺行,延长高炉寿命. 本文针对冶炼过程中出现的悬料、崩料和管道行 程三种典型故障,提出基于全局优化支持向量机的多 类别高炉故障诊断方法. 一方面,在智能故障诊断系 统的构建过程中,为了降低特征空间的维数,减少存储 空间的占用,提高机器学习的效率,需要对高炉的故障 特征参数进行自动的筛选. 在数据预处理阶段,我们 采用核主成分分析( kernel principal component analy鄄 sis, KPCA)方法对高炉故障特征数据进行降维处理, 保留和高炉故障关联性较高的特征数据,提高检测准 确率. 另外核函数的参数选择和支持向量机的惩罚因 子影响着故障诊断系统的训练效果,为了避免人为设 定参数的弊端,需要系统自发地对参数的最优值进行 寻找. 本文在粒子群算法[7] 的基础上,提出变尺度离 散粒子群参数优化方法,通过加强最优粒子的影响力, 增强了系统的稳定性. 另一方面,高炉故障诊断本质 上是多类别分类问题,而支持向量机是针对二元分类 问题的学习方法,通常的处理方式是将复杂的多元分 类问题分解为多个简单的二元分类问题. 纠错输出编 码是一种分解重组多元分类问题的通用方法,其中一 对多、密集随机编码法与一对一、稀疏随机编码法分别 是经典的二元和三元编码方法的实例[7] . 然而,以上 方法的编码矩阵是预先定义好的,在编码矩阵的创建 过程中,没有考虑到训练样本的数据特征,使得训练过 程具有一定的盲目性. 本文采用以 Fisher 线性判别率 为标准的启发式纠错输出编码,该方法具有两个方面 的优势:首先,启发式的编码过程允许类集合按照最大 的判别率重新组织,从而使编码矩阵的拓扑结构同一 对一和一对多方法固定的方式相比变得更加灵活. 其 次,与随机策略需要大量的分类器相比,有意义的重组 显著减少了分类器的数量,从而得到较好的性能且提 高了训练的速度. 我们首先详细介绍本文提出的全局优化最小二乘 支持向量机分类算法,其次我们建立高炉智能故障诊 断模型,最后展示基于真实生产数据的故障仿真结果. 1 基于全局优化最小二乘支持向量机的多 类别分类方法 1郾 1 最小二乘支持向量机 支持向量机(SVM)能较好地解决小样本、非线性 以及高维数的模式识别问题. 支持向量机通过结构风 险最小化原理来提高泛化能力,可以用于解决二元分 类问题,已在模式识别、信号处理和函数逼近领域得到 应用[8鄄鄄9] . 最小二乘支持向量机( least鄄squares support vector machine, LS鄄SVM)是 Suykens 和 Vandewalle [8]在 Vapnik 的标准支持向量机的基础上提出的一种改进 方法. 最小二乘支持向量机在优化问题中引入误差的 平方项,用等式约束取代原先支持向量机的不等式约 束条件,将耗时的二次规划问题转化为线性方程组的 求解,大幅度地简化了训练过程. 给定具有 N 个 n 维样本向量的训练集 T = {( x1 , y1 ),(x2 ,y2 ),…,( xN ,yN )}, 其中 xk沂R n 是第 k 个输 入向量,yk沂Y = {1, - 1}是第 k 个输入向量在二元分 类问题中的类标签. 当样本在输入空间不能被线性分 开时,选择一个非线性映射 椎(·):R n寅H,把样本向 量从输入空间 R n 映射到特征空间 H. 当在特征空间 H 构建最优超平面时,训练算法只需要计算该空间向 量间的内积,即 椎(xi ) 椎( xj ),通过引入核函数 资( xi, xj) = 椎(xi)椎( xj ),使得高维空间的内积运算转化为 原始输入空间核函数的计算. 支持向量分类机的目标 是在特征空间中构建最优线性决策函数: y(x) = sgn (棕 T椎(x) + b). (1) 其中,椎(·)是从输入向量到高维特征空间的非线性映 射,棕 是最优分类超平面的法向量,b 为偏移量. 假设训练集在特征空间中是线性可分的,最优分 类超平面应满足如下条件: yk[棕 T椎(xk) + b]逸1,k = 1,2,…,N. (2) 当训练集在特征空间中为线性不可分时,任何分类超 平面都必然有错误的划分,因此不能要求所有训练点 均满足约束条件(2). 为此,对第个训练点( xk,yk ) 引 入松弛变量 孜k逸0,把约束条件放宽为: yk[棕 T椎(xk) + b]逸1 - 孜k逸0, k = 1,2,…,N; 孜{ k逸0, k = 1,2,…,N. (3) 孜 = (孜1 ,孜2 ,…,孜N )体现了训练集被错分的情况,而由 孜 ·40·
张海刚等:基于全局优化支持向量机的多类别高炉故障诊断 .41 可以构造出表述训练集被错划的程度.根据结构风险 识别算法中 最小化原则,最小二乘支持向量机在目标函数中选取 1.2.1纠错输出编码 2作为损失函数,寻找最优超平面的问题转化为下列 纠错输出编码(error correcting output codes, 二次规划问题 ECOC)是处理多元分类问题的通用框架,它能够通过 /minJ(a,5)=w'w+2名i, 1 编码减少数据样本维数,提高样本质量,从而可以保证 采用较少的支持向量机分类器建立故障诊断模型,解 s.l.y[wΦ(x)+b]=1-5≥0,k=1,2,…,N. 决支持向量机多元分类问题[).总体来讲,可以把纠 (4) 错输出编码方法分解为两个不同的阶段:编码和解码. 其中,c是为了均衡目标函数所引进的惩罚系数.求解 在编码阶段,对于一组给定类别的训练样本集合,为每 式(4),需引入Lagrangian函数L(w,b,专;a.)即 个类别设计一套单独的码字(代表每个类的编码的比 L(0,b,5;a)=J八w,5)- 特序列),码字的每个位置标示了某一类的训练样本 在相应的二元分类器中的标签归属.在解码阶段,寻 ∑a[w'(x)+b]+-l. (5) 找与实验样本分类结果最匹配的码字,指定输人向量 其中a为Lagrangian乘子.根据Karush-Kuhn-Tucker 的类别标签,从而得到最终的分类决策.通过拆分重 (KKT)优化条件[o]可得 组原始的类别集合并且将二元分类方法嵌入以实际问 (0L=0→w= 立a(x 题为导向的纠错编码设计过程,有效的解决了复杂的 d w 多分类问题 aL 在编码步骤中,对于给定的待学习的N类样本集 ab =0=立=0, k1 合,在为每个类分配一行独一无二的长度为n的码字 RaL =0→4=c5,k=1,2,…,N, (6) 时,形成了n个不同的二元分类问题.码字的每个比 agk 特位根据某类训练样本集在相应二元分类器的归属, aL =0=→y[wΦ(x)+b]+5-1=0, 被编码为+1(正例)或者-1(负例).将码字按照矩 d&k 阵的行向量排列起来,可以得到一个二元的N×n编 =1,2,…,N 码矩阵M,其中M,∈{-1,+1}.在此基础上,Allwein 引人某个核函数K(·)后,最优化问题最终转化成式 等[)在编码过程中引入了0符号,这意味着在某些分 (7)线性方程组的求解 类器中某些类的样本是不被考虑的,通过忽略这些类 0 1 b 的样本对分类器的影响,三元的纠错输出编码结构丰 K(x1,x)+ K()+- 富了类别划分的多样性,最后得到三元编码矩阵M, 其中Mg∈{-1,0,+1. 在解码步骤中,应用n个二元分类器,可以得到每 K(Xxx)+- ·K(x,xx)+ 个测试样本长度为n的输出编码,根据输出编码与各 C (7) 个码字之间的距离测度可以决定其类别的归属。常用 解方程组得到最优解α‘=(α,a,,…,a)和b·得 的距离测度是汉明距离,对于任意的测试样本的分类 到决策函数 结果可以用如下公式表示 y=sgn [ -sign(Mf(x))l aiyik(x,x;)+b (9) L.2 Fisher线性判别纠错输出编码 其中,f(x)表示测试样本在第j个分类器中的分类 高炉故障形式多样,不同故障有不同的表现形式. 结果[ 在本文中,我们考虑三种高炉典型故障形式:悬料、崩 为了寻找码字长度简短并具有高分辨力的编码矩 料和管道行程,是一种多分类问题.在实际的应用过 阵,总体的算法描述如下: 程中,支持向量机被证明是强有力的二元分类方 第一步,创建列向量编码二叉树,利用以Fisher线 法).然而,当需要处理多元分类问题时,支持向量 性判别率为标准的浮动搜索法,递归地寻找第k个父 机不能直接用来处理这种信息.在支持向量机算法处 节点的类集合S,中具有最大判别率的两个分区{, 理多分类问题中,往往将多元分类问题转化为一对多 oil. 的二元分类问题.然而这种转化往往会增加分类器的 第二步,根据得到的分割结果{p,9}为编码矩 个数,增加训练时间.在这一小节中,我们介绍Fisher 阵M的第k列赋值. 线性判别纠错输出编码,并将其应用到高炉的多故障 其中,第一步创建了列向量编码二叉树.表1描
张海刚等: 基于全局优化支持向量机的多类别高炉故障诊断 可以构造出表述训练集被错划的程度. 根据结构风险 最小化原则,最小二乘支持向量机在目标函数中选取 孜 2 作为损失函数,寻找最优超平面的问题转化为下列 二次规划问题 min 棕,b,孜 J(棕,孜k) = 1 2 棕 T棕 + 1 2 c移 N k =1 孜 2 k, s. t. yk[棕 T椎(xk) + b] = 1 - 孜k 逸0, k = 1,2,…, { N. (4) 其中,c 是为了均衡目标函数所引进的惩罚系数. 求解 式(4),需引入 Lagrangian 函数 L(棕,b,孜;琢k)即 L(棕,b,孜;琢k) = J(棕,孜k) - 移 N k = 1 琢k{yk[棕 T椎(xk) + b] + 孜k - 1}. (5) 其中 琢k 为 Lagrangian 乘子. 根据 Karush鄄鄄Kuhn鄄鄄Tucker (KKT)优化条件[10]可得 鄣 L 鄣 棕 = 0圯棕 = 移 N k = 1 琢k yk椎(xk), 鄣 L 鄣 b = 0圯移 N k = 1 琢k yk = 0, 鄣 L 鄣 孜k = 0圯琢k = c孜k, k = 1,2,…,N, 鄣 L 鄣 琢k = 0圯yk[棕 T椎(xk) + b] + 孜k - 1 = 0, k = 1,2,…, ì î í ï ï ï ï ï ï ï ï ï ï N. (6) 引入某个核函数 资(·) 后,最优化问题最终转化成式 (7)线性方程组的求解 0 1 … 1 1 资(x1 ,x1 )+ 1 c … 资(x1 ,xN)+ 1 c 左 左 埙 1 资(xN,x1 )+ 1 c … 资(xN,xN)+ 1 é ë ê ê ê ê ê ê ê ù û ú ú ú ú ú ú ú c b 琢1 左 琢 é ë ê ê ê ê ê ù û ú ú ú ú ú N = 0 y1 左 y é ë ê ê ê ê ê ù û ú ú ú ú ú N . (7) 解方程组得到最优解 琢 * = (琢 * 1 ,琢 * 2 ,…,琢 * N ) 和 b * 得 到决策函数 y = sgn [ 移 N k = 1 琢 * k y * k 资(x,xi) + b ] * . (8) 1郾 2 Fisher 线性判别纠错输出编码 高炉故障形式多样,不同故障有不同的表现形式. 在本文中,我们考虑三种高炉典型故障形式:悬料、崩 料和管道行程,是一种多分类问题. 在实际的应用过 程中,支 持 向 量 机 被 证 明 是 强 有 力 的 二 元 分 类 方 法[11] . 然而,当需要处理多元分类问题时,支持向量 机不能直接用来处理这种信息. 在支持向量机算法处 理多分类问题中,往往将多元分类问题转化为一对多 的二元分类问题. 然而这种转化往往会增加分类器的 个数,增加训练时间. 在这一小节中,我们介绍 Fisher 线性判别纠错输出编码,并将其应用到高炉的多故障 识别算法中. 1郾 2郾 1 纠错输出编码 纠 错 输 出 编 码 ( error correcting output codes, ECOC)是处理多元分类问题的通用框架,它能够通过 编码减少数据样本维数,提高样本质量,从而可以保证 采用较少的支持向量机分类器建立故障诊断模型,解 决支持向量机多元分类问题[12] . 总体来讲,可以把纠 错输出编码方法分解为两个不同的阶段:编码和解码. 在编码阶段,对于一组给定类别的训练样本集合,为每 个类别设计一套单独的码字(代表每个类的编码的比 特序列),码字的每个位置标示了某一类的训练样本 在相应的二元分类器中的标签归属. 在解码阶段,寻 找与实验样本分类结果最匹配的码字,指定输入向量 的类别标签,从而得到最终的分类决策. 通过拆分重 组原始的类别集合并且将二元分类方法嵌入以实际问 题为导向的纠错编码设计过程,有效的解决了复杂的 多分类问题. 在编码步骤中,对于给定的待学习的 N 类样本集 合,在为每个类分配一行独一无二的长度为 n 的码字 时,形成了 n 个不同的二元分类问题. 码字的每个比 特位根据某类训练样本集在相应二元分类器的归属, 被编码为 + 1(正例) 或者 - 1(负例). 将码字按照矩 阵的行向量排列起来,可以得到一个二元的 N 伊 n 编 码矩阵 M,其中 Mij沂{ - 1, + 1}. 在此基础上,Allwein 等[13]在编码过程中引入了 0 符号,这意味着在某些分 类器中某些类的样本是不被考虑的,通过忽略这些类 的样本对分类器的影响,三元的纠错输出编码结构丰 富了类别划分的多样性,最后得到三元编码矩阵 M, 其中 Mij沂{ - 1,0, + 1}. 在解码步骤中,应用 n 个二元分类器,可以得到每 个测试样本长度为 n 的输出编码,根据输出编码与各 个码字之间的距离测度可以决定其类别的归属. 常用 的距离测度是汉明距离,对于任意的测试样本的分类 结果可以用如下公式表示 y^ = arg min r = 1,2,…,N移 n j = [ 1 1 - sign(Mrj f j(x)) ] 2 . (9) 其中,f j ( x) 表示测试样本在第 j 个分类器中的分类 结果[14] . 为了寻找码字长度简短并具有高分辨力的编码矩 阵,总体的算法描述如下: 第一步,创建列向量编码二叉树,利用以 Fisher 线 性判别率为标准的浮动搜索法,递归地寻找第 k 个父 节点的类集合 Sk 中具有最大判别率的两个分区{渍 1 k, 渍 2 k}. 第二步,根据得到的分割结果{ 渍 1 k,渍 2 k } 为编码矩 阵 M 的第 k 列赋值. 其中,第一步创建了列向量编码二叉树. 表 1 描 ·41·
·42· 工程科学学报,第39卷,第1期 述了创建列向量编码二叉树的算法.每一个树节点定 IC.C.C.C.C.C.C.C] 义了一个类集合分割的问题,每个节点的分割必须满 足使判别率最大化的条件.通过最大化数据x和为分 C.C.C] 割结果所创建的类标签d之间的交互信息可以得到最 终的列代码.算法中d是一个离散的随机变量,因此 IC.C (C.C.C 给定类集合S的一个分割结果{p,}=BP(S),d N 按如下形式定义: C..C IC 1, C d=d(x,BP(S))= if xECIC;EPL, (-1,if xEC;IC;Ei C (10) 表1列向量编码二叉树创建方法 Table 1 Binary tree creation methods of column vectors 图1八元分类问题列向量编码二叉树 列向量编码二叉树 Fig.1 Binary tree based on column vector coding for the 8-class classification problem 初始化:创建类集合{c的初始分制{6,} {e6,6}=1⑦,{C,C2,…,Cv.1 L0={6},k=1 步骤1S。是L4-1的第一个元素,L=L4-1/S。 解码 步骤2寻找最优的二元分割:BP(S) 1.=吗(x,d(BP(S)) 其中1(·)是交互信息准则,x是训练样本向量,d是与 C 分类标签相关的离散随机变量. C, 步骤3L2={U},如果11>1,ie{1,2} C C. 步骤4如果1L1≠0 别 C k=k+1返回步骤1 C C 将二叉树视为寻找码字的手段,第二步是填充纠 C. 错输出编码矩阵的过程.利用除了叶节点外的每个根 h hs 节点得到的列代码,组成了编码矩阵M.列代码作为 LS-SVM二元分类器 矩阵M的列向量依次排列.为了创建每一个列代码, 可以使用父节点和子节点的关系进行描述.对于给定 图2纠错输出编码矩阵 的类C,和节点k的类集合k:{pUp},其中pi和p Fig.2 Coding matrix for the error correction output 分别是节点k的子节点,矩阵M按如下方式填充: 类器h区分{C,C6}和{C2}. 0, ifC,年p:; 1.2.2 Fisher线性判别浮动搜索法 M(r,i)= +1,ifC,∈9; (11) 在本小节,我们设计了一种Fisher线性判别率为 (-1,if c,eo. 标准的启发式纠错输出编码,并将其运用到判别纠错 注意到列的数量n和内部节点的数量一致.容易 输出编码算法中.该算法能够利用较少的支持向量机 得出,在任何的二叉树中,如果叶节点的数量是N。,内 分类器,实现高炉故障的多分类问题 部节点的数量是N。-1,因此可以确定码字的长度是 回顾表1中描述的算法,为了将类集合分割成两 N。-1. 个部分,需要一个最大化判别率的过程。但是,最好的 图1展示了一个八元分类问题列向量编码二叉树 分割子集需要在所有可能的分割中无遗漏的寻找,由 构造的过程 于这种方法是不切实际的,所以必须使用一种次优的 图2显示了判别纠错输出编码矩阵的结果.其中 策略.浮动搜索方法是一种次优的顺序搜索方法,能 白色的方格表示相应的位置被编码为+1,黑色的方格 够缓解穷举搜索法在进行分割选择时,产生的高额计 表示-1,灰色的方格表示0.因此,C。类的码字是{1, 算代价.而且,这种方法允许搜索方向是变化的,从而 0,-1,0-1,0,1}.编码矩阵的第i列定义了一个二元 解决了许多顺序搜索方法的主要限制. 分类问题,将相应的二元分类器h,进行训练.例如,分 表2中的方法为顺序前向浮动搜索法(sequential
工程科学学报,第 39 卷,第 1 期 述了创建列向量编码二叉树的算法. 每一个树节点定 义了一个类集合分割的问题,每个节点的分割必须满 足使判别率最大化的条件. 通过最大化数据 x 和为分 割结果所创建的类标签 d 之间的交互信息可以得到最 终的列代码. 算法中 d 是一个离散的随机变量,因此 给定类集合 Sk 的一个分割结果{ 渍 1 k,渍 2 k } = BP( Sk ),d 按如下形式定义: d = d(x,BP(Sk)) = 1, if x沂Ci | Ci沂渍 1 k, - 1, if x沂Ci | Ci沂渍 2 k { . (10) 表 1 列向量编码二叉树创建方法 Table 1 Binary tree creation methods of column vectors 列向量编码二叉树 初始化: 创建类集合{ci}的初始分割{渍 1 0 ,渍 2 0 } {渍 1 0 ,渍 2 0 } = {芰,{C1 ,C2 ,…,CNc }} L0 = {渍 2 0 },k = 1 步骤 1 Sk 是 Lk - 1的第一个元素,L忆k = Lk - 1 / Sk 步骤 2 寻找最优的二元分割:BP(Sk) {渍 1 k ,渍 2 k } = arg max BP(Sk ) (I(x,d(BP(Sk)))) 其中 I(·)是交互信息准则,x 是训练样本向量,d 是与 分类标签相关的离散随机变量. 步骤 3 Lk = {L忆k胰渍 i k},如果| 渍 i k | > 1,坌i沂{1,2} 步骤 4 如果| Lk |屹0 k = k + 1 返回步骤 1 将二叉树视为寻找码字的手段,第二步是填充纠 错输出编码矩阵的过程. 利用除了叶节点外的每个根 节点得到的列代码,组成了编码矩阵 M. 列代码作为 矩阵 M 的列向量依次排列. 为了创建每一个列代码, 可以使用父节点和子节点的关系进行描述. 对于给定 的类 Cr 和节点 k 的类集合 k:{渍 1 k胰渍 2 k },其中 渍 1 k 和 渍 2 k 分别是节点 k 的子节点,矩阵 M 按如下方式填充: M(r,i) = 0, if Cr埸渍i; + 1, if Cr沂渍 1 i ; - 1, if Cr沂渍 2 i ì î í ïï ïï . (11) 注意到列的数量 n 和内部节点的数量一致. 容易 得出,在任何的二叉树中,如果叶节点的数量是 Nc,内 部节点的数量是 Nc - 1,因此可以确定码字的长度是 Nc - 1. 图 1 展示了一个八元分类问题列向量编码二叉树 构造的过程. 图 2 显示了判别纠错输出编码矩阵的结果. 其中 白色的方格表示相应的位置被编码为 + 1,黑色的方格 表示 - 1,灰色的方格表示 0. 因此,C6 类的码字是{1, 0, - 1,0 - 1,0,1}. 编码矩阵的第 i 列定义了一个二元 分类问题,将相应的二元分类器 hi 进行训练. 例如,分 图 1 八元分类问题列向量编码二叉树 Fig. 1 Binary tree based on column vector coding for the 8鄄class classification problem 图 2 纠错输出编码矩阵 Fig. 2 Coding matrix for the error correction output 类器 h5 区分{C5 ,C6 }和{C2 }. 1郾 2郾 2 Fisher 线性判别浮动搜索法 在本小节,我们设计了一种 Fisher 线性判别率为 标准的启发式纠错输出编码,并将其运用到判别纠错 输出编码算法中. 该算法能够利用较少的支持向量机 分类器,实现高炉故障的多分类问题. 回顾表 1 中描述的算法,为了将类集合分割成两 个部分,需要一个最大化判别率的过程. 但是,最好的 分割子集需要在所有可能的分割中无遗漏的寻找,由 于这种方法是不切实际的,所以必须使用一种次优的 策略. 浮动搜索方法是一种次优的顺序搜索方法,能 够缓解穷举搜索法在进行分割选择时,产生的高额计 算代价. 而且,这种方法允许搜索方向是变化的,从而 解决了许多顺序搜索方法的主要限制. 表 2 中的方法为顺序前向浮动搜索法( sequential ·42·
张海刚等:基于全局优化支持向量机的多类别高炉故障诊断 ·43· floating forward selection,SFFS).这种方法以空的类集 产的需求.在此我们采用粒子群算法(particle swarm 合X。开始并在新集合的判别率增加时被逐渐填充. optimization,PSO)对于最小二乘支持向量机分类器的 在填充阶段,对于类集合X.最有意义的类被纳入进 学习参数进行优化.粒子群算法起源于对鸟群寻找食 来.在条件排除步骤,如果判别率继续增长则最差的类 物行为的模仿].标准粒子群优化算法主要针对连 被移除 续参数进行搜索运算,但高炉全局参数优化是离散的 表2顺序前向浮动搜索法 组合优化问题,为此需采用离散粒子群优化算法 Table 2 SFFS method 假设一个由m个粒子组成的群体在D维的搜索 SFFS算法 空间以一定的速度飞行,粒子i在第:次迭代中的状态 输人: Y={y少j=1,2,…,D/能够使用的类集合/ 属性设置如下:x=(xa,xa,…,xn),xa∈[L4,Ua]为 输出: X4={xj=1,2,…,IYI,x∈Y 第i个粒子(i=1,2,…,m,d=1,2,…,D)的维位置矢 初始化: X。=☑:k=0 量,L4和U,分别为搜索空间的下限和上限,根据适应 终止条件: 当判别率不再增长J(X2)≈J(X-1) 度函数计算x:当前的适应值,即可衡量粒子位置的优 第一步(填充) x`=吗XU) 劣;y,=(a,a,…,n),a∈[Dn,ax]为i粒子的的 Xi,1=XUx',k=k+1 飞行速度,即粒子移动的距离,和分别为最小和 第二步(排除) x”=arg maxJ(X-x) 最大速度;P.=(PaPa,Pn)为粒子自身迄今为止搜 如果(X-x“)>J八X-1)那么 素到的最优位置;P,=(P,…PD)为整个粒子群迄今 X+1=X-x“,k=k+1 为止搜索到的最优位置.对于离散组合优化问题,粒 返回第二步,否则返回第一步 子在每一个维度均被限定为0或1,更新粒子的位置 意味着改变某一位的状态为0或1,对于速度矢量,其 为了避免高维空间庞大的计算量,选择Fisher线 相应位表示的是x取0或1的概率,在每次迭代中,粒 性判别率作为分割类集合的标准.假设C,和C2是二 子根据以下等式更新速度和位置: 分类问题的两个类.定义Fisher线性判别率为 v(1+1)=wv(t)+cr(Pia-xa())+ J(w)=- m1-m212 (16) (12) c2'2(Pm-xu(t)). s+5号 (1,p<sigmoid(v(t+1)); 式中m,和m2是样本的均值,s,和s2是C,和C2各 xa(t+1)= (0,p=sigmoid(v(t+1)). (17) 自的方差.定义类内散射矩阵S。和类间散射矩阵 式中:是迭代次数;r2和p为[0,1]之间的随机数, S。为: 用于保持群体的多样性;C1和c2为学习因子,使粒子 S=是x-m,)x-m'+王(x-m)x-m)八, 具有自我总结和向群体中优秀个体学习的能力,从而 S.=(m1-m2)(m1-m2). 向自己的历史最优点以及群体内历史最优点靠近,通 (13) 常取c1=c2=2;0为惯性权重,其大小决定了粒子对 根据上面的结果,J(w)可以被写成 当前速度继承的多少,选择一个合适的有助于粒子 wS w 群算法均衡它的探索能力与开发能力:sigmoid数是常 J(w)= wSw (14) 用的一种模糊函数,其表达式为 类间散射矩阵S,可以被看作是一个类的密度指标. 1 并且,类间散射矩阵S。可以被看作是一个类的位置指 S(t)=sigmoid(())=1+exp( 标因此,可以定义判别率 (18) 在离散粒子群优化方法(discrete particle swarm 15) optimization,DSP0)中,每个粒子平等的更新,忽视了 1.3变尺度离散粒子群 最优粒子的优势.在现实世界中,大多数社会性动物 高炉生产环境复杂,生产数据往往遭到工业噪声 都存在等级现象,最好的个体往往享受着某些特权 的干扰,这对于故障识别算法有强鲁棒性的要求.另 因此根据粒子的表现好坏,应采用不同的进化策略. 外,高炉运行状态繁多,各种炉况之间相互转化,设计 首先,运用式(18)计算概率向量,即prob=Sa 稳定可靠的故障分类器至关重要.最小二乘支持向量 然后,根据如下原则更新粒子的概率向量,位置矢量和 机分类算法中学习参数的选择,对于故障分类精度影 速度矢量:(1)对于获胜的粒子,根据式(16)和式(17) 响严重.合适的学习参数不仅能够提高分类器的故障 分别更新其概率向量,位置矢量和速度矢量:(2)对于 识别精度,而且能够保证分类器稳定运行,满足高炉生 失败粒子,速度矢量和位置矢量按如下等式更新
张海刚等: 基于全局优化支持向量机的多类别高炉故障诊断 floating forward selection, SFFS). 这种方法以空的类集 合 X0 开始并在新集合的判别率增加时被逐渐填充. 在填充阶段,对于类集合 Xk 最有意义的类被纳入进 来. 在条件排除步骤,如果判别率继续增长则最差的类 被移除. 表 2 顺序前向浮动搜索法 Table 2 SFFS method SFFS 算法 输入: Y = {yj | j = 1,2,…,D} / / 能够使用的类集合/ / 输出: Xk = {xj | j = 1,2,…, | Y | ,xj沂Y} 初始化: X0 = 芰;k = 0 终止条件: 当判别率不再增长 J(Xk)抑J(Xk - 1 ) 第一步(填充) x + = arg max x沂Y - Xk J(Xk胰x) Xk + 1 = Xk胰x + ,k = k + 1 第二步(排除) x - = arg max x沂Xk J(Xk - x) 如果 J(Xk - x - ) > J(Xk - 1 )那么 Xk + 1 = Xk - x - ,k = k + 1 返回第二步,否则返回第一步 为了避免高维空间庞大的计算量,选择 Fisher 线 性判别率作为分割类集合的标准. 假设 C1 和 C2 是二 分类问题的两个类. 定义 Fisher 线性判别率为 J(棕) = | m1 - m2 | 2 s 2 1 + s 2 2 . (12) 式中 m1 和 m2 是样本的均值,s1 和 s2 是 C1 和 C2 各 自的方差. 定义类内散射矩阵 S棕 和类间散射矩阵 Sb 为: S棕 =移x沂C1 (x - m1) (x - m1) T +移x沂C2 (x - m2) (x - m2) T , Sb = (m1 - m2) (m1 - m2) T { . (13) 根据上面的结果,J(棕)可以被写成 J(棕) = 棕 T Sb棕 棕 T S棕棕 . (14) 类间散射矩阵 S棕 可以被看作是一个类的密度指标. 并且,类间散射矩阵 Sb 可以被看作是一个类的位置指 标. 因此,可以定义判别率 J忆 = trSb trS棕 . (15) 1郾 3 变尺度离散粒子群 高炉生产环境复杂,生产数据往往遭到工业噪声 的干扰,这对于故障识别算法有强鲁棒性的要求. 另 外,高炉运行状态繁多,各种炉况之间相互转化,设计 稳定可靠的故障分类器至关重要. 最小二乘支持向量 机分类算法中学习参数的选择,对于故障分类精度影 响严重. 合适的学习参数不仅能够提高分类器的故障 识别精度,而且能够保证分类器稳定运行,满足高炉生 产的需求. 在此我们采用粒子群算法( particle swarm optimization, PSO)对于最小二乘支持向量机分类器的 学习参数进行优化. 粒子群算法起源于对鸟群寻找食 物行为的模仿[15] . 标准粒子群优化算法主要针对连 续参数进行搜索运算,但高炉全局参数优化是离散的 组合优化问题,为此需采用离散粒子群优化算法. 假设一个由 m 个粒子组成的群体在 D 维的搜索 空间以一定的速度飞行,粒子 i 在第 t 次迭代中的状态 属性设置如下:xi = ( xi1 ,xi2 ,…,xiD ),xid沂[ Ld ,Ud ] 为 第 i 个粒子(i = 1,2,…,m,d = 1,2,…,D)的维位置矢 量,Ld 和 Ud 分别为搜索空间的下限和上限,根据适应 度函数计算 xi 当前的适应值,即可衡量粒子位置的优 劣;vi = ( vi1 ,vi2 ,…,viD ),vid沂[ vmin ,vmax ]为 i 粒子的的 飞行速度,即粒子移动的距离,vmin和 vmax分别为最小和 最大速度;pi = (pi1 ,pi2 ,…,piD )为粒子自身迄今为止搜 索到的最优位置;pg = (pg1 ,…,pgD )为整个粒子群迄今 为止搜索到的最优位置. 对于离散组合优化问题,粒 子在每一个维度均被限定为 0 或 1,更新粒子的位置 意味着改变某一位的状态为 0 或 1,对于速度矢量,其 相应位表示的是 xid取0 或1 的概率,在每次迭代中,粒 子根据以下等式更新速度和位置: vid (t + 1) = wvid (t) + c1 r1 (pid - xid (t)) + c2 r2 (pgd - xid (t)). (16) xid (t + 1) = 1, 籽 < sigmoid(vid (t + 1)); 0, 籽逸sigmoid(v { id (t + 1)). (17) 式中:t 是迭代次数;r1 、r2 和 籽 为[0,1]之间的随机数, 用于保持群体的多样性;c1 和 c2 为学习因子,使粒子 具有自我总结和向群体中优秀个体学习的能力,从而 向自己的历史最优点以及群体内历史最优点靠近,通 常取 c1 = c2 = 2;w 为惯性权重,其大小决定了粒子对 当前速度继承的多少,选择一个合适的 w 有助于粒子 群算法均衡它的探索能力与开发能力;sigmoid 数是常 用的一种模糊函数,其表达式为 Sid (t) = sigmoid(vid (t)) = 1 1 + exp( - vid (t)) . (18) 在离散粒子群优化方法 ( discrete particle swarm optimization, DSPO)中,每个粒子平等的更新,忽视了 最优粒子的优势. 在现实世界中,大多数社会性动物 都存在等级现象,最好的个体往往享受着某些特权. 因此根据粒子的表现好坏,应采用不同的进化策略. 首先,运用式(18) 计算概率向量,即 probid = Sid . 然后,根据如下原则更新粒子的概率向量,位置矢量和 速度矢量:(1)对于获胜的粒子,根据式(16)和式(17) 分别更新其概率向量,位置矢量和速度矢量;(2)对于 失败粒子,速度矢量和位置矢量按如下等式更新. ·43·
44 工程科学学报,第39卷,第1期 prob"(+1)=prob"(+ 1 ,ifx(t)=1; 图3所示. 开始 ml(u+)=m(0-京i若(0=0 高炉生产现场传感器采样原始数据 (19) (t+1)=S-(prob(t+1)). (20) 对数据进行预处理得到输人向量N,组成训练样本集T (1,if n<prob"(t+1) xa(t+1)= (21) (0,ifn≥prob(t+1). 设置离散粒子群优化方法的最大迭代次数:和种群数目m, 初始化=0,随机生成粒子H的初始速度和位置 式中,H,是层次因子,η为[0,1]之间的随机数. 生 为了克服粒子过早成熟,在离散粒子群优化方法 否 是否产生变异?一 中引入突变因素.随着迭代次数增加时,最优的结果 没有得到改善,将执行突变操作 是立 对粒子执行突变操作 1,if专<Pm并且xa=0; xa(t+1)= (22) 0,if专<Pm并且xa=1. 父 利用核主成分分析法去除输入向量N的噪声和元余, 式中,Pm是突变概率,是[0,1]之间的随机数. 得到压缩后的特征参数集 2高炉智能故障诊断模型 对样本采用五倍交叉验证,依据isher 线性判别率生成DECOC的编码矩阵 本文依据高炉冶炼原理和在长期生产实践中积累 根据编码矩阵训练V个最小二乘支持向量机二元分类器 的故障征兆描述,结合宝钢2500m3高炉自身先进检测 技术的优势,对冶炼过程中出现的悬料、崩料和管道行 计算适应度函数的值 程三种典型故障进行诊断分析. 在进行故障分析时,为了更好地反映真实的炉况 确定个体最优粒子和全局最优粒子以及winner和loser 状态,不能仅仅依赖高炉现场数据的瞬时值,而是要考 虑一段时间内数据的整体特征.宝钢现场数据采集系 依据不同的尺度更新粒子的位置 统采样间隔为1$,依据悬料、崩料和管道行程故障出 现时在一段时间内产生的异常现象,以900个采样点 =+1 为周期,计算数据的均值、方差和变化率,最终确定炉 况诊断系统的特征参数向量为F=(GQ,CQ,HP,TP, 是否停止迭代? 欧 △P,K),其中GQ为煤气流量,CQ为冷风流量,HP为 热风压力,TP为炉顶压力,△P为压差,K为透气性指 是业 输出最优粒子开 数,各参数都由样本均值、方差和变化率组成. 先进的检测技术为故障诊断带来更多的信息支 结束 持,宝钢2500m3高炉在炉顶不同的位置安装有六个微 波雷达,用于测量当前料面上六个不同位置的料线深 图3高炉智能故障诊断流程 Fig.3 Intelligent fault diagnosis scheme for BF 度,雷达数据能够反映径向料面和料速变化的规律. 在炉喉斜桥方向开始沿圆周每隔90°安装一根测温 由于生产环境和检测手段的限制,采样数据往往 梁,其上共有17个十字测温点,能自动连续地测出炉 变得极其复杂、混乱和冗余.未经预处理的采样数据 喉径向温度,根据温度变化,能判断煤气流在炉喉的径 会导致所提取的特征参数受到不同程度的噪声污染, 向分布.在应用改进的均值滤波方法去除六点雷达数 从而影响诊断推理的精度.由于特征参数选择的随意 据的噪声并采用二维滑动多项式曲面拟合对径向的十 性且数量众多,构成样本向量的不同特征参数之间常 字测温数据进行预处理6],最终得到炉况诊断系统的常具有一定的非线性相关性,大量的数据不但占用巨 环境信息向量为E=(Rad,Rad2,…,Rad,CT,RT,大的存储空间和计算时间,加重了诊断推理机的负担, △T),其中Rad,i=1,2,…,6为六点雷达各自的波被动 降低了系统的实时性,而且有用的知识往往会淹没在 值,CT为中心点温度均值,RT为边沿温度均值,△T为 大量的冗余数据中.为了分析重要的特征,抑制无用 边沿中心温度差.综合上述参数集,形成最终的高炉 的信息,需要进行特征提取.本文选用核主元分析 诊断输人向量N=(F,E).高炉智能故障诊断流程如 法[]对数据进行压缩和信息抽取,可以有效地找出数
工程科学学报,第 39 卷,第 1 期 prob loser id (t + 1) = prob loser id (t) + 1 Hf , if x winner id (t) = 1; prob loser id (t + 1) = prob loser id (t) - 1 Hf , if x winner id (t) = 0 ì î í ï ï ï ï . (19) v loser id (t + 1) = S - 1 (prob loser id (t + 1)). (20) xid (t + 1) = 1, if 浊 < prob loser id (t + 1); 0, if 浊逸prob loser { id (t + 1). (21) 式中,Hf 是层次因子,浊 为[0,1]之间的随机数. 为了克服粒子过早成熟,在离散粒子群优化方法 中引入突变因素. 随着迭代次数增加时,最优的结果 没有得到改善,将执行突变操作. xid (t + 1) = 1, if 孜 < pm 并且 xid = 0; 0, if 孜 < pm 并且 x { id = 1. (22) 式中,pm 是突变概率,孜 是[0,1]之间的随机数. 2 高炉智能故障诊断模型 本文依据高炉冶炼原理和在长期生产实践中积累 的故障征兆描述,结合宝钢 2500 m 3高炉自身先进检测 技术的优势,对冶炼过程中出现的悬料、崩料和管道行 程三种典型故障进行诊断分析. 在进行故障分析时,为了更好地反映真实的炉况 状态,不能仅仅依赖高炉现场数据的瞬时值,而是要考 虑一段时间内数据的整体特征. 宝钢现场数据采集系 统采样间隔为 1 s,依据悬料、崩料和管道行程故障出 现时在一段时间内产生的异常现象,以 900 个采样点 为周期,计算数据的均值、方差和变化率,最终确定炉 况诊断系统的特征参数向量为 F = (GQ,CQ,HP,TP, 驻P,K),其中 GQ 为煤气流量,CQ 为冷风流量,HP 为 热风压力,TP 为炉顶压力,驻P 为压差,K 为透气性指 数,各参数都由样本均值、方差和变化率组成. 先进的检测技术为故障诊断带来更多的信息支 持,宝钢 2500 m 3高炉在炉顶不同的位置安装有六个微 波雷达,用于测量当前料面上六个不同位置的料线深 度,雷达数据能够反映径向料面和料速变化的规律. 在炉喉斜桥方向开始沿圆周每隔 90毅安装一根测温 梁,其上共有 17 个十字测温点,能自动连续地测出炉 喉径向温度,根据温度变化,能判断煤气流在炉喉的径 向分布. 在应用改进的均值滤波方法去除六点雷达数 据的噪声并采用二维滑动多项式曲面拟合对径向的十 字测温数据进行预处理[16] ,最终得到炉况诊断系统的 环境信息向量为 E = (Rad1 ,Rad2 ,…,Rad6 ,CT,RT, 驻T),其中 Radi,i = 1,2,…,6 为六点雷达各自的波动 值,CT 为中心点温度均值,RT 为边沿温度均值,驻T 为 边沿中心温度差. 综合上述参数集,形成最终的高炉 诊断输入向量 IN = (F,E). 高炉智能故障诊断流程如 图 3 所示. 图 3 高炉智能故障诊断流程 Fig. 3 Intelligent fault diagnosis scheme for BF 由于生产环境和检测手段的限制,采样数据往往 变得极其复杂、混乱和冗余. 未经预处理的采样数据 会导致所提取的特征参数受到不同程度的噪声污染, 从而影响诊断推理的精度. 由于特征参数选择的随意 性且数量众多,构成样本向量的不同特征参数之间常 常具有一定的非线性相关性,大量的数据不但占用巨 大的存储空间和计算时间,加重了诊断推理机的负担, 降低了系统的实时性,而且有用的知识往往会淹没在 大量的冗余数据中. 为了分析重要的特征,抑制无用 的信息,需要进行特征提取. 本文选用核主元分析 法[17]对数据进行压缩和信息抽取,可以有效地找出数 ·44·
张海刚等:基于全局优化支持向量机的多类别高炉故障诊断 ·45· 据中最主要的元素和结构,能够消除特征参数间的冗 0.45 余以及噪声对特征参数的干扰,将原有的复杂数据降 0.40 维,把众多指标转化为少数几个综合指标,同时保留甚 0.35 至强化了该数据的主要特征,揭示了隐藏在复杂数据 ÷0.30 0.25 背后的简单结构,从而使数据更容易处理 0.20 在整个诊断系统中,假设c=(c,c2,…,cn)是n个 0.15 最小二乘支持向量机二元分类器的惩罚系数,c:被限 0.10 定在{2°,2,…,20};0=(01,02,…,0。,c)是n+ 0.05 ☑ 1个径向基核函数的宽度参数,σ,被限定在123,22, 第一主元 第二主元第三主元其他主元 …,2}:f={∫,…∫m}是m个特征参数的特征选择 主成分变量 集∫=1表示第i个参数被选中,∫=0表示第i个参 图4核主成分分析仿真结果 Fig.4 Simulation results of the KPCA method 数未被选中.组合上述参数集,形成一个混合向量H =(c,σ,),需运用变尺度离散粒子群优化方法对其进 1000 行优化 800 -Cz 适应度函数是系统总体表现的衡量标准,根据系 =G, 统的训练准确率、支持向量的数量和参数选择的个数 600 评判每个粒子表现的优劣.现设定如下形式的适应度 中图 400 函数: ines=4)[只言(a>0)]广. 200 50100150200250 300 [片豆>0]: (23) 变尺度离散粒子群优化方法迭代次数 式中,f(A-.)表示对训练集的数据运用n重交叉检 图5惩罚因子优化过程 Fig.5 Optimization process of penalty factor 验的平均正确率,言N(“>0)表示支持向量在所 40 —0 有训练样本中占的比例,品三N(>0)表示速中的 3.5 30 特征参数在所有参数中占的比例. 2.5 3实验仿真 20 1.5 为了检验本文提出的基于全局优化支持向量机的 多类别故障诊断方法,选取宝钢高炉生产过程中具有 代表性的500组炉况数据,其中正常炉况数据200组, 0.5 悬料、崩料和管道行程异常炉况各100组,利用其中 50 100150200 250 300 400组数据作为训练样本,剩余100组作为测试样本. 变尺度离散粒子群优化方法迭代次数 在故障检测模型中,我们提取高炉特征数据N= 图6宽度参数优化过程 (F,E).该特征数据含有15维特征,采用核主成分分 Fig.6 Optimization process of width parameter 析方法对其进行降维处理.图4展示了核主成分分析 法在粒子寻优的初期具有极大的搜索范围,粒子的变 方法的仿真结果图.从图中可以看到每个主元所代表 异性能够有效地防止粒子陷入局部极值,在搜索的后 数据特征的比重.我们提取前三个主元所代表的特征 期,该算法能够在小范围内对最优值进行调整,最终得 数据作为模型的输人.前三个主元代表了95.5%的特 到的最优参数如表3所示 征属性,能够满足模型的要求. 表3最优参数值 设置变尺度离散粒子群优化方法最大迭代次数为 Table 3 Optimal parameters 300次,最小二乘支持向量机分类器的惩罚因子= 参量 LS-SVM LS-SVM2 LS-SVM2 KPCA (c1,c2,c3)和径向基核函数的宽度参数0=(01,02, O3,·xc)的自寻优过程分别如图5和图6所示. 127 74 38 3.135 由图5和图6可以看出变尺度离散粒子群优化方 0.367 1.544 1.735
张海刚等: 基于全局优化支持向量机的多类别高炉故障诊断 据中最主要的元素和结构,能够消除特征参数间的冗 余以及噪声对特征参数的干扰,将原有的复杂数据降 维,把众多指标转化为少数几个综合指标,同时保留甚 至强化了该数据的主要特征,揭示了隐藏在复杂数据 背后的简单结构,从而使数据更容易处理. 在整个诊断系统中,假设 c = (c1 ,c2 ,…,cn )是 n 个 最小二乘支持向量机二元分类器的惩罚系数,ci 被限 定在{2 0 ,2 1 ,…,2 10 };滓 = (滓1 ,滓2 ,…,滓n ,滓KPCA )是 n + 1 个径向基核函数的宽度参数,滓i 被限定在{2 - 3 ,2 - 2 , …,2 5 };f = {f 1 ,f 2 ,…,fm }是 m 个特征参数的特征选择 集,f i = 1 表示第 i 个参数被选中,f i = 0 表示第 i 个参 数未被选中. 组合上述参数集,形成一个混合向量 H = (c,滓,f),需运用变尺度离散粒子群优化方法对其进 行优化. 适应度函数是系统总体表现的衡量标准,根据系 统的训练准确率、支持向量的数量和参数选择的个数 评判每个粒子表现的优劣. 现设定如下形式的适应度 函数: fitness = f(Atest - n ) [ 1 N 移 N i = 1 N(琢i > 0) ] - 1 [ · 1 m 移 m i = 1 N(f i > 0) ] - 1 . (23) 式中,f(Atest - n )表示对训练集的数据运用 n 重交叉检 验的平均正确率, 1 N 移 N i = 1 N(琢i > 0)表示支持向量在所 有训练样本中占的比例, 1 m 移 m i = 1 N( f i > 0)表示选中的 特征参数在所有参数中占的比例. 3 实验仿真 为了检验本文提出的基于全局优化支持向量机的 多类别故障诊断方法,选取宝钢高炉生产过程中具有 代表性的 500 组炉况数据,其中正常炉况数据 200 组, 悬料、崩料和管道行程异常炉况各 100 组,利用其中 400 组数据作为训练样本,剩余 100 组作为测试样本. 在故障检测模型中,我们提取高炉特征数据 IN = (F,E). 该特征数据含有 15 维特征,采用核主成分分 析方法对其进行降维处理. 图 4 展示了核主成分分析 方法的仿真结果图. 从图中可以看到每个主元所代表 数据特征的比重. 我们提取前三个主元所代表的特征 数据作为模型的输入. 前三个主元代表了 95郾 5% 的特 征属性,能够满足模型的要求. 设置变尺度离散粒子群优化方法最大迭代次数为 300 次,最小二乘支持向量机分类器的惩罚因子 c = (c1 ,c2 ,c3 )和径向基核函数的宽度参数 滓 = (滓1 ,滓2 , 滓3 ,滓KPCA )的自寻优过程分别如图 5 和图 6 所示. 由图 5 和图 6 可以看出变尺度离散粒子群优化方 图 4 核主成分分析仿真结果 Fig. 4 Simulation results of the KPCA method 图 5 惩罚因子优化过程 Fig. 5 Optimization process of penalty factor 图 6 宽度参数优化过程 Fig. 6 Optimization process of width parameter 法在粒子寻优的初期具有极大的搜索范围,粒子的变 异性能够有效地防止粒子陷入局部极值,在搜索的后 期,该算法能够在小范围内对最优值进行调整,最终得 到的最优参数如表 3 所示. 表 3 最优参数值 Table 3 Optimal parameters 参量 LS鄄SVM1 LS鄄SVM2 LS鄄SVM3 KPCA c 127 74 38 — 滓 3郾 135 0郾 367 1郾 544 1郾 735 ·45·
46· 工程科学学报,第39卷,第1期 进一步,对高炉故障训练样本采用Fisher线性判 征统计参数,从数据预处理和参数优化两个方面着手, 别纠错输出编码法得到编码矩阵,如表4所示 应用变尺度离散粒子群优化方法提升了最小二乘支持 表4高炉故障编码矩阵 向量机二元分类器的整体性能,进而通过启发式的纠 Table 4 Coding matrix of BF faults 错输出编码设计,将二元分类器推广至多元故障分类, 类别 分类器1 分类器2 分类器3 使用较少的分类器,在提升系统实时性的同时得到了 正常 +1 0 0 良好的诊断效果,为高炉故障的在线监控提出了一种 悬料 -1 +1 可行的方法 料 -1 +1 0 参考文献 管道行程 -1 -1 -1 [1]Liang J B.The Blast Furnace Condition Diagnosis System Design 在测试阶段,本文将基于参数优化的纠错输出编 and Implementation based on the Gas Flow Rate Dissertation ] 码多类别故障诊断方法与传统的无参数优化(c=10, Changsha:Central South University,2009 σ=0.4)的一对一、一对多、密集随机编码和稀疏随机 (梁剑波.基于煤气流量的高炉炉况诊断系统设计及实现[学 位论文].长沙:中南大学,2009) 编码四种方法进行对比,进行1000次实验后得到平均 [2]Li Q H.Fuzzy ldentification Prediction and Control to B.F Iron- 结果如表5所示 making Process [Dissertation ]Zhejiang:Zhejiang University, 表5不同纠错输出编码方法结果比较 2005 Table 5 Comparison results of different ECOC methods (李启会.高炉治炼过程的模糊辨识、预测与控制[学位论 码字 特征压 准确率/ 文].浙江:浙江大学,2005) 编码方法 长度 码元 缩率/% % [3]Gao C H,Jian L,Chen J M,et al.Data-driven modeling and 纠错输出编码 3 3 37.1 88.3 predictive algorithm for complex blast fumace ironmaking process. 一对多 4 3 100 67.1 Acta Autom Sin,2009.35(6):725 一对一 6 3 (郜传厚,渐令,陈积明,等.复杂高炉炼铁过程的数据驱动 100 84.7 建模及预测算法.自动化学报,2009,35(6):725) 密集随机编码 10 100 76.7 [4] Liu L M,Wang A N,Sha M,et al.Fault diagnostics of blast fur- 稀疏随机编码 14 100 78.2 nace based on CIS-SVM /2010 Chinese Conference on Pattern Recognition.IEEE,2010 由表5可以看出故障样本经过特征参数的筛选和 [5]Yang J,Xu Q,Yu C B,et.al.Study on fault diagnosis of blast 压缩之后,显著降低了样本的维数且提高了样本的质 fumace based on ICA-QNN /Proceedings of the 29th Chinese 量,减轻了最小二乘支持向量机分类器的运算负担,增 Control Conference.Beijing,2010:4014 强了系统的分类性能.与其他四种方法相比纠错输出 (杨佳,许强,余成波,等.基于ICA-QNN的高炉故障诊断 编码方法提供了最为紧凑的编码,码字长度代表着采 研究/第29届中国控制会议.北京,2010:4014) 用最小二乘支持向量机分类器的个数.通过表5可以 [6]Li Z.Research of Blast Furnace Fault Diagnosis based on Bayesian 看出,通过纠错输出编码后,我们采用三个最小二乘支 Netwcorks Dissertation ]Wuhan:Wuhan University of Science 持向量机的分类器就可以实现高炉故障的识别.相比 and Technology,2015 (李振.基于贝叶斯网络(Bayesian Network=)方法的高炉故障 于其他算法,分类器的个数得到了很好的抑制,降低了 诊断研究[学位论文].武汉:武汉科技大学,2015) 故障识别时间.利用Fisher判别率对类集合的重新整 [7] Pujol 0,Radeva P,Vitria J.Discriminant ECOC:a heuristic 合,帮助分类器得到了较高的准确率.就系统的复杂 method for application dependent design of eror correcting output 性而言,一对多方法与纠错输出编码法最为接近,但是 codes.IEEE Trans Pattern Anal Mach Intell,2006,28(6):1007 前者的准确率却是较低的,因为这种方法容易受到不 [8]Suykens J A K,Vandewalle J.Least squares support vector ma- 同类别训练样本数量不均衡的影响.虽然随机编码方 chine classifiers.Neural Process Lett,1999,9(3):293 法也得到了可以接受的效果.但是,由于它们需要构 [9]Xu M,Wang S T,Gu X.TL-SVM:A transfer learning algo 造的分类器数量过多,严重影响了系统的实时性,不利 rithm.Control Decis,2014,29(1):141 于高炉生产现场炉况的在线监测.相比而言,一对一 (许敏,王士同,顾鑫.TL-SVM:一种迁移学习新算法.控制 方法得到了与纠错输出编码相近的分类结果,并且其 与决策,2014,29(1):141) 编码构造方式固定,构造过程简单,可以作为一种备用 [10]Gestel T V,Suykens JA K,Lanckriet G.et al.Multiclass IS- SVMs:moderated outputs and coding-decoding schemes.Neural 的高炉故障诊断系统的编码选择. Process Lett,2002,15(1)45 4结论 [11]Liu L M,Wang A N,Sha M,et.al.Multi-class classification methods of cost-conscious IS-SVM for fault diagnosis of blast 本文针对特定高炉选取与典型故障密切相关的特 furnace.J Iron Steel Res Int,2011,18(10):17
工程科学学报,第 39 卷,第 1 期 进一步,对高炉故障训练样本采用 Fisher 线性判 别纠错输出编码法得到编码矩阵,如表 4 所示. 表 4 高炉故障编码矩阵 Table 4 Coding matrix of BF faults 类别 分类器 1 分类器 2 分类器 3 正常 + 1 0 0 悬料 - 1 - 1 + 1 崩料 - 1 + 1 0 管道行程 - 1 - 1 - 1 在测试阶段,本文将基于参数优化的纠错输出编 码多类别故障诊断方法与传统的无参数优化( c = 10, 滓 = 0郾 4)的一对一、一对多、密集随机编码和稀疏随机 编码四种方法进行对比,进行 1000 次实验后得到平均 结果如表 5 所示. 表 5 不同纠错输出编码方法结果比较 Table 5 Comparison results of different ECOC methods 编码方法 码字 长度 码元 特征压 缩率/ % 准确率/ % 纠错输出编码 3 3 37郾 1 88郾 3 一对多 4 2 100 67郾 1 一对一 6 3 100 84郾 7 密集随机编码 10 2 100 76郾 7 稀疏随机编码 14 3 100 78郾 2 由表 5 可以看出故障样本经过特征参数的筛选和 压缩之后,显著降低了样本的维数且提高了样本的质 量,减轻了最小二乘支持向量机分类器的运算负担,增 强了系统的分类性能. 与其他四种方法相比纠错输出 编码方法提供了最为紧凑的编码,码字长度代表着采 用最小二乘支持向量机分类器的个数. 通过表 5 可以 看出,通过纠错输出编码后,我们采用三个最小二乘支 持向量机的分类器就可以实现高炉故障的识别. 相比 于其他算法,分类器的个数得到了很好的抑制,降低了 故障识别时间. 利用 Fisher 判别率对类集合的重新整 合,帮助分类器得到了较高的准确率. 就系统的复杂 性而言,一对多方法与纠错输出编码法最为接近,但是 前者的准确率却是较低的,因为这种方法容易受到不 同类别训练样本数量不均衡的影响. 虽然随机编码方 法也得到了可以接受的效果. 但是,由于它们需要构 造的分类器数量过多,严重影响了系统的实时性,不利 于高炉生产现场炉况的在线监测. 相比而言,一对一 方法得到了与纠错输出编码相近的分类结果,并且其 编码构造方式固定,构造过程简单,可以作为一种备用 的高炉故障诊断系统的编码选择. 4 结论 本文针对特定高炉选取与典型故障密切相关的特 征统计参数,从数据预处理和参数优化两个方面着手, 应用变尺度离散粒子群优化方法提升了最小二乘支持 向量机二元分类器的整体性能,进而通过启发式的纠 错输出编码设计,将二元分类器推广至多元故障分类, 使用较少的分类器,在提升系统实时性的同时得到了 良好的诊断效果,为高炉故障的在线监控提出了一种 可行的方法. 参 考 文 献 [1] Liang J B. The Blast Furnace Condition Diagnosis System Design and Implementation based on the Gas Flow Rate [ Dissertation]. Changsha: Central South University, 2009 (梁剑波. 基于煤气流量的高炉炉况诊断系统设计及实现[学 位论文]. 长沙: 中南大学, 2009) [2] Li Q H. Fuzzy Identification Prediction and Control to B. F Iron鄄 making Process [ Dissertation ]. Zhejiang: Zhejiang University, 2005 (李启会. 高炉冶炼过程的模糊辨识、预测与控制[学位论 文]. 浙江: 浙江大学, 2005) [3] Gao C H, Jian L, Chen J M, et al. Data鄄driven modeling and predictive algorithm for complex blast furnace ironmaking process. Acta Autom Sin, 2009, 35(6): 725 (郜传厚, 渐令, 陈积明, 等. 复杂高炉炼铁过程的数据驱动 建模及预测算法. 自动化学报, 2009, 35(6): 725) [4] Liu L M, Wang A N, Sha M, et al. Fault diagnostics of blast fur鄄 nace based on CLS鄄鄄 SVM / / 2010 Chinese Conference on Pattern Recognition. IEEE, 2010 [5] Yang J, Xu Q, Yu C B, et. al. Study on fault diagnosis of blast furnace based on ICA鄄鄄 QNN / / Proceedings of the 29th Chinese Control Conference. Beijing, 2010: 4014 (杨佳, 许强, 余成波, 等. 基于 ICA鄄鄄 QNN 的高炉故障诊断 研究 / / 第 29 届中国控制会议. 北京, 2010: 4014) [6] Li Z. Research of Blast Furnace Fault Diagnosis based on Bayesian Networks [ Dissertation]. Wuhan: Wuhan University of Science and Technology, 2015 (李振. 基于贝叶斯网络(Bayesian Networks)方法的高炉故障 诊断研究[学位论文]. 武汉: 武汉科技大学, 2015) [7] Pujol O, Radeva P, Vitria J. Discriminant ECOC: a heuristic method for application dependent design of error correcting output codes. IEEE Trans Pattern Anal Mach Intell, 2006, 28(6): 1007 [8] Suykens J A K, Vandewalle J. Least squares support vector ma鄄 chine classifiers. Neural Process Lett, 1999, 9(3): 293 [9] Xu M, Wang S T, Gu X. TL鄄鄄 SVM: A transfer learning algo鄄 rithm. Control Decis, 2014, 29(1): 141 (许敏, 王士同, 顾鑫. TL鄄鄄SVM: 一种迁移学习新算法. 控制 与决策, 2014, 29(1): 141) [10] Gestel T V, Suykens J A K, Lanckriet G, et al. Multiclass LS鄄鄄 SVMs: moderated outputs and coding鄄decoding schemes. Neural Process Lett, 2002, 15(1): 45 [11] Liu L M, Wang A N, Sha M, et. al. Multi鄄class classification methods of cost鄄conscious LS鄄鄄 SVM for fault diagnosis of blast furnace. J Iron Steel Res Int, 2011, 18(10): 17 ·46·
张海刚等:基于全局优化支持向量机的多类别高炉故障诊断 ·47. [12]Qiu M H.Wang Z Y,An G,et al.Diagnosis of gear fault based [15]Ji Z.Liao H L,Wu Q H.Particle Suarm Optimization Algorithm on KPCA and ECOC-SVM.J Vib Shock,2009,28(5)1 and Its Application.Beijing:Science Press,2009 (邱绵浩,王自营,安钢,等.基于核主元分析与纠错输出编 (纪震,廖惠连,吴青华.粒子群算法及应用.1版.北京: 码SVM的齿轮故障诊断.振动与冲击,2009,28(5):1) 科学出版社,2009) [13]Allwein E,Schapire R,Singer Y.Reducing multiclass to bina- [16]Hao Y.Study on Radar and Cross Temperature Data Processing ry:a unifying approach for margin classifiers.Mach Learn Res, in Blast Furnace Dissertation].Beijing:University of Science 2002,12(1):113 and Technology Beijing,2012 [14]Zhou J D,Wang X D,Cui Y H,et al.Error-correcting output (郝宇.高炉雷达及十字测温数据处理算法研究[学位论 codes based on evidence theory for multi-class classification. 文].北京:北京科技大学,2012) Control Decis,2013,28(4):495 [17]Cao LJ,Chua K S,Chong W K,et al.A comparison of PCA, (周进登,王晓丹,雀永花,等.基于证据理论的纠错输出编 KPCA and ICA for dimensionality reduction in support vector ma 码解决多类分类问题.控制与决策,2013,28(4):495) chine.Neurocomputing,2003,55(1-2):321
张海刚等: 基于全局优化支持向量机的多类别高炉故障诊断 [12] Qiu M H, Wang Z Y, An G, et al. Diagnosis of gear fault based on KPCA and ECOC鄄鄄 SVM. J Vib Shock, 2009, 28(5): 1 (邱绵浩, 王自营, 安钢, 等. 基于核主元分析与纠错输出编 码 SVM 的齿轮故障诊断. 振动与冲击, 2009, 28(5): 1) [13] Allwein E, Schapire R, Singer Y. Reducing multiclass to bina鄄 ry: a unifying approach for margin classifiers. Mach Learn Res, 2002, 12(1): 113 [14] Zhou J D, Wang X D, Cui Y H, et al. Error鄄correcting output codes based on evidence theory for multi鄄class classification. Control Decis, 2013, 28(4): 495 (周进登, 王晓丹, 崔永花, 等. 基于证据理论的纠错输出编 码解决多类分类问题. 控制与决策, 2013, 28(4): 495) [15] Ji Z, Liao H L, Wu Q H. Particle Swarm Optimization Algorithm and Its Application. Beijing: Science Press, 2009 (纪震, 廖惠连, 吴青华. 粒子群算法及应用. 1 版. 北京: 科学出版社, 2009) [16] Hao Y. Study on Radar and Cross Temperature Data Processing in Blast Furnace [Dissertation]. Beijing: University of Science and Technology Beijing, 2012 (郝宇. 高炉雷达及十字测温数据处理算法研究[学位论 文]. 北京: 北京科技大学, 2012) [17] Cao L J, Chua K S, Chong W K, et al. A comparison of PCA, KPCA and ICA for dimensionality reduction in support vector ma鄄 chine. Neurocomputing, 2003, 55(1鄄2): 321 ·47·