D0L:10.13374/.issn1001-053x.2012.06.015 第34卷第6期 北京科技大学学报 Vol.34 No.6 2012年6月 Journal of University of Science and Technology Beijing Jun.2012 模糊C均值聚类算法在高炉料面分类中的应用 刘德馨1,2) 李晓理2)周翔,2) 陈先中12)尹怡欣1,2) 侯庆文12) 1)北京科技大学自动化学院,北京1000832)北京科技大学钢铁流程先进控制教有部重点实验室,北京100083 运通信作者,E-mail:lixaoli@hotmail..com 摘要通过对多雷达扫描得到的高炉料面进行数据处理,根据数据的特征,分别采用模糊C均值聚类和特征加权模糊C 均值聚类算法对料面数据进行分类,建立标准料面模型库.再通过模糊模式识别中贴近度的方法把待分类的目标料面与模 型库相匹配,为后续的布料控制提供依据.该算法在某2500m'高炉上进行了实验,取得良好的效果.仿真结果表明了其有 效性。 关键词高炉:布料:模糊聚类:聚类算法:模式识别 分类号TF325.3:TP273.4 Application of the fuzzy C-means clustering algorithm in blast furnace burden surface identification LIU De-xin,LI Xiaoi,ZHOU Xiang,CHEN Xian-zhong,YIN Yi-xin,HOU Qing-wen 1)School of Automation,University of Science and Technology Beijing,Beijing 100083,China 2)Key Laboratory of Advanced Control of Iron and Steel Process Ministry of Education),University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail:lixiaoli@hotmail.com ABSTRACT Blast furnace burden surface data derived from multi radars were processed.Fuzzy C-means and feature weighted fuzzy C-means clustering were applied to identify the burden surface data according to the data information,and a standard burden surface model database was set up.Each target burden surface was matched with the model database by using the method of nearness in fuzzy pattern recognition,and this provides a basis for the next burden surface control.The algorithm was carried out into a 2 500 m'blast furnace,and the control effect has been improved.The simulation results show the effectiveness of the proposed method. KEY WORDS blast furnaces:burden:fuzzy clustering:clustering algorithms:pattern recognition 随着钢铁工业的快速发展和高炉容积的增大, 但因为存在视觉疲劳和主观的感觉误差,常使得分 节能已经成为钢铁工业一个非常重要并亟需解决的 析得到的料面曲线不准确,随机性强回,从而导致 问题.炉料在高炉内部的布局直接影响着高炉的运 后续的控制策略不精确.因此,如何获得高炉料面 行,因此控制料面分布,可以提高煤气流的利用率、 数据,并如何对这些数据进行有效的分析、聚类就成 改善炉况及减少炉体侵蚀等山 为一个难点问题 高炉内部的环境非常复杂,料面曲线也是呈非 伴随着模糊集理论的形成、发展和深化,Ruspi- 线性的.传统工艺上对高炉料面的监视主要是通过 i率先提出了模糊划分的概念.以此为起点和基 对料尺数据的分析来估计料面分布情况的,表现形 础,模糊聚类理论和方法迅速蓬勃发展起来.针对 式不直观而且比较简单.在这种情况下,分析炉内 不同的应用,人们提出了很多模糊聚类算法,受到普 料面分布的难度比较大,通常使用人工判断的方法, 遍欢迎的是基于目标函数的模糊聚类,也就是说,把 收稿日期:20110406 基金项目:国家高技术研究发展计划资助项目(2009AA04Z156):国家自然科学基金资助项目(61074055):北京市优秀人才培养资助项目 (2009D013001000016):北京市教委共建重点学科资助项目(xk100080537)
第 34 卷 第 6 期 2012 年 6 月 北京科技大学学报 Journal of University of Science and Technology Beijing Vol. 34 No. 6 Jun. 2012 模糊 C 均值聚类算法在高炉料面分类中的应用 刘德馨1,2) 李晓理1,2) 周 翔1,2) 陈先中1,2) 尹怡欣1,2) 侯庆文1,2) 1) 北京科技大学自动化学院,北京 100083 2) 北京科技大学钢铁流程先进控制教育部重点实验室,北京 100083 通信作者,E-mail: lixiaoli@ hotmail. com 摘 要 通过对多雷达扫描得到的高炉料面进行数据处理,根据数据的特征,分别采用模糊 C 均值聚类和特征加权模糊 C 均值聚类算法对料面数据进行分类,建立标准料面模型库. 再通过模糊模式识别中贴近度的方法把待分类的目标料面与模 型库相匹配,为后续的布料控制提供依据. 该算法在某 2 500 m3 高炉上进行了实验,取得良好的效果. 仿真结果表明了其有 效性. 关键词 高炉; 布料; 模糊聚类; 聚类算法; 模式识别 分类号 TF325. 3; TP273 + . 4 Application of the fuzzy C-means clustering algorithm in blast furnace burden surface identification LIU De-xin1,2) ,LI Xiao-li 1,2) ,ZHOU Xiang1,2) ,CHEN Xian-zhong1,2) ,YIN Yi-xin1,2) ,HOU Qing-wen1,2) 1) School of Automation,University of Science and Technology Beijing,Beijing 100083,China 2) Key Laboratory of Advanced Control of Iron and Steel Process ( Ministry of Education) ,University of Science and Technology Beijing,Beijing 100083,China Corresponding author,E-mail: lixiaoli@ hotmail. com ABSTRACT Blast furnace burden surface data derived from multi radars were processed. Fuzzy C-means and feature weighted fuzzy C-means clustering were applied to identify the burden surface data according to the data information,and a standard burden surface model database was set up. Each target burden surface was matched with the model database by using the method of nearness in fuzzy pattern recognition,and this provides a basis for the next burden surface control. The algorithm was carried out into a 2 500 m3 blast furnace,and the control effect has been improved. The simulation results show the effectiveness of the proposed method. KEY WORDS blast furnaces; burden; fuzzy clustering; clustering algorithms; pattern recognition 收稿日期: 2011--04--06 基金项目: 国家高技术研究发展计划资助项目( 2009AA04Z156) ; 国家自然科学基金资助项目( 61074055) ; 北京市优秀人才培养资助项目 ( 2009D013001000016) ; 北京市教委共建重点学科资助项目( xk100080537) 随着钢铁工业的快速发展和高炉容积的增大, 节能已经成为钢铁工业一个非常重要并亟需解决的 问题. 炉料在高炉内部的布局直接影响着高炉的运 行,因此控制料面分布,可以提高煤气流的利用率、 改善炉况及减少炉体侵蚀等[1]. 高炉内部的环境非常复杂,料面曲线也是呈非 线性的. 传统工艺上对高炉料面的监视主要是通过 对料尺数据的分析来估计料面分布情况的,表现形 式不直观而且比较简单. 在这种情况下,分析炉内 料面分布的难度比较大,通常使用人工判断的方法, 但因为存在视觉疲劳和主观的感觉误差,常使得分 析得到的料面曲线不准确,随机性强[2],从而导致 后续的控制策略不精确. 因此,如何获得高炉料面 数据,并如何对这些数据进行有效的分析、聚类就成 为一个难点问题. 伴随着模糊集理论的形成、发展和深化,Ruspini 率先提出了模糊划分的概念. 以此为起点和基 础,模糊聚类理论和方法迅速蓬勃发展起来. 针对 不同的应用,人们提出了很多模糊聚类算法,受到普 遍欢迎的是基于目标函数的模糊聚类,也就是说,把 DOI:10.13374/j.issn1001-053x.2012.06.015
·684· 北京科技大学学报 第34卷 聚类归结成一个带约束的非线性规划问题,通过优 用拉格朗日乘数法可求得式(1)达到最小值的 化求解获得数据集的模糊划分和聚类.在基于目标 函数的聚类算法中,传统的模糊C均值聚类算法存 必要条件、以“:=1为约束条件,构造如下新 在对分类数、初始划分矩阵敏感,易于陷入局部最优 的目标函数: 解的缺点,并且此算法的前提是假设样本数据的各 J(U,1,…,ye,入1,…,An)= 特征参数对聚类的贡献是一样的,但实际中往往并 非如此.针对此点,提出了基于特征加权模糊C均 值聚类算法.这种方法设计简单,经常用于模式识 别、图像处理和数据挖掘等研究,而且近些年来仍然 (店)+名(召- (4) 是一个研究的热点B-刀 式中,入(k=1,2,…,n)是拉格朗日乘子.对所有 输入参量求偏导,使得式(1)达到最小值的必要条 本文通过高炉雷达扫描得出的六维数据,把炉 件为 内情况以料面曲线的形式显现出来,分别采用模糊 C均值聚类和特征加权模糊C均值聚类对其进行分 ∑ux 类,建立标准模型数据库,并进行对比,再把目标料 p,= ,i=1,2,…,C (5) 面与标准模型库相匹配,为后续的控制提供依据. 和 1聚类和模糊识别 1 1.1模糊C均值聚类 高’i=1,2,,0 模糊C均值聚类(FCM)算法的主要思想是将 像 经典划分的定义模糊化,用隶属度来确定属于某个 k=1,2,…,n (6) 聚类程度的一种聚类方法网.它有两个参数:一个 由这两个必要条件可得到模糊C均值聚类算 是聚类数目c;另一个是模糊加权指数m.c>1且取 法的基本步骤如下: 值通常远小于聚类样本的总个数:m又称为平滑参 ①初始化隶属度矩阵U,使其满足式(3)的约 数,me(1,+∞).如果m取值过大,聚类效果不 束条件: 好,如果取值过小则会很接近硬聚类算法,通常m ②根据式(5)计算聚类中心V: 取0.5,2.5]. ③根据式(2)计算目标函数,如果相对上次的 模糊C均值聚类算法把n个向量x,CR分成c 结果该变量小于某个确定的阈值ε,则算法停止并 个组(k=1,2,…,n);s是向量xg的维数,并求得每 输出最终的隶属度矩阵U和聚类中心V,否则根据 个组的聚类中心.通过求解隶属度矩阵U= 式(6)计算新的隶属度矩阵,返回步骤② {u}xn对数据进行分类,其中u表示第k样本属 又由最终的隶属度矩阵U={“}cxm,计算得 于第i个聚类中心的属性度,其取值都在D,1]区间 i=ag四4k=l,2,…,n. (7) 上,且每个样本的隶属度之和等于1,具体数学表达 可看出,经过学习,把样本x聚类到i类,i=1,2, 如下.设 ,C V=y,2,…,y]T (1) 上述的分类,是建立在待分类向量x:的每维特 为c个聚类中心,其中y:=a2,…,]为s 征对分类的贡献是均匀的前提下,而实际情况往往 维的向量(i=1,2,,c),则目标函数J的一般化形 是不均匀的,因此聚类中必须考虑各维特征的不同 影响. 式为 1.2特征加权的计算 J(U,y1,…,y)= xd.(2) 假定s维向量xCR(k=1,2,…,n)每维特征 的贡献大小分为0,(q=1,2,…,s),且0,≥0,则可 式中:dk= (x-Ug)2为第k个模糊组与第i 设特征加权矩阵为 个聚类中心的欧几里得距离;m为模糊加权指数,且 0 m∈(1,+x),2≤c≤n,且 0 12 0 W= (8) 之uk=1,u∈(0,1). (3) 0 0
北 京 科 技 大 学 学 报 第 34 卷 聚类归结成一个带约束的非线性规划问题,通过优 化求解获得数据集的模糊划分和聚类. 在基于目标 函数的聚类算法中,传统的模糊 C 均值聚类算法存 在对分类数、初始划分矩阵敏感,易于陷入局部最优 解的缺点,并且此算法的前提是假设样本数据的各 特征参数对聚类的贡献是一样的,但实际中往往并 非如此. 针对此点,提出了基于特征加权模糊 C 均 值聚类算法. 这种方法设计简单,经常用于模式识 别、图像处理和数据挖掘等研究,而且近些年来仍然 是一个研究的热点[3 - 7]. 本文通过高炉雷达扫描得出的六维数据,把炉 内情况以料面曲线的形式显现出来,分别采用模糊 C 均值聚类和特征加权模糊 C 均值聚类对其进行分 类,建立标准模型数据库,并进行对比,再把目标料 面与标准模型库相匹配,为后续的控制提供依据. 1 聚类和模糊识别 1. 1 模糊 C 均值聚类 模糊 C 均值聚类( FCM) 算法的主要思想是将 经典划分的定义模糊化,用隶属度来确定属于某个 聚类程度的一种聚类方法[8]. 它有两个参数: 一个 是聚类数目 c; 另一个是模糊加权指数 m. c > 1 且取 值通常远小于聚类样本的总个数; m 又称为平滑参 数,m∈( 1,+ ∞ ) . 如果 m 取值过大,聚类效果不 好,如果取值过小则会很接近硬聚类算法,通常 m 取[1. 5,2. 5]. 模糊 C 均值聚类算法把 n 个向量 xkRs 分成 c 个组( k = 1,2,…,n) ; s 是向量 xk 的维数,并求得每 个组 的 聚 类 中 心. 通过求解隶属度矩阵 U = { uik } c × n对数据进行分类,其中 uik表示第 k 样本属 于第 i 个聚类中心的属性度,其取值都在[0,1]区间 上,且每个样本的隶属度之和等于 1,具体数学表达 如下. 设 V =[v1,v2,…,vc ]T ( 1) 为 c 个聚类中心,其中 vi =[vi1,vi2,…,vis ]为 s 维的向量( i = 1,2,…,c) ,则目标函数 J 的一般化形 式为 J( U,v1,…,vc) = ∑ c i = 1 Ji = ∑ c i = 1 ∑ n k = 1 um ikd2 ik . ( 2) 式中: dik = ∑ s q = 1 ( xkq - viq ) 槡 2 为第 k 个模糊组与第 i 个聚类中心的欧几里得距离; m 为模糊加权指数,且 m∈( 1,+ ∞ ) ,2≤c≤n,且 ∑ c i = 1 uik = 1,uik∈( 0,1) . ( 3) 用拉格朗日乘数法可求得式( 1) 达到最小值的 必要条件. 以 ∑ c i = 1 uik = 1 为约束条件,构造如下新 的目标函数 J: J( U,v1,…,vc,λ1,…,λn ) = J( U,v1,…,vc) + ∑ n k = 1 λk ( ∑ c i = 1 uik - ) 1 = ∑ c i = ( 1 ∑ n k = 1 um ikd2 ik ) + ∑ n k = 1 λk ( ∑ c i = 1 uik - ) 1 . ( 4) 式中,λk ( k = 1,2,…,n) 是拉格朗日乘子. 对所有 输入参量求偏导,使得式( 1) 达到最小值的必要条 件为 vi = ∑ n k = 1 um ikxk ∑ n k = 1 um ik ,i = 1,2,…,c ( 5) 和 uik = 1 ∑ c j = ( 1 dik d ) jk 2 m-1 ,i = 1,2,…,c, k = 1,2,…,n. ( 6) 由这两个必要条件可得到模糊 C 均值聚类算 法的基本步骤如下: ① 初始化隶属度矩阵 U,使其满足式( 3) 的约 束条件; ② 根据式( 5) 计算聚类中心 V; ③ 根据式( 2) 计算目标函数,如果相对上次的 结果该变量小于某个确定的阈值 ε,则算法停止并 输出最终的隶属度矩阵 U 和聚类中心 V,否则根据 式( 6) 计算新的隶属度矩阵,返回步骤②. 又由最终的隶属度矩阵 U = { uik } c × n,计算得 i = arg max 1≤i≤c uik,k = 1,2,…,n. ( 7) 可看出,经过学习,把样本 xk 聚类到 i 类,i = 1,2, …,c. 上述的分类,是建立在待分类向量 xk 的每维特 征对分类的贡献是均匀的前提下,而实际情况往往 是不均匀的,因此聚类中必须考虑各维特征的不同 影响. 1. 2 特征加权的计算 假定 s 维向量 xkRs ( k = 1,2,…,n) 每维特征 的贡献大小分为 wq ( q = 1,2,…,s) ,且 wq≥0,则可 设特征加权矩阵为 W = w1 0 … 0 0 w2 … 0 0 0 … w s . ( 8) ·684·
第6期 刘德罄等:模糊C均值聚类算法在高炉料面分类中的应用 ·685· 其求法有很多种,文献9]提出了一种基于平 衡系数的权值计算方法.用传统模糊C均值聚类对 [V.x= 原始数据x:粗分类成c组,得到聚类中心V= 平移标准差变换数据处理为 ]ex ,为原始数据每维之间的平衡系数,表达式 %=m-p=1,2,,c+1,g=1,2,. 如下: (13) max l=1,2,,s 其 中,,= 1+1 m和 s。= 9=1,2,…,s 1 e+1 ,(y网-,)2为每列的均值和标准差 (9) 平移极差变换数据处理为 定义聚类中心y:=1,t2,…,],i=1,2,…, c的分离度为da,即 y yy) 15-1min9=12, 1≤p≤(c+1) 1≤p≤(c+1) d)s (y-,)2 (10) (14) 式中,根据己求出的r和d,可得到特征加权0,(q= 显然有y%∈D,1] 1,2,…,s)的值: 把Y+wx:=]e+×拆成 则s维的 0,=(dg)"r,9=1,2,…,s. (11) G"、 1.3特征加权模糊C均值聚类 行向量"(i=1,2,…,c)和G”上的元素都属于0, 特征加权模糊C均值聚类算法在模糊C均值 1]区间. 聚类的基础上,引入权重矩阵,对数据集进行预处 1.4.2贴近度 理,从而得到更好的分类效果 定义1(模糊集)论域T={t,2,…,t,}是有 对s维的原始数据xk=xH,x2,…,x]进行加 限集,T上的模糊集A由隶属函数u4(t)(q=1,2, 权处理,得到新的实验数据: …,s)表征,且1(t)∈D,1],它的值反映了T上 x=xW,k=1,2,…,n. (12) 的元素t,对于模糊集A的隶属程度 再运用1.1节介绍的模糊C均值聚类对新的实 模糊集的向量表示方法: 验数据x进行分类,得出特征加权模糊C均值聚 A=u4()u4(2),…u4(t)]. 类的最终结果o 般地,若an∈[D,1](q=1,2,…,s),,则称a= 综上所述,式(1)~(11)是对已知的数据集进 [a1,a2,…,a,]为模糊向量.同理,1.4.1得到的c 行分类,并求出聚类中心,得到标准模型库.若另有 个s维的行向量”,,…,”和G上的元素都属于 己知数据集以外的一组新的数据,往往要把其与模 D,1]区间,即也为模糊向量.把,?,…,”作为 型库相匹配,看它能归到哪一种模型,这就是模式识 标准模型库,为了识别G”与,?,…,中的哪一 别问题 个最贴近,引出贴近度概念回 1.4模糊模型识别 定义2(贴近度)贴近度是两个模糊向量接近 本文采用模糊模型识别的方法把待分类的一组 程度的度量.设6(A,B)是模糊向量A=,(t1), 新数据G1x:与前面步骤得到最终的聚类中心Vx: u4(2),…,u4(t,)]和B=μg(t1),ug(2),…, 相匹配,得出G1x,所属的类别.下面将从数据处理 4e(1)]的贴近度,满足6(A,B)∈D,1],当8(A, 和贴近度两个方面进行介绍 B)越大,两个模糊向量越接近,反之两个模糊向量 1.4.1数据处理 越疏远. 在实际问题中,不同的数据一般有不同的量 求贴近度的方法有很多,常用的有以下几种 纲,根据模糊模型识别的要求,将数据压缩到0, (1)格贴近度. 1]区间上,通常用平移标准差变换和平移极差变 6A,B)=3AB+1-A⑧B].(15) 换的方法m 根据前面步骤得到最终的聚类中心Vx,和另一 式中,A·B=立(,)N,)和A⑧B=,A 组新数据G1x4,两者组成如下矩阵: u,(1,)Vug(t,)]分别为A与B的内积与外积,符
第 6 期 刘德馨等: 模糊 C 均值聚类算法在高炉料面分类中的应用 其求法有很多种,文献[9]提出了一种基于平 衡系数的权值计算方法. 用传统模糊 C 均值聚类对 原始数据 xk 粗 分 类 成 c 组,得 到 聚 类 中 心 V = [viq ]c × s. 设 r 为原始数据每维之间的平衡系数,表达式 如下: rq = max {∑ c i = 1 vil,l = 1,2,…,s } ∑ c i = 1 viq ; q = 1,2,…,s. ( 9) 定义聚类中心 vi =[vi1,vi2,…,vis],i = 1,2,…, c 的分离度为 d( w) ,即 d( w) q = ∑ c i = 1 ( rq viq - rq vq ) 槡 2 . ( 10) 式中,根据已求出的 r 和 d( w) ,可得到特征加权 wq ( q = 1,2,…,s) 的值: wq = ( d( w) q ) m rq,q = 1,2,…,s. ( 11) 1. 3 特征加权模糊 C 均值聚类 特征加权模糊 C 均值聚类算法在模糊 C 均值 聚类的基础上,引入权重矩阵,对数据集进行预处 理,从而得到更好的分类效果. 对 s 维的原始数据 xk =[xk1,xk2,…,xks ]进行加 权处理,得到新的实验数据: x( w) k = xk ·W,k = 1,2,…,n. ( 12) 再运用1. 1 节介绍的模糊 C 均值聚类对新的实 验数据 x( w) k 进行分类,得出特征加权模糊 C 均值聚 类的最终结果[10]. 综上所述,式( 1) ~ ( 11) 是对已知的数据集进 行分类,并求出聚类中心,得到标准模型库. 若另有 已知数据集以外的一组新的数据,往往要把其与模 型库相匹配,看它能归到哪一种模型,这就是模式识 别问题. 1. 4 模糊模型识别 本文采用模糊模型识别的方法把待分类的一组 新数据 G1 × s与前面步骤得到最终的聚类中心 Vc × s 相匹配,得出 G1 × s所属的类别. 下面将从数据处理 和贴近度两个方面进行介绍. 1. 4. 1 数据处理 在实际问题中,不同的数据一般有不同的量 纲,根据模糊模型识别的要求,将数据压缩到[0, 1]区间上,通常用平移标准差变换和平移极差变 换的方法[11]. 根据前面步骤得到最终的聚类中心 Vc × s和另一 组新数据 G1 × s,两者组成如下矩阵: Y( c + 1) × s = Vc × s G1 × [ ]s =[ypq ]( c + 1) × s. 平移标准差变换数据处理为 y' pq = ypq - yq sq ,p = 1,2,…,c + 1,q = 1,2,…,s. ( 13) 其 中, yq = 1 c + 1 ∑ c+1 p = 1 ypq 和 sq = 1 c + 1∑ c+1 p = 1 ( ypq - yq ) 槡 2 为每列的均值和标准差. 平移极差变换数据处理为 y″ pq = y' pq - min 1≤p≤( c + 1) { y' pq } max 1≤p≤( c + 1) { y' pq } - min 1≤p≤( c + 1) { y' pq } ,q = 1,2,…,s. ( 14) 显然有 y″ pq∈[0,1]. 把 Y″( c + 1) × s =[y″ pq ]( c + 1) × s拆成 V″ c × s G″ 1 × [ ]s ,则 s 维的 行向量 v″i ( i = 1,2,…,c) 和 G″上的元素都属于[0, 1]区间. 1. 4. 2 贴近度 定义 1( 模糊集) 论域 T = { t1,t2,…,ts } 是有 限集,T 上的模糊集 A 由隶属函数 μA ( tq ) ( q = 1,2, …,s) 表征,且 μA ( tq ) ∈[0,1],它的值反映了 T 上 的元素 tq 对于模糊集 A 的隶属程度. 模糊集的向量表示方法: A =[μA ( t1 ) ,μA ( t2 ) ,…,μA ( ts ) ]. 一般地,若 aq∈[0,1]( q = 1,2,…,s) ,则称 a = [a1,a2,…,as ]为模糊向量. 同理,1. 4. 1 得到的 c 个 s 维的行向量 v″ 1,v″ 2,…,v″ c 和 G″上的元素都属于 [0,1]区间,即也为模糊向量. 把 v″ 1,v″ 2,…,v″ c 作为 标准模型库,为了识别 G″与 v″ 1,v″ 2,…,v″ c 中的哪一 个最贴近,引出贴近度概念[12]. 定义 2( 贴近度) 贴近度是两个模糊向量接近 程度的度量. 设 δ( A,B) 是模糊向量 A =[μA ( t1 ) , μA ( t2 ) ,…,μA ( ts ) ]和 B = [μB ( t1 ) ,μB ( t2 ) ,…, μB ( ts ) ]的贴近度,满足 δ( A,B) ∈[0,1],当 δ( A, B) 越大,两个模糊向量越接近,反之两个模糊向量 越疏远. 求贴近度的方法有很多,常用的有以下几种. ( 1) 格贴近度. δ( A,B) = 1 2 [AB + ( 1 - AB) ]. ( 15) 式中,AB = ∨ s q = 1 ( μA ( tq ) ∧μB ( tq ) ) 和 AB = ∧ s q = 1 [μA ( tq ) ∨μB ( tq ) ]分别为 A 与 B 的内积与外积,符 ·685·
·686· 北京科技大学学报 第34卷 号“V”为取大运算,“∧”为取小运算 (2)海明贴近度 6A,B=1- u4(t,)-ug(t,)1.(16) (3)欧式贴近度 δ(A,B)=1- Ns台 1((,)-ug(t)]2 (17) (4)算术平均最小值贴近度. 2∑min a(t,)ua()] δ(A,B)= (18) 图2高炉雷达分布图 A,+aQ] Fig.2 Distribution of blast furnace radars (5)最大最小贴近度 通过分析高炉炉体的结构和雷达的探测原理, 可以建立料面的数学模型.原始数据L为雷达到料 面实际测量点之间的距离.以一个雷达为例,建立 6(A,B)= ∑mina,)he(] (19) 立masf 空间直角坐标系(x,y,z),则测量空间图如图3 4(t,),uB(t,] 所示 因此,己知新的料面数据G”和标准模型库, ,…,,若有 需达 。=agaδ(%,G), (20) 则G和的贴近度最大,即原始数据G属于 向心缬角 ig类(i6∈1,2,…,c). 平面A 2料面数据处理 本文采用国内某大型钢铁厂提供的高炉料面数 据.图1是高炉雷达现场的照片 测量点, 实际料血 左0 …上 1 零料面 图3雷达测量空间图 Fig.3 Space model of radar measurement 图3为一个半径为4m的高炉.L为雷达到料 面实际测量点之间的距离,即雷达得到的原始数 图1高炉雷达安装现场图 据:R为实际测量点和中心点间的径向距离;D为实 Fig.I Installation site of a blast furnace radar 际测量点和零料面的料面相对高度;S为平面A到 零料面的距离参数,一般规定S=3.(X,Y,Z)为雷 由于高炉炉顶有吊装孔、中心溜槽区和喷水孔 达的安装坐标,X和Y表示安装点在零料面上的投 等设备,能安装雷达的区域实际上是一个圆环,分为 影位置,Z表示安装点和平面A在垂直方向上的距 四个环区.图2为炉顶的俯视图,图中阴影部分代 表无法布置雷达的区域.在高炉斜面上的水平投影 离,向心倾角”表示雷达与垂直方向上的夹角.六 位置,采用等间隔的方法,垂直安装雷达1~4·, 个雷达的安装坐标和向心倾角如表1所示. 另外两台雷达5”、6在内环靠近高炉中心位置,倾斜 根据雷达的安装坐标X和Y可得径向距离R为 安装,实行料面的全覆盖回. R=√J+P-Lsing (21)
北 京 科 技 大 学 学 报 第 34 卷 号“∨”为取大运算,“∧”为取小运算. ( 2) 海明贴近度. δ( A,B) = 1 - 1 s ∑ s q = 1 | μA ( tq ) - μB ( tq ) | . ( 16) ( 3) 欧式贴近度. δ( A,B) = 1 - 1 s ∑ s q = 1 [μA ( tq ) - μB ( tq ) ] 槡 2 . ( 17) ( 4) 算术平均最小值贴近度. δ( A,B) = 2∑ s q = 1 min [μA ( tq ) ,μB ( tq ) ] ∑ s q = 1 [μA ( tq ) + μB ( tq ) ] . ( 18) ( 5) 最大最小贴近度. δ( A,B) = ∑ s q = 1 min [μA ( tq ) ,μB ( tq ) ] ∑ s q = 1 max [μA ( tq ) ,μB ( tq ) ] . ( 19) 因此,已知新的料面数据 G″和标准模型库 v″ 1, v″ 2,…,v″ c,若有 iδ = arg max 1≤i≤c δ( v″i,G″) , ( 20) 则 G″和 v″i 的贴近度最大,即原始数据 G 属于 iδ 类( iδ∈1,2,…,c) . 2 料面数据处理 本文采用国内某大型钢铁厂提供的高炉料面数 据. 图 1 是高炉雷达现场的照片. 图 1 高炉雷达安装现场图 Fig. 1 Installation site of a blast furnace radar 由于高炉炉顶有吊装孔、中心溜槽区和喷水孔 等设备,能安装雷达的区域实际上是一个圆环,分为 四个环区. 图 2 为炉顶的俯视图,图中阴影部分代 表无法布置雷达的区域. 在高炉斜面上的水平投影 位置,采用等间隔的方法,垂直安装雷达 1# ~ 4# , 另外两台雷达 5# 、6# 在内环靠近高炉中心位置,倾斜 安装,实行料面的全覆盖[2]. 图 2 高炉雷达分布图 Fig. 2 Distribution of blast furnace radars 通过分析高炉炉体的结构和雷达的探测原理, 可以建立料面的数学模型. 原始数据 L 为雷达到料 面实际测量点之间的距离. 以一个雷达为例,建立 空间 直 角 坐 标 系 ( x,y,z) ,则测量空间图如图 3 所示. 图 3 雷达测量空间图 Fig. 3 Space model of radar measurement 图 3 为一个半径为 4 m 的高炉. L 为雷达到料 面实际测量点之间的距离,即雷达得到的原始数 据; R 为实际测量点和中心点间的径向距离; D 为实 际测量点和零料面的料面相对高度; S 为平面 A 到 零料面的距离参数,一般规定 S = 3. ( X,Y,Z) 为雷 达的安装坐标,X 和 Y 表示安装点在零料面上的投 影位置,Z 表示安装点和平面 A 在垂直方向上的距 离,向心倾角 φ 表示雷达与垂直方向上的夹角. 六 个雷达的安装坐标和向心倾角如表 1 所示. 根据雷达的安装坐标 X 和 Y 可得径向距离 R 为 R = X2 槡 + Y2 - Lsinφ. ( 21) ·686·
第6期 刘德罄等:模糊C均值聚类算法在高炉料面分类中的应用 ·687· 表1雷达的安装坐标和向心倾角 2 Table 1 Installation coordinate and included angle of radars 雷达 坐标X/m坐标Y/m坐标Z/m向心倾角p/() 1# -3.49 -1.27 3.12 0.00 是 0 2# -3.01 1.09 3.48 0.00 -1 3# 2.24 1.29 4.18 0.00 -2 4# -2.00 0.00 4.50 0.00 2 0 径向离m 5# 1.63 -0.94 4.70 4.50 图5标准料面曲线 6 1.58 1.11 4.00 11.00 Fig.5 Standard burden surface curves 根据坐标Z和距离参数S可得料面相对高度D为 以其中前30组为例进行分类实验,如表2所示.由 D=Z+E-Lcoso. (22) 式(21)~(23)可得到30组料面曲线 因此由式(21)和式(22)得到六个点: 表2高炉料面数据 (R1,D),i=1,2,…,6. (23) Table 2 Blast furnace burden surface data 假设料面在垂直方向上的剖面图是左右对称 数据编号L1 的,根据这六个点,可得到能完整表示料面曲线的 4.58255.19295.83256.78716.91416.6970 12点.通过三次样条插值函数,近似得到二维料面 4.56795.12706.06456.41607.14116.0915 剖面图,料面曲线如图4所示 3 4.31404.94145.76176.20366.84336.0671 4 4.16024.76325.29546.32576.69196.0696 4.46295.25395.72516.98007.07767.2927 0 4.32624.69245.46886.08896.63576.0696 > 4.44825.08065.76176.36237.06546.0452 2 0 径问离m 8 4.26035.04395.77396.45516.68466.6067 图4高炉料面曲线 9 4.30185.12705.88876.53326.82626.0452 Fig.4 Blast furnace burden surface curve 10 4.22125.00735.67146.60896.88726.6628 4.51665.25885.73006.77737.01176.7336 通过三次样条插值函数,在半径0~4m上每 4.51425.18075.81796.97756.99956.7532 间隔0.01m,取料面曲线上多个点: 3 4.20415.08306.07676.64556.78226.5823 {(0,do),(0.01,d),…,(4,do)}.(24) 4.57035.33205.73006.78967.00446.7800 由于高炉内部是个复杂的环境,并且模糊C均 15 4.68025.31256.00346.93367.10947.1169 值聚类存在自身的局限性,需除去一些无效数据 16 4.54595.41755.67146.59426.98246.7288 定义五条料面曲线为标准料面曲线. 17 4.54595.15625.59816.85556.94586.9314 {(0,),(0.01,d),…,(4,do)},j=1,2,…,5. 18 4.58985.32235.88876.97277.03867.2488 (25) 19 4.19925.07575.54206.56256.85066.8484 根据现场经验设定标准料面曲线为五种最常见 20 4.31645.00245.30276.56746.55766.8606 的形状,如图5所示 21 4.58985.26615.76426.38187.34137.0217 由式(24)和式(25),计算雷达扫描得到的料 22 4.31645.00985.49566.49906.77736.6067 面曲线与五条标准料面曲线的最小偏离方差: 2 4.30185.23445.81056.76036.83846.8996 400 B=m[点a-)小 4.64365.42245.62506.75546.91416.9216 (26) 24 25 6.46737.62707.42198.39608.73298.8772 当E≥1时,本文认为式(24)得到的此料面数 26 4.23835.00005.53476.58206.78716.5871 据是无效,把其从待分类的数据中去除 27 4.74125.45415.93996.75058.28126.0598 28 4.38965.30275.88136.85557.15826.0427 3高炉料面数据实验 29 4.46535.22955.59086.77987.01176.8264 从现场获得料面原始数据L=D,2,,。], 304.41415.31986.06936.77737.03866.9287
第 6 期 刘德馨等: 模糊 C 均值聚类算法在高炉料面分类中的应用 表 1 雷达的安装坐标和向心倾角 Table 1 Installation coordinate and included angle of radars 雷达 坐标 X /m 坐标 Y /m 坐标 Z /m 向心倾角 φ/( °) 1# - 3. 49 - 1. 27 3. 12 0. 00 2# - 3. 01 1. 09 3. 48 0. 00 3# 2. 24 1. 29 4. 18 0. 00 4# - 2. 00 0. 00 4. 50 0. 00 5# 1. 63 - 0. 94 4. 70 4. 50 6# 1. 58 1. 11 4. 00 11. 00 根据坐标 Z 和距离参数 S 可得料面相对高度 D 为 D = Z + E - Lcosφ. ( 22) 因此由式( 21) 和式( 22) 得到六个点: ( Ri,Di ) ,i = 1,2,…,6. ( 23) 假设料面在垂直方向上的剖面图是左右对称 的,根据这六个点,可得到能完整表示料面曲线的 12 点. 通过三次样条插值函数,近似得到二维料面 剖面图,料面曲线如图 4 所示. 图 4 高炉料面曲线 Fig. 4 Blast furnace burden surface curve 通过三次样条插值函数,在半径 0 ~ 4 m 上每 间隔 0. 01 m,取料面曲线上多个点: { ( 0,d0 ) ,( 0. 01,d1 ) ,…,( 4,d400 ) } . ( 24) 由于高炉内部是个复杂的环境,并且模糊 C 均 值聚类存在自身的局限性,需除去一些无效数据. 定义五条料面曲线为标准料面曲线. { ( 0,dj 0 ) ,( 0. 01,dj 1 ) ,…,( 4,dj 400 ) } ,j = 1,2,…,5. ( 25) 根据现场经验设定标准料面曲线为五种最常见 的形状,如图 5 所示. 由式( 24) 和式( 25) ,计算雷达扫描得到的料 面曲线与五条标准料面曲线的最小偏离方差: E = min j = 1,2,…, [ 5 ∑ 400 k = 0 ( dk - dj k ] ) . ( 26) 当 E≥1 时,本文认为式( 24) 得到的此料面数 据是无效,把其从待分类的数据中去除. 3 高炉料面数据实验 从现场获得料面原始数据 L =[l1,l2,…,l6], 图 5 标准料面曲线 Fig. 5 Standard burden surface curves 以其中前 30 组为例进行分类实验,如表 2 所示. 由 式( 21) ~ ( 23) 可得到 30 组料面曲线. 表 2 高炉料面数据 Table 2 Blast furnace burden surface data 数据编号 l1 l2 l3 l4 l5 l6 1 4. 582 5 5. 192 9 5. 832 5 6. 787 1 6. 914 1 6. 697 0 2 4. 567 9 5. 127 0 6. 064 5 6. 416 0 7. 141 1 6. 091 5 3 4. 314 0 4. 941 4 5. 761 7 6. 203 6 6. 843 3 6. 067 1 4 4. 160 2 4. 763 2 5. 295 4 6. 325 7 6. 691 9 6. 069 6 5 4. 462 9 5. 253 9 5. 725 1 6. 980 0 7. 077 6 7. 292 7 6 4. 326 2 4. 692 4 5. 468 8 6. 088 9 6. 635 7 6. 069 6 7 4. 448 2 5. 080 6 5. 761 7 6. 362 3 7. 065 4 6. 045 2 8 4. 260 3 5. 043 9 5. 773 9 6. 455 1 6. 684 6 6. 606 7 9 4. 301 8 5. 127 0 5. 888 7 6. 533 2 6. 826 2 6. 045 2 10 4. 221 2 5. 007 3 5. 671 4 6. 608 9 6. 887 2 6. 662 8 11 4. 516 6 5. 258 8 5. 730 0 6. 777 3 7. 011 7 6. 733 6 12 4. 514 2 5. 180 7 5. 817 9 6. 977 5 6. 999 5 6. 753 2 13 4. 204 1 5. 083 0 6. 076 7 6. 645 5 6. 782 2 6. 582 3 14 4. 570 3 5. 332 0 5. 730 0 6. 789 6 7. 004 4 6. 780 0 15 4. 680 2 5. 312 5 6. 003 4 6. 933 6 7. 109 4 7. 116 9 16 4. 545 9 5. 417 5 5. 671 4 6. 594 2 6. 982 4 6. 728 8 17 4. 545 9 5. 156 2 5. 598 1 6. 855 5 6. 945 8 6. 931 4 18 4. 589 8 5. 322 3 5. 888 7 6. 972 7 7. 038 6 7. 248 8 19 4. 199 2 5. 075 7 5. 542 0 6. 562 5 6. 850 6 6. 848 4 20 4. 316 4 5. 002 4 5. 302 7 6. 567 4 6. 557 6 6. 860 6 21 4. 589 8 5. 266 1 5. 764 2 6. 381 8 7. 341 3 7. 021 7 22 4. 316 4 5. 009 8 5. 495 6 6. 499 0 6. 777 3 6. 606 7 23 4. 301 8 5. 234 4 5. 810 5 6. 760 3 6. 838 4 6. 899 6 24 4. 643 6 5. 422 4 5. 625 0 6. 755 4 6. 914 1 6. 921 6 25 6. 467 3 7. 627 0 7. 421 9 8. 396 0 8. 732 9 8. 877 2 26 4. 238 3 5. 000 0 5. 534 7 6. 582 0 6. 787 1 6. 587 1 27 4. 741 2 5. 454 1 5. 939 9 6. 750 5 8. 281 2 6. 059 8 28 4. 389 6 5. 302 7 5. 881 3 6. 855 5 7. 158 2 6. 042 7 29 4. 465 3 5. 229 5 5. 590 8 6. 779 8 7. 011 7 6. 826 4 30 4. 414 1 5. 319 8 6. 069 3 6. 777 3 7. 038 6 6. 928 7 ·687·
·688· 北京科技大学学报 第34卷 根据式(24)~(26),第25组和27组为无效数 限于篇幅,U4x28不在本文中列出 据,如图6所示中坐标点用圆圈表示的料面曲线 再由式(8)~(11)可得加权矩阵: 从待分类的数据中去除,得到剩下的28组有效料面 W=diag[5.39349.23535.30584.52595.19889.6519]. 曲线.可以看出,原始数据2和。能更好地体现料 继而可得特征加权模糊C均值聚类的结果. 面堆尖位置和中心点高度,在后续分类中起着关键 第一类:{51518}. 作用. 第二类:{8101319202225}. 第三类:{234679}. 第四类:{11112141617212324262728}, 「2406648.37031.82131.43436.14369.5311 B(e) 24.83248.93730.24930.03836.56165.409 23.76646.65029.07029.80835.69964.101 L23.64346.58230.43428.40536.30558.260J 模糊C均值聚类结果和特征加权模糊C均值 0 径向离m 聚类结果的对比如图7和8所示. 图630组料面曲线 由图7和图8可看出,特征加权模糊C均值聚 Fig.6 30 burden surface curves 类比传统模糊C均值聚类分类效果更好. 把28组料面曲线,即28个六维的向量,先作为 再把一组新的料面数据G用来进行料面识别: 模糊C均值聚类的输入矩阵,根据现场经验,把料 G=[4.52155.34915.86916.71887.23147.1851] 面分成c=4个组.设模糊加权指数m=2,最大迭 代入式(12)可得G: 代次数为100步,阈值ε=0.00001,由式(5)~(7) G=[24.41649.21131.10630.23437.60359.995]1 可得出分类结果 再由G和己知的特征加权模糊C均值聚类 第一类:{5151828}. P() 中心v得到。= 4×6 根据式(13)~(15), 第二类:{8101319202225}. G 第三类:{23467926}. 把化成元素都在D,1]区间上的Yg,即得到 第四类:{1111214161721232427}, V"m和G 「4.26655.02135.58636.54256.78736.63107 T0.35580.6801 1 1 0.2332 1 4.36905.02485.77656.37376.91846.0799 V- ( 1 0.89580.42860.53910.45270.6343 4.53345.28915.87056.89217.05907.1191 0.10340.0259 00.463200.5182 L4.51515.26115.72556.76316.97766.7806 0 00.4958 00.3183 0 2 第一类 第二类 0 美 2 -2 4 3 0 径向距离m 径向距离m 2 第三类 第四类 0 2 0 径向距离m 径向距离m 图7模糊C均值聚类结果 Fig.7 Results of fuzzy C-means clustering
北 京 科 技 大 学 学 报 第 34 卷 根据式( 24) ~ ( 26) ,第 25 组和 27 组为无效数 据,如图 6 所示中坐标点用圆圈表示的料面曲线. 从待分类的数据中去除,得到剩下的 28 组有效料面 曲线. 可以看出,原始数据 l2 和 l6 能更好地体现料 面堆尖位置和中心点高度,在后续分类中起着关键 作用. 图 6 30 组料面曲线 Fig. 6 30 burden surface curves 把 28 组料面曲线,即 28 个六维的向量,先作为 模糊 C 均值聚类的输入矩阵,根据现场经验,把料 面分成 c = 4 个组. 设模糊加权指数 m = 2,最大迭 代次数为 100 步,阈值 ε = 0. 000 01,由式( 5) ~ ( 7) 可得出分类结果. 图 7 模糊 C 均值聚类结果 Fig. 7 Results of fuzzy C-means clustering 第一类: { 5 15 18 28} . 第二类: { 8 10 13 19 20 22 25} . 第三类: { 2 3 4 6 7 9 26} . 第四类: { 1 11 12 14 16 17 21 23 24 27} , V = 4. 2665 5. 0213 5. 5863 6. 5425 6. 7873 6. 6310 4. 3690 5. 0248 5. 7765 6. 3737 6. 9184 6. 0799 4. 5334 5. 2891 5. 8705 6. 8921 7. 0590 7. 1191 4. 5151 5. 2611 5. 7255 6. 7631 6. 9776 6. 7806 . 限于篇幅,U4 × 28不在本文中列出. 再由式( 8) ~ ( 11) 可得加权矩阵: W = diag[5. 393 4 9. 235 3 5. 305 8 4. 525 9 5. 198 8 9. 651 9]. 继而可得特征加权模糊 C 均值聚类的结果. 第一类: { 5 15 18 } . 第二类: { 8 10 13 19 20 22 25} . 第三类: { 2 3 4 6 7 9} . 第四类: { 1 11 12 14 16 17 21 23 24 26 27 28} , V( w) = 24. 066 48. 370 31. 821 31. 434 36. 143 69. 531 24. 832 48. 937 30. 249 30. 038 36. 561 65. 409 23. 766 46. 650 29. 070 29. 808 35. 699 64. 101 23. 643 46. 582 30. 434 28. 405 36. 305 58. 260 . 模糊 C 均值聚类结果和特征加权模糊 C 均值 聚类结果的对比如图 7 和 8 所示. 由图 7 和图 8 可看出,特征加权模糊 C 均值聚 类比传统模糊 C 均值聚类分类效果更好. 再把一组新的料面数据 G 用来进行料面识别: G = [ ] 4. 521 5 5. 349 1 5. 869 1 6. 718 8 7. 231 4 7. 185 1 . 代入式( 12) 可得 G( w) : G( w) = [ ] 24. 416 49. 211 31. 106 30. 234 37. 603 59. 995 . 再由 G( w) 和已知的特征加权模糊 C 均值聚类 中心 V( w) 得到 Y( w) 5 × 6 = V( w) 4 × 6 G[ ] ( w) 1 × 6 ,根据式( 13) ~ ( 15) , 把 Y( w) 5 × 6化成元素都在[0,1]区间上的 Y″ ( w) 5 × 6,即得到 V″ ( w) 和 G″ ( w) : V″ ( w) = 0. 355 8 0. 680 1 1 1 0. 233 2 1 1 0. 895 8 0. 428 6 0. 539 1 0. 452 7 0. 634 3 0. 103 4 0. 025 9 0 0. 463 2 0 0. 518 2 0 0 0. 495 8 0 0. 318 3 0 , ·688·
第6期 刘德罄等:模糊C均值聚类算法在高炉料面分类中的应用 ·689· 2 第一类 第类 意莲术一 0 0 径向距离m 径向距离m 第类 第四类 0 0 2 2 0 径向距离m 径向距离m 图8特征加权模糊C均值聚类结果 Fig.8 Results of feature weighted fuzzy C-means clusterin G-[0.650110.74010.603810.1539 {0.77060.65750.28390.3281},i=1. 由式(16)~(20)可分别得到各种贴近度的结 (5)最大最小贴近度. 果,再由式(21)计算出i(i=1,2,…,4),即料面属 6(",G)= 于哪一类 {0.62680.48970.16540.1963},i=1. (1)格贴近度 把待识别的料面曲线G,分别纳入特征加权模 61(",G)= 糊C均值算法已分成的四个分类结果里,用红色线 {0.64600.54500.47250.6709},i=4. 表示,如图9所示.可以看出,曲线G的形状与第一 (2)海明贴近度. 类比较接近,确定其属于第一类.因此根据上面算 62(,G)= 出的各个贴近度的值可看出,欧式贴近度为δ,(, {0.51950.44440.37240.6903},i=4. G")=0.6430,算术平均最小值贴近度为δ(1, (3)欧式贴近度. G")=0.7706,最大最小贴近度为8(1,G")= 83(,G)= 0.6268,采用这三种贴近度较为合适. {0.64300.46500.29900.3761},i=1. (4)算术平均最小值贴近度. 4结论 δ4(,G)= 本文先根据多雷达数据建立了高炉料面模型. 第一类 第二类 0 -2 0 2 -2 0 径向距离m 径向距离m 2 第三类 第四类 0 0 2 0 0 径向距离m 径向距离m 图9几种贴近度的对比 Fig.9 Comparison of several similarities
第 6 期 刘德馨等: 模糊 C 均值聚类算法在高炉料面分类中的应用 图 8 特征加权模糊 C 均值聚类结果 Fig. 8 Results of feature weighted fuzzy C-means clusterin G″ =[0. 650 1 1 0. 740 1 0. 603 8 1 0. 153 9]. 由式( 16) ~ ( 20) 可分别得到各种贴近度的结 果,再由式( 21) 计算出 i( i = 1,2,…,4) ,即料面属 于哪一类. ( 1) 格贴近度. δ1 ( v″i,G″) = { 0. 646 0 0. 545 0 0. 472 5 0. 670 9} ,i = 4. ( 2) 海明贴近度. δ2 ( v″i,G″) = { 0. 519 5 0. 444 4 0. 372 4 0. 690 3} ,i = 4. ( 3) 欧式贴近度. 图 9 几种贴近度的对比 Fig. 9 Comparison of several similarities δ3 ( v″i,G″) = { 0. 643 0 0. 465 0 0. 299 0 0. 376 1} ,i = 1. ( 4) 算术平均最小值贴近度. δ4 ( v″i,G″) = { 0. 770 6 0. 657 5 0. 283 9 0. 328 1} ,i = 1. ( 5) 最大最小贴近度. δ5 ( v″i,G″) = { 0. 626 8 0. 489 7 0. 165 4 0. 196 3} ,i = 1. 把待识别的料面曲线 G,分别纳入特征加权模 糊 C 均值算法已分成的四个分类结果里,用红色线 表示,如图 9 所示. 可以看出,曲线 G 的形状与第一 类比较接近,确定其属于第一类. 因此根据上面算 出的各个贴近度的值可看出,欧式贴近度为 δ3 ( v″ 1, G″) = 0. 643 0,算术平均最小值贴近度为 δ4 ( v″ 1, G″) = 0. 770 6,最大最小贴近度为 δ5 ( v″ 1,G″) = 0. 626 8,采用这三种贴近度较为合适. 4 结论 本文先根据多雷达数据建立了高炉料面模型. ·689·
·690· 北京科技大学学报 第34卷 采用多种聚类算法对其进行分类,得到隶属度矩阵 rithm and quantitative indices.IEEE Trans Syst Man Cybern Part 和聚类中心,根据隶属度矩阵进行分类,克服了人工 B,2007,37(6):1529 [Tong X J,Zeng S,Ou J,et al.Two-stage fuzzy c-mean cluster and 分类方法效率低、主观随意性强、人的视觉容易疲劳 its applications.Huazhong Univ Sci Technol Nat Sci,2008,36 和速度缓慢等问题.再由聚类中心得到标准模型库 (11):71 进行下一步的模式识别.通过多种贴近度方法把待 (同小军,曾山,欧军,等.两阶段模糊c均值聚类算法及其应 分类的目标料面与聚类中心相匹配,并比较不同贴 用.华中科技大学学报:自然科学版,2008,36(11):71) 近度的有效性,为后续的控制提供参考. 8] Sun Y J,Sun Y H,Pu D B.Research on the application of fuzzy C-means clustering algorithm in recognition.Changchun Norm 参考文献 Unmi,2010,29(5):13 [1]Liu Y C.The Law of Blast Furnace.Beijing:Metallurgical Indus- (孙英娟,孙英慧,蒲东兵.模糊C均值聚类算法在识别中的 try Press,1984 应用研究.长春师范学院学报,2010,29(5):13) (刘云彩.高炉布料规律.北京:治金工业出版社,194) [9]Tong X J,Jiang Q,Gan H T,et al.Research on the calculation Chen X Z,Ding A H,Wu Y.Design and implementation of radar method for weight of the feature weighted fuzzy clustering algorithm burden imaging system in blast furnace.Metall Ind Autom,2009, Distributed Computing and Applications for Business Engineering 33(2):52 and Science.Dalian,2008:667 (陈先中,丁爱华,吴昀.高炉雷达料面成像系统的设计与实 [10]Kong X J,Tong X J.Adaptive algorithms for weight of the feature 现.治金自动化,2009,33(2):52) weighted of FCM /International Conference on Image and B]Yang M S,Wu K L,Hsieh J N,et al.Alpha-eut implemented Graphics.Xi'an,2009:501 fuzzy clustering algorithms and switching regressions.IEEE Trans [11]Gao X B.Fuzzy Cluster Analysis and Its Applications.Xi'an:Xidi- Syst Man Cybern B Cybern,2008,38(3):588 an University Press,2004 4]Kanade P M,Hall L 0.Fuzzy ants and clustering.IEEE Trans (高新波.模糊聚类分析及其应用.西安:西安电子科技大学 Syst Man Cybern Part A,2007,37(5):758 出版社,2004) [5]Hathaway R J,Hu Y K.Density-weighted fuzry c-means cluste- [12]Tong X J,Zhang S M,Zhou L,et al.Similarity and nearness of ring.IEEE Trans Fuzzy Syst,2009,17 (1)243 fuzzy sets /International Conference on Machine Learning and [6]Majl P,Pal S K.Rough set based generalized fuzzy C-means algo- Cybernetics.Guangzhou,2005:2668
北 京 科 技 大 学 学 报 第 34 卷 采用多种聚类算法对其进行分类,得到隶属度矩阵 和聚类中心,根据隶属度矩阵进行分类,克服了人工 分类方法效率低、主观随意性强、人的视觉容易疲劳 和速度缓慢等问题. 再由聚类中心得到标准模型库 进行下一步的模式识别. 通过多种贴近度方法把待 分类的目标料面与聚类中心相匹配,并比较不同贴 近度的有效性,为后续的控制提供参考. 参 考 文 献 [1] Liu Y C. The Law of Blast Furnace. Beijing: Metallurgical Industry Press,1984 ( 刘云彩. 高炉布料规律. 北京: 冶金工业出版社,1984) [2] Chen X Z,Ding A H,Wu Y. Design and implementation of radar burden imaging system in blast furnace. Metall Ind Autom,2009, 33( 2) : 52 ( 陈先中,丁爱华,吴昀. 高炉雷达料面成像系统的设计与实 现. 冶金自动化,2009,33( 2) : 52) [3] Yang M S,Wu K L,Hsieh J N,et al. Alpha-cut implemented fuzzy clustering algorithms and switching regressions. IEEE Trans Syst Man Cybern B Cybern,2008,38( 3) : 588 [4] Kanade P M,Hall L O. Fuzzy ants and clustering. IEEE Trans Syst Man Cybern Part A,2007,37( 5) : 758 [5] Hathaway R J,Hu Y K. Density-weighted fuzzy c-means clustering. IEEE Trans Fuzzy Syst,2009,17( 1) : 243 [6] Majl P,Pal S K. Rough set based generalized fuzzy C-means algorithm and quantitative indices. IEEE Trans Syst Man Cybern Part B,2007,37( 6) : 1529 [7] Tong X J,Zeng S,Ou J,et al. Two-stage fuzzy c-mean cluster and its applications. J Huazhong Univ Sci Technol Nat Sci,2008,36 ( 11) : 71 ( 同小军,曾山,欧军,等. 两阶段模糊 c-均值聚类算法及其应 用. 华中科技大学学报: 自然科学版,2008,36( 11) : 71) [8] Sun Y J,Sun Y H,Pu D B. Research on the application of fuzzy C-means clustering algorithm in recognition. J Changchun Norm Univ,2010,29( 5) : 13 ( 孙英娟,孙英慧,蒲东兵. 模糊 C 均值聚类算法在识别中的 应用研究. 长春师范学院学报,2010,29( 5) : 13) [9] Tong X J,Jiang Q,Gan H T,et al. Research on the calculation method for weight of the feature weighted fuzzy clustering algorithm / / Distributed Computing and Applications for Business Engineering and Science. Dalian,2008: 667 [10] Kong X J,Tong X J. Adaptive algorithms for weight of the feature weighted of FCM / / International Conference on Image and Graphics. Xi'an,2009: 501 [11] Gao X B. Fuzzy Cluster Analysis and Its Applications. Xi'an: Xidian University Press,2004 ( 高新波. 模糊聚类分析及其应用. 西安: 西安电子科技大学 出版社,2004) [12] Tong X J,Zhang S M,Zhou L,et al. Similarity and nearness of fuzzy sets / / International Conference on Machine Learning and Cybernetics. Guangzhou,2005: 2668 ·690·