第 6 期刘德馨等: 模糊 C 均值聚类算法在高炉料面分类中的应用其求

正在加载图片...

第6期刘德罄等：模糊C均值聚类算法在高炉料面分类中的应用 ·685· 其求法有很多种，文献9]提出了一种基于平衡系数的权值计算方法.用传统模糊C均值聚类对 [V.x= 原始数据x:粗分类成c组，得到聚类中心V= 平移标准差变换数据处理为 ]ex ，为原始数据每维之间的平衡系数，表达式 %=m-p=1,2,,c+1,g=1,2,. 如下： (13) max l=1,2,,s 其中，，= 1+1 m和 s。= 9=1,2,…,s 1 e+1 ,（y网-，)2为每列的均值和标准差 (9) 平移极差变换数据处理为定义聚类中心y:=1,t2,…,],i=1,2,…, c的分离度为da,即 y yy) 15-1min9=12, 1≤p≤(c+1) 1≤p≤(c+1) d)s （y-,)2 (10) (14) 式中，根据己求出的r和d,可得到特征加权0，(q= 显然有y%∈D,1] 1,2,…,s)的值：把Y+wx:=]e+×拆成则s维的 0,=(dg)"r,9=1,2,…,s. (11) G"、 1.3特征加权模糊C均值聚类行向量"(i=1,2,…,c)和G”上的元素都属于0，特征加权模糊C均值聚类算法在模糊C均值 1]区间. 聚类的基础上，引入权重矩阵，对数据集进行预处 1.4.2贴近度理，从而得到更好的分类效果定义1（模糊集）论域T={t,2,…,t,}是有对s维的原始数据xk=xH,x2,…,x]进行加限集，T上的模糊集A由隶属函数u4(t)(q=1,2, 权处理，得到新的实验数据： …,s)表征，且1(t)∈D,1],它的值反映了T上 x=xW,k=1,2,…,n. (12) 的元素t,对于模糊集A的隶属程度再运用1.1节介绍的模糊C均值聚类对新的实模糊集的向量表示方法：验数据x进行分类，得出特征加权模糊C均值聚 A=u4()u4(2),…u4(t)]. 类的最终结果o 般地，若an∈[D,1](q=1,2,…,s），,则称a= 综上所述，式(1)~(11)是对已知的数据集进 [a1,a2,…,a,]为模糊向量.同理，1.4.1得到的c 行分类，并求出聚类中心，得到标准模型库.若另有个s维的行向量”，，…，”和G上的元素都属于己知数据集以外的一组新的数据，往往要把其与模 D,1]区间，即也为模糊向量.把，？，…，”作为型库相匹配，看它能归到哪一种模型，这就是模式识标准模型库，为了识别G”与，？，…，中的哪一别问题个最贴近，引出贴近度概念回 1.4模糊模型识别定义2（贴近度）贴近度是两个模糊向量接近本文采用模糊模型识别的方法把待分类的一组程度的度量.设6(A,B)是模糊向量A=,(t1), 新数据G1x:与前面步骤得到最终的聚类中心Vx: u4(2),…,u4（t,)]和B=μg（t1）,ug（2）,…, 相匹配，得出G1x,所属的类别.下面将从数据处理 4e(1)]的贴近度，满足6(A,B)∈D,1],当8(A, 和贴近度两个方面进行介绍 B)越大，两个模糊向量越接近，反之两个模糊向量 1.4.1数据处理越疏远. 在实际问题中，不同的数据一般有不同的量求贴近度的方法有很多，常用的有以下几种纲，根据模糊模型识别的要求，将数据压缩到0， (1)格贴近度. 1]区间上，通常用平移标准差变换和平移极差变 6A,B)=3AB+1-A⑧B].(15) 换的方法m 根据前面步骤得到最终的聚类中心Vx,和另一式中，A·B=立（，)N,)和A⑧B=,A 组新数据G1x4,两者组成如下矩阵： u,(1,)Vug(t,)]分别为A与B的内积与外积，符第 6 期刘德馨等: 模糊 C 均值聚类算法在高炉料面分类中的应用其求法有很多种，文献［9］提出了一种基于平衡系数的权值计算方法．用传统模糊 C 均值聚类对原始数据 xk 粗分类成 c 组，得到聚类中心 V = ［viq ］c × s．设 r 为原始数据每维之间的平衡系数，表达式如下: rq = max {∑ c i = 1 vil，l = 1，2，…，s } ∑ c i = 1 viq ; q = 1，2，…，s． ( 9) 定义聚类中心 vi =［vi1，vi2，…，vis］，i = 1，2，…， c 的分离度为 d( w) ，即 d( w) q = ∑ c i = 1 ( rq viq － rq vq ) 槡 2 ． ( 10) 式中，根据已求出的 r 和 d( w) ，可得到特征加权 wq ( q = 1，2，…，s) 的值: wq = ( d( w) q ) m rq，q = 1，2，…，s． ( 11) 1. 3 特征加权模糊 C 均值聚类特征加权模糊 C 均值聚类算法在模糊 C 均值聚类的基础上，引入权重矩阵，对数据集进行预处理，从而得到更好的分类效果．对 s 维的原始数据 xk =［xk1，xk2，…，xks ］进行加权处理，得到新的实验数据: x( w) k = xk ·W，k = 1，2，…，n． ( 12) 再运用1. 1 节介绍的模糊 C 均值聚类对新的实验数据 x( w) k 进行分类，得出特征加权模糊 C 均值聚类的最终结果［10］．综上所述，式( 1) ～ ( 11) 是对已知的数据集进行分类，并求出聚类中心，得到标准模型库．若另有已知数据集以外的一组新的数据，往往要把其与模型库相匹配，看它能归到哪一种模型，这就是模式识别问题． 1. 4 模糊模型识别本文采用模糊模型识别的方法把待分类的一组新数据 G1 × s与前面步骤得到最终的聚类中心 Vc × s 相匹配，得出 G1 × s所属的类别．下面将从数据处理和贴近度两个方面进行介绍． 1. 4. 1 数据处理在实际问题中，不同的数据一般有不同的量纲，根据模糊模型识别的要求，将数据压缩到［0， 1］区间上，通常用平移标准差变换和平移极差变换的方法［11］．根据前面步骤得到最终的聚类中心 Vc × s和另一组新数据 G1 × s，两者组成如下矩阵: Y( c + 1) × s = Vc × s G1 × [ ]s =［ypq ］( c + 1) × s．平移标准差变换数据处理为 y' pq = ypq － yq sq ，p = 1，2，…，c + 1，q = 1，2，…，s． ( 13) 其中， yq = 1 c + 1 ∑ c+1 p = 1 ypq 和 sq = 1 c + 1∑ c+1 p = 1 ( ypq － yq ) 槡 2 为每列的均值和标准差．平移极差变换数据处理为 y″ pq = y' pq － min 1≤p≤( c + 1) { y' pq } max 1≤p≤( c + 1) { y' pq } － min 1≤p≤( c + 1) { y' pq } ，q = 1，2，…，s． ( 14) 显然有 y″ pq∈［0，1］．把 Y″( c + 1) × s =［y″ pq ］( c + 1) × s拆成 V″ c × s G″ 1 × [ ]s ，则 s 维的行向量 v″i ( i = 1，2，…，c) 和 G″上的元素都属于［0， 1］区间． 1. 4. 2 贴近度定义 1( 模糊集) 论域 T = { t1，t2，…，ts } 是有限集，T 上的模糊集 A 由隶属函数 μA ( tq ) ( q = 1，2， …，s) 表征，且 μA ( tq ) ∈［0，1］，它的值反映了 T 上的元素 tq 对于模糊集 A 的隶属程度．模糊集的向量表示方法: A =［μA ( t1 ) ，μA ( t2 ) ，…，μA ( ts ) ］．一般地，若 aq∈［0，1］( q = 1，2，…，s) ，则称 a = ［a1，a2，…，as ］为模糊向量．同理，1. 4. 1 得到的 c 个 s 维的行向量 v″ 1，v″ 2，…，v″ c 和 G″上的元素都属于［0，1］区间，即也为模糊向量．把 v″ 1，v″ 2，…，v″ c 作为标准模型库，为了识别 G″与 v″ 1，v″ 2，…，v″ c 中的哪一个最贴近，引出贴近度概念［12］．定义 2( 贴近度) 贴近度是两个模糊向量接近程度的度量．设 δ( A，B) 是模糊向量 A =［μA ( t1 ) ， μA ( t2 ) ，…，μA ( ts ) ］和 B = ［μB ( t1 ) ，μB ( t2 ) ，…， μB ( ts ) ］的贴近度，满足 δ( A，B) ∈［0，1］，当 δ( A， B) 越大，两个模糊向量越接近，反之两个模糊向量越疏远．求贴近度的方法有很多，常用的有以下几种． ( 1) 格贴近度． δ( A，B) = 1 2 ［AB + ( 1 － AB) ］． ( 15) 式中，AB = ∨ s q = 1 ( μA ( tq ) ∧μB ( tq ) ) 和 AB = ∧ s q = 1 ［μA ( tq ) ∨μB ( tq ) ］分别为 A 与 B 的内积与外积，符 ·685·

<<向上翻页向下翻页>>

点击下载：模糊C均值聚类算法在高炉料面分类中的应用