正在加载图片...
第6期 刘德罄等:模糊C均值聚类算法在高炉料面分类中的应用 ·685· 其求法有很多种,文献9]提出了一种基于平 衡系数的权值计算方法.用传统模糊C均值聚类对 [V.x= 原始数据x:粗分类成c组,得到聚类中心V= 平移标准差变换数据处理为 ]ex ,为原始数据每维之间的平衡系数,表达式 %=m-p=1,2,,c+1,g=1,2,. 如下: (13) max l=1,2,,s 其 中,,= 1+1 m和 s。= 9=1,2,…,s 1 e+1 ,(y网-,)2为每列的均值和标准差 (9) 平移极差变换数据处理为 定义聚类中心y:=1,t2,…,],i=1,2,…, c的分离度为da,即 y yy) 15-1min9=12, 1≤p≤(c+1) 1≤p≤(c+1) d)s (y-,)2 (10) (14) 式中,根据己求出的r和d,可得到特征加权0,(q= 显然有y%∈D,1] 1,2,…,s)的值: 把Y+wx:=]e+×拆成 则s维的 0,=(dg)"r,9=1,2,…,s. (11) G"、 1.3特征加权模糊C均值聚类 行向量"(i=1,2,…,c)和G”上的元素都属于0, 特征加权模糊C均值聚类算法在模糊C均值 1]区间. 聚类的基础上,引入权重矩阵,对数据集进行预处 1.4.2贴近度 理,从而得到更好的分类效果 定义1(模糊集)论域T={t,2,…,t,}是有 对s维的原始数据xk=xH,x2,…,x]进行加 限集,T上的模糊集A由隶属函数u4(t)(q=1,2, 权处理,得到新的实验数据: …,s)表征,且1(t)∈D,1],它的值反映了T上 x=xW,k=1,2,…,n. (12) 的元素t,对于模糊集A的隶属程度 再运用1.1节介绍的模糊C均值聚类对新的实 模糊集的向量表示方法: 验数据x进行分类,得出特征加权模糊C均值聚 A=u4()u4(2),…u4(t)]. 类的最终结果o 般地,若an∈[D,1](q=1,2,…,s),,则称a= 综上所述,式(1)~(11)是对已知的数据集进 [a1,a2,…,a,]为模糊向量.同理,1.4.1得到的c 行分类,并求出聚类中心,得到标准模型库.若另有 个s维的行向量”,,…,”和G上的元素都属于 己知数据集以外的一组新的数据,往往要把其与模 D,1]区间,即也为模糊向量.把,?,…,”作为 型库相匹配,看它能归到哪一种模型,这就是模式识 标准模型库,为了识别G”与,?,…,中的哪一 别问题 个最贴近,引出贴近度概念回 1.4模糊模型识别 定义2(贴近度)贴近度是两个模糊向量接近 本文采用模糊模型识别的方法把待分类的一组 程度的度量.设6(A,B)是模糊向量A=,(t1), 新数据G1x:与前面步骤得到最终的聚类中心Vx: u4(2),…,u4(t,)]和B=μg(t1),ug(2),…, 相匹配,得出G1x,所属的类别.下面将从数据处理 4e(1)]的贴近度,满足6(A,B)∈D,1],当8(A, 和贴近度两个方面进行介绍 B)越大,两个模糊向量越接近,反之两个模糊向量 1.4.1数据处理 越疏远. 在实际问题中,不同的数据一般有不同的量 求贴近度的方法有很多,常用的有以下几种 纲,根据模糊模型识别的要求,将数据压缩到0, (1)格贴近度. 1]区间上,通常用平移标准差变换和平移极差变 6A,B)=3AB+1-A⑧B].(15) 换的方法m 根据前面步骤得到最终的聚类中心Vx,和另一 式中,A·B=立(,)N,)和A⑧B=,A 组新数据G1x4,两者组成如下矩阵: u,(1,)Vug(t,)]分别为A与B的内积与外积,符第 6 期 刘德馨等: 模糊 C 均值聚类算法在高炉料面分类中的应用 其求法有很多种,文献[9]提出了一种基于平 衡系数的权值计算方法. 用传统模糊 C 均值聚类对 原始数据 xk 粗 分 类 成 c 组,得 到 聚 类 中 心 V = [viq ]c × s. 设 r 为原始数据每维之间的平衡系数,表达式 如下: rq = max {∑ c i = 1 vil,l = 1,2,…,s } ∑ c i = 1 viq ; q = 1,2,…,s. ( 9) 定义聚类中心 vi =[vi1,vi2,…,vis],i = 1,2,…, c 的分离度为 d( w) ,即 d( w) q = ∑ c i = 1 ( rq viq - rq vq ) 槡 2 . ( 10) 式中,根据已求出的 r 和 d( w) ,可得到特征加权 wq ( q = 1,2,…,s) 的值: wq = ( d( w) q ) m rq,q = 1,2,…,s. ( 11) 1. 3 特征加权模糊 C 均值聚类 特征加权模糊 C 均值聚类算法在模糊 C 均值 聚类的基础上,引入权重矩阵,对数据集进行预处 理,从而得到更好的分类效果. 对 s 维的原始数据 xk =[xk1,xk2,…,xks ]进行加 权处理,得到新的实验数据: x( w) k = xk ·W,k = 1,2,…,n. ( 12) 再运用1. 1 节介绍的模糊 C 均值聚类对新的实 验数据 x( w) k 进行分类,得出特征加权模糊 C 均值聚 类的最终结果[10]. 综上所述,式( 1) ~ ( 11) 是对已知的数据集进 行分类,并求出聚类中心,得到标准模型库. 若另有 已知数据集以外的一组新的数据,往往要把其与模 型库相匹配,看它能归到哪一种模型,这就是模式识 别问题. 1. 4 模糊模型识别 本文采用模糊模型识别的方法把待分类的一组 新数据 G1 × s与前面步骤得到最终的聚类中心 Vc × s 相匹配,得出 G1 × s所属的类别. 下面将从数据处理 和贴近度两个方面进行介绍. 1. 4. 1 数据处理 在实际问题中,不同的数据一般有不同的量 纲,根据模糊模型识别的要求,将数据压缩到[0, 1]区间上,通常用平移标准差变换和平移极差变 换的方法[11]. 根据前面步骤得到最终的聚类中心 Vc × s和另一 组新数据 G1 × s,两者组成如下矩阵: Y( c + 1) × s = Vc × s G1 × [ ]s =[ypq ]( c + 1) × s. 平移标准差变换数据处理为 y' pq = ypq - yq sq ,p = 1,2,…,c + 1,q = 1,2,…,s. ( 13) 其 中, yq = 1 c + 1 ∑ c+1 p = 1 ypq 和 sq = 1 c + 1∑ c+1 p = 1 ( ypq - yq ) 槡 2 为每列的均值和标准差. 平移极差变换数据处理为 y″ pq = y' pq - min 1≤p≤( c + 1) { y' pq } max 1≤p≤( c + 1) { y' pq } - min 1≤p≤( c + 1) { y' pq } ,q = 1,2,…,s. ( 14) 显然有 y″ pq∈[0,1]. 把 Y″( c + 1) × s =[y″ pq ]( c + 1) × s拆成 V″ c × s G″ 1 × [ ]s ,则 s 维的 行向量 v″i ( i = 1,2,…,c) 和 G″上的元素都属于[0, 1]区间. 1. 4. 2 贴近度 定义 1( 模糊集) 论域 T = { t1,t2,…,ts } 是有 限集,T 上的模糊集 A 由隶属函数 μA ( tq ) ( q = 1,2, …,s) 表征,且 μA ( tq ) ∈[0,1],它的值反映了 T 上 的元素 tq 对于模糊集 A 的隶属程度. 模糊集的向量表示方法: A =[μA ( t1 ) ,μA ( t2 ) ,…,μA ( ts ) ]. 一般地,若 aq∈[0,1]( q = 1,2,…,s) ,则称 a = [a1,a2,…,as ]为模糊向量. 同理,1. 4. 1 得到的 c 个 s 维的行向量 v″ 1,v″ 2,…,v″ c 和 G″上的元素都属于 [0,1]区间,即也为模糊向量. 把 v″ 1,v″ 2,…,v″ c 作为 标准模型库,为了识别 G″与 v″ 1,v″ 2,…,v″ c 中的哪一 个最贴近,引出贴近度概念[12]. 定义 2( 贴近度) 贴近度是两个模糊向量接近 程度的度量. 设 δ( A,B) 是模糊向量 A =[μA ( t1 ) , μA ( t2 ) ,…,μA ( ts ) ]和 B = [μB ( t1 ) ,μB ( t2 ) ,…, μB ( ts ) ]的贴近度,满足 δ( A,B) ∈[0,1],当 δ( A, B) 越大,两个模糊向量越接近,反之两个模糊向量 越疏远. 求贴近度的方法有很多,常用的有以下几种. ( 1) 格贴近度. δ( A,B) = 1 2 [AB + ( 1 - AB) ]. ( 15) 式中,AB = ∨ s q = 1 ( μA ( tq ) ∧μB ( tq ) ) 和 AB = ∧ s q = 1 [μA ( tq ) ∨μB ( tq ) ]分别为 A 与 B 的内积与外积,符 ·685·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有