正在加载图片...
第1期 朱林,等:鲁棒的模糊方向相似性聚类算法 ·45· 时: 2<n.4∈0, 1)隶属度物迭代公式 对于单独的样本点x,隶属度约束函数:f(n, 西=(e-avm"/∑(e.vv ,“w=“(1.)有如下结论 (6) 定理2对隶属度约束函数f(h,o,…), 由于e,·a<0,出现负值,隶属度也会为负」 在0≤w≤1,“=1,权重指数m∈0,)的限 故自适应提升a,使得e"·g为正 制条件下,当h(i=1,2,…d均为1/c时,f(n, 定义a=minfei∈1,cy}-n,I>0), ,u)取得最大值m-1;当u(i=1,2, 代入式6)从而得到: 中一个4为1,其他h(i≠为0时,f(h,, 地=(es,.mine.+Vvav/ 取最小值0,即0≤f(h,也,,)≤cm-1. 7) 通过加入隶属度约束函数,使得当函数J RFDSC hmin 极大,即f(M,也,)极小时,出现某个趋向 2)中心向量w迭代公式: 于1,其他的“(iW趋向于0的情况.图1显示加 ∑xue 入约束函数后,也的明晰含义被显著提升.改进算 (8) 法兼顾了硬聚类和模糊聚类的优点,因此对数据集 Ⅱ∑xuge,I 将有更好的鲁棒性」 下面对定理3中出现的权重指数m、尺度参数 -U(x) 1.0 -U(x) k和模糊程度常数刀的选择做详细说明. 0.8 --U(x) 对于权重指数m,上文已经指出由于与传统的 0.6 FCM聚类算法的不同,按照FDSC和RFDSC算法 04 定义,数据向量x与中心向量w,的相似度越高其 03 隶属度应越大,故权重指数m<1,同时为了保证算 81012 法有较好的收敛性,权重指数0<m<1.实验结果表 明,当权重指数m趋于1时,具有较好的鲁棒性和 (a)FDSC算法的隶属度函数 抗噪声能力,故文中权重指数m取0.9. 尺度参数k的选择与数据集有关,通过尺度参 数k的选择可以扩大(k>1)或减小(k<1)方向数据 1.0 0.8 向量x和聚类中心向量w,的相似性程度.实验结 --(x ---U(x) 果表明,当权重指数k取值在1~5时,具有较好的 0.4 收敛性和聚类效果,故文中尺度参数k取3。 02 模糊程度常数?的选择同样与数据集有关,影 -2 0 24681012 响模糊划分的模糊程度,值越大模糊程度越高:值越 小模糊程度越低,越趋进于硬聚类.当趋于无穷时, (b)RFDSC算法的隶属度函数 样本点对每一类的隶属度均为1/c.通过对模糊程 图1不同的求属度函数曲线 度常数的控制,使得样本点对距离最近的类中心施 Fig.1 Different kinds of membership curves 加最大的吸引力,这个力越大,类中心收敛速度也越 2.3 RFDSC算法 快,样本点也可以对相似性较小的类中心有微弱的 对于RFDSC算法,首先给出如下定理 吸引力,避免聚类过程出现死节点,保证了算法具有 很好的鲁棒性).由于RFDSC算法采用了竞争学 定理3在∑山=1,0<∑山<m,西<n, 习规则,通过加入隶属度约束函数显著提升隶属度 山∈0,1],ww,=1以及权重指数m∈0,)条 明晰含义,兼顾了硬聚类和模糊聚类的优点,因 件下,使RFDSC算法的目标函数JRD= 此在高维大量数据情况下,RFDSC算法比FDSC算 王,Ge·,w1G)取极值 法的鲁棒性和收敛速度都有了很大提高.由于 RFDSC算法对赢者的吸引力的增强作用随I减小 1994-2009 China Academic Journal Electronic Publishing House.All rights reserved.http://www.cnki.net∑ n j = 1 uij < n , uij ∈[0 ,1 ] . 对于单独的样本点 xj ,隶属度约束函数 : f ( u1 , u2 , …, uc ) = ∑ c i =1 ui ( u m- 1 i - 1) 有如下结论 : 定理 2 对隶属度约束函数 f ( u1 , u2 , …, uc ) , 在 0 ≤ui ≤1 , ∑ c i = 1 ui = 1 ,权重指数 m ∈(0 ,1) 的限 制条件下 , 当 ui ( i = 1 ,2 , …, c) 均为 1/ c 时 , f ( u1 , u2 , …, uc ) 取得最大值 c 1 - m - 1 ;当 ui ( i = 1 ,2 , …, c) 中一个 uk 为 1 ,其他 ui ( i ≠k) 为 0 时 , f ( u1 , u2 , …, uc ) 取最小值 0 ,即 0 ≤f ( u1 , u2 , …, uc ) ≤c 1 - m - 1. 通过加入隶属度约束函数 ,使得当函数 J RFDSC 极大 ,即 f ( u1 , u2 , …, uc ) 极小时 ,出现某个 uk 趋向 于 1 ,其他的 ui ( i ≠k) 趋向于 0 的情况. 图 1 显示加 入约束函数后 , ui 的明晰含义被显著提升. 改进算 法兼顾了硬聚类和模糊聚类的优点 ,因此对数据集 将有更好的鲁棒性. 213 RFDSC 算法 对于 RFDSC 算法 ,首先给出如下定理. 定理 3 在 ∑ c i = 1 uij = 1 ,0 < ∑ n j = 1 uij < n , uij < n , uij ∈[0 ,1 ] ,w T i wi = 1 以及权重指数 m ∈(0 ,1) 条 件下 , 使 RFDSC 算 法 的 目 标 函 数 J RFDSC = ∑ c i = 1 ∑ n j = 1 u m ij (e kx T j wi ) - ∑ n j = 1 aj ∑ c i = 1 uij ( u m- 1 ij - 1) 取极值 时 : 1) 隶属度 uij迭代公式 : uij = (e kx T j wi - aj) - 1/ ( m- 1) / ∑ c i = 1 (e kx T j wi - aj) - 1/ ( m- 1) . (6) 由于 e kx T j wi - aj < 0 ,出现负值 ,隶属度 uij 也会为负. 故自适应提升 aj ,使得 e kx T j wi - aj 为正. 定义 aj = min{ e kx T j w j | i ∈{ 1 , …, c}} - η, (η> 0) , 代入式(6) 从而得到 : uij = (e kx T j wi - min e kx T j w 3 +η) - 1/ ( m- 1) / ∑ c i =1 (e kx T j wi - min e kx T j w 3 +η) - 1/ ( m- 1) . (7) 2) 中心向量 wi 迭代公式 : wi = ∑ n j = 1 x T j u m ij e kx T j wi ‖∑ n j = 1 x T j u m ij e kx T j wi ‖ . (8) 下面对定理 3 中出现的权重指数 m、尺度参数 k 和模糊程度常数η的选择做详细说明. 对于权重指数 m ,上文已经指出由于与传统的 FCM 聚类算法的不同 ,按照 FDSC 和 RFDSC 算法 定义 ,数据向量 xj 与中心向量 wi 的相似度越高其 隶属度应越大 ,故权重指数 m < 1 ,同时为了保证算 法有较好的收敛性 ,权重指数 0 < m < 1. 实验结果表 明 ,当权重指数 m 趋于 1 时 ,具有较好的鲁棒性和 抗噪声能力 ,故文中权重指数 m 取 019. 尺度参数 k 的选择与数据集有关 ,通过尺度参 数 k 的选择可以扩大( k > 1) 或减小( k < 1) 方向数据 向量 xj 和聚类中心向量 wi 的相似性程度. 实验结 果表明 ,当权重指数 k 取值在 1~5 时 ,具有较好的 收敛性和聚类效果 ,故文中尺度参数 k 取 3. 模糊程度常数η的选择同样与数据集有关 ,影 响模糊划分的模糊程度 ,值越大模糊程度越高;值越 小模糊程度越低 ,越趋进于硬聚类. 当趋于无穷时 , 样本点对每一类的隶属度均为 1/ c. 通过对模糊程 度常数的控制 ,使得样本点对距离最近的类中心施 加最大的吸引力 ,这个力越大 ,类中心收敛速度也越 快;样本点也可以对相似性较小的类中心有微弱的 吸引力 ,避免聚类过程出现死节点 ,保证了算法具有 很好的鲁棒性[7 ] . 由于 RFDSC 算法采用了竞争学 习规则 ,通过加入隶属度约束函数显著提升隶属度 uij明晰含义 ,兼顾了硬聚类和模糊聚类的优点 ,因 此在高维大量数据情况下 ,RFDSC 算法比 FDSC 算 法的鲁棒性和收敛速度都有了很大提高. 由于 RFDSC 算法对赢者的吸引力的增强作用随η减小 第 1 期 朱 林 ,等 :鲁棒的模糊方向相似性聚类算法 ·45 ·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有