正在加载图片...
第3期 王跃,等:一种基于少量标签的改进迁移模糊聚类 ·313. =川x-%2+y1x-x2+Yy-x2 V+1 为了获得其迭 (21) 式中y:和y2为权重因子,用于调节历史中心的重 代表达式,利用拉格朗日极值优化表达式,首先构造 要程度,将代表点作为有效信息迁移到当前场景中 Lagrange表达式: 来。新的目标函数如式(22): Q=宫a+时)+ (au2+Ba)正+ 叫套三am+金2三0 i=1k=W+1 (22) 克芝,-密 三A-含)+2-宫)(2四) i=1k=N+1 式中入k与0:为Lagrange乘子。 式中:a≥0,B≥0,ω>0,0≤u,tk≤1, 令aQ/aV=0,解得: 列)+阳+m)叉1o N+M N+M 三+ k=N+l N+l I+W[E(am4+B的)+u三(a+B民+:-fW] =N-t (24) 令aQ/a入.=0,可以得到: 使用同样得方法,可以求得t的迭代表达式: 含=1 (25) V+U k≤N 令aQ/au4=0,对于0<k≤N可以解得: 2 (26) N+M d N<k≤N+M 将式(26)代入式(25),解得: (31) (27) 2.4改进的半监督迁移算法描述 根据上一节的公式,TSS-FPCM的表述如下: 再将入代回式(26),得到: 算法1ITSS-FPCM算法 输入前N个数据样本为目标数据,后M个为 (28) 已知标签的历史数据的数据样本X'= 同理,对于N<k≤N+M,可以求出: {xIk=1,2,…,N,N+1,…,N+M},聚类个数C,最 1 大迭代次数L,当前迭代次数(=1,源数据类代表点 1一1+a ,相关参数aB、w、Y1和Y2,阈值E。 (29) 输出聚类中心":,隶属度矩阵u和概率矩 阵t法o 1)初始化聚类中心”:,根据已知标签构造矩阵 合并式(28)和(29)可以得到最终表达式: F,初始化目标函数=0。 2)根据表达式(30)更新v。 k≤N 3)根据表达式(31)更新", 4)根据表达式(24)更新":。 1 5)l=l+1,计算新的目标函数0,如果J0- wk=1-1+a 1+Qt, N<k≤N+M -<6,或者>L跳到第6),否则,跳到2)。 6)聚类中心,隶属度矩阵v和概率矩阵v法。 3 实验结果 (30) 为了验证算法的有效性,实验使用了人工数据d ?2 ik = ‖xk - vi‖2 + γ1 ‖xk - x ^ i‖2 + γ2 ‖vi - x ^ i‖2 (21) 式中 γ1 和 γ2 为权重因子,用于调节历史中心的重 要程度,将代表点作为有效信息迁移到当前场景中 来。 新的目标函数如式(22): J = ∑ C i = 1 ∑ N k = 1 αu 2 ik + βt 2 ik ( ) d ? 2 ik + ω ∑ C i = 1 ∑ N+M k = N+1 αu 2 ik + βt 2 ik ( ) d ? 2 { ik + ∑ C i = 1 ∑ N+M k = N+1 uik - f ik ( ) 2 d ? 2 ik ] (22) 式中: α ≥ 0, β ≥ 0, ω > 0, 0 ≤ uik, t ik ≤ 1, ∑ C i = 1 uik = 1,∀k, ∑ N+M k = 1 t ik = 1,∀i。 为了获得其迭 代表达式,利用拉格朗日极值优化表达式,首先构造 Lagrange 表达式: Q = ∑ C i = 1 ∑ N k = 1 αu 2 ik + βt 2 ik ( ) d ? 2 ik + ω ∑ C i = 1 ∑ N+M k =N+1 αu 2 ik + βt 2 ik ( ) d ? 2 [ ik +∑ C i = 1 ∑ N+M k =N+1 uik - f ik ( ) 2 d ? 2 ik ] + ∑ N+M k = 1 λk 1 - ∑ C i = 1 ( uik ) + ∑ C i = 1 θi 1 - ∑ N+M k = 1 t ( ik ) (23) 式中 λk 与 θi 为 Lagrange 乘子。 令∂Q/ ∂Vi = 0,解得: vi = ∑ N k =1 αu 2 ik + βt 2 ik ( ) xk + γ2∑ N k =1 αu 2 ik + βt 2 ik ( ) x^ i + ω ∑ N+M k =N+1 αu 2 ik + βt 2 ik + uik - f ik ( ) 2 ( ) xk + γ2∑ N+M k =N+1 αu 2 ik + βt 2 ik + uik - f ik ( ) 2 ( ) x^ [ i] 1 + γ2 ( ) ∑ N k =1 αu 2 ik + βt 2 ik ( ) + ω∑ N+M k =N+1 αu 2 ik + βt 2 ik + uik - f ik ( ) 2 [ ( ) ] (24) 令∂Q/ ∂λk = 0,可以得到: ∑ C i = 1 uik = 1 (25) 令∂Q/ ∂uik = 0,对于 0<k≤N 可以解得: uik = λ 2αd ? 2 ik (26) 将式(26)代入式(25),解得: λ 2α = ∑ C i = 1 1 d ? 2 ik æ è çç ö ø ÷÷ -1 (27) 再将 λ 代回式(26),得到: uik = ∑ C j = 1 d ? 2 ik d ? 2 jk æ è ç ç ö ø ÷ ÷ -1 (28) 同理,对于 N<k≤N+M,可以求出: uik = 1 - 1 1 + α∑ C j = 1 f jk ∑ C j = 1 d ? 2 ik d ? 2 jk + 1 1 + α f ik (29) 合并式(28)和(29)可以得到最终表达式: uik = ∑ C j = 1 d ? 2 ik d ? 2 jk æ è ç ç ö ø ÷ ÷ -1 , k ≤ N 1 - 1 1 + α∑ C j = 1 f jk ∑ C j = 1 d ? 2 ik d ? 2 jk + 1 1 + α f ik, N < k ≤ N + M ì î í ï ï ï ï ï ï ï ï ïï (30) 使用同样得方法,可以求得 t ik的迭代表达式: t ik = ∑ N j = 1 d ? 2 ik d ? 2 ij + ∑ N+M j = N+1 d ? 2 ik ωd ? 2 ij æ è ç ç ö ø ÷ ÷ -1 , k ≤ N ∑ N j = 1 ωd ? 2 ik d ? 2 ij + ∑ N+M j = N+1 d ? 2 ik d ? 2 ij æ è ç ç ö ø ÷ ÷ -1 , N < k ≤ N + M ì î í ï ï ï ï ï ï (31) 2.4 改进的半监督迁移算法描述 根据上一节的公式,ITSS⁃FPCM 的表述如下: 算法 1 ITSS⁃FPCM 算法 输入 前 N 个数据样本为目标数据,后 M 个为 已 知 标 签 的 历 史 数 据 的 数 据 样 本 X′ = xk { | k = 1,2,…,N,N+1,…,N+M} ,聚类个数 C, 最 大迭代次数 L,当前迭代次数 l = 1,源数据类代表点 X^ ,相关参数 α、β、ω、γ1 和 γ2 ,阈值 ε。 输出 聚类中心 vi,隶属度矩阵 uik 和概率矩 阵 t ik。 1)初始化聚类中心 vi,根据已知标签构造矩阵 F,初始化目标函数 J (l)= 0。 2)根据表达式(30)更新 vik。 3)根据表达式(31)更新 vik。 4)根据表达式(24)更新 vi。 5)l = l + 1,计算新的目标函数 J (l) ,如果 J (l) - J (l-1) <ε,或者 l>L 跳到第 6),否则,跳到 2)。 6)聚类中心 vi,隶属度矩阵 vik和概率矩阵 vik。 3 实验结果 为了验证算法的有效性,实验使用了人工数据 第 3 期 王跃,等:一种基于少量标签的改进迁移模糊聚类 ·313·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有