表示元素值全为１的列向量。ｔｒ（·）表示矩阵的迹。为

正在加载图片...

第5期程肠，等：基于局部保留投影的多可选聚类发掘算法 ·603· 表示元素值全为1的列向量。r(·)表示矩阵的此，P(X)LP(X)T+p(X)HL,Hp(X)'是实对称矩迹。阵。作为一个特征分解问题，A的最优解由前k个为了表示简单，使用HSICox,)代替HSIC(2.F,, 最小非零特征值对应的特征向量构成，即A= 表示随机变量X和(x)=A'x,也就是X和Y之间 [a,a2…&]。下一步，可以使用k-means算法的依赖性。对子空间A进行聚类，得到可供选择的聚类结假设有8个数据{x1,x2,…,xg,{,其中x,和x2, 果C2)。 x3和x4,x3和x6,x,和xg分别为一类。则向量y1= 可以看到，(X)HL,He(X)I直接影响了LPP y2=(1000),y3=y4=(0100),y5=y6= 算法中(X)Lp(X)T项，也就是说，可以把两个聚 (0010)T,y,=yg=(0001)'。矩阵Y的每一行对类结果之间的独立性看作添加的约束项。同时，通应一个y。L,是一个8×8的矩阵，由：和y的点过添加更多的HSIC项，将算法推广可以找到更多积构成。K是一个8×8的矩阵，表示(x:)和(x) 可供选择的聚类结果。之间的相似度。同时注意，根据定义，H是一个n×n 举例来说，在寻找第3个可供选择的聚类结果 (在本例中是8×8)的常数矩阵，每行每列的和都等 C3)时，只要提供之前找到的两个聚类结果C)和于0。因此，在上述示例中，每一行（列）都包含7个 C2),并把式(6)中的HSIC(ax.c)一项替换为 (安)和1个 HSIC(ATx.c)+HSIC(ax.c2,即可。因此只要在式 (8)中使用A'XHL,HXA+A'XHL2HXA,即直接 5基于局部保留投影的多可选聚类发使用AXH(L,:+L,2）HXA代替AXHL,HXA。掘算法也就是说，使用(L,+L,2)代替了L,其他矩阵保持不变即可。由于通过HSIC,)可以自然地评估结构很复 RLPP算法描述如下：杂的样本X和Y之间的相关性，因此结合HSICo.” 1)输入数据集X;一个X上的参考聚类结果对LPP的目标函数进行修改。要求是转换矩阵A C。必须能够发掘嵌入在高维数据中的低维流形结构， 2)输出一个数据集X上可供选择的参考聚类并且与已知的聚类结果C)完全独立。换句话说，结果C2。在所有与已经存在的聚类结果C)不同的子空间 3)算法流程：中，要选出能够最好地保持高维数据流形结构的子 ①计算L,L,=(y:y〉，其中y:是一个二元向空间。因此，改进LPP的目标函数如下：量，表示C)中x,的类标签的编码。 A=argmin A'XLX'A HSIC(ATX.c(D)= ②计算H=1-e.c。 argmin A XLX'A tr(HKHL,) (6) 式中：A表示A的最佳解，且由迹的性质可知 ③计算权值矩阵W,如果x是x:的k近邻点， r(HKHL,)=r(KHL,H)。不同的核函数在计算变那么W,=exp- x-12 (t∈R),否则W,=0。量之间的独立性时结果不同，这里采用线性核函数， t 映射函数定义为：(x)=ATx,因此，K= ④计算矩阵D,Da=∑W,计算拉普拉斯矩阵 (p(X),P(X)〉=YAAX。即 L,L=D-W。 ATXLXA tr(HKHL,)= ⑤使用高斯核计算核矩阵K,K=9(x)'· AXLXA+AXHL HX'A= p()。 AT (XLX+XHL HX)A (7) ⑥分解核矩阵K,K=PP,根据P(X)=AP 将数据集合X映射到高维特征空间中后，就可得到(X)。以最终得到(X)=[p(x)(x2)…(xn)]。其 ⑦计算(X)LP(X)'+(X)HL,H(X)的特中，核矩阵K的元素为K=p(x:)I·(x)。即：征值和特征向量。 A.m=A((X)L(X)+(X)HL H (X))A ⑧按特征值从小到大的顺序对特征向量排序。 (8) ⑨选择前k个最小的特征值对应的特征向量，因为H和L,都是对称矩阵，所以即A=[a0a1…ak-1Jo (X)HL,H(X)'也是对称矩阵，同样，因为L是 ①c2)-k-means(A'e(X))。对称矩阵，所以P(X)L(X)T也是对称矩阵。因 RLPP算法的时间复杂度完全由计算最近邻矩表示元素值全为１的列向量。ｔｒ（·）表示矩阵的迹。为了表示简单，使用ＨＳＩＣ（Ｘ，Ｙ）代替ＨＳＩＣ（Ｚ，Ｆ，Ｇ），表示随机变量Ｘ和 φ（ｘ）＝ＡＴｘ，也就是Ｘ和Ｙ之间的依赖性。假设有８个数据｛ｘ１，ｘ２，…，ｘ８，｝，其中ｘ１和ｘ２，ｘ３和ｘ４，ｘ５和ｘ６，ｘ７和ｘ８分别为一类。则向量ｙ１＝ｙ２＝（１０００）Ｔ，ｙ３＝ｙ４＝（０１００）Ｔ，ｙ５＝ｙ６＝（００１０）Ｔ，ｙ７＝ｙ８＝（０００１）Ｔ。矩阵Ｙ的每一行对应一个ｙｉ。Ｌｙ是一个８×８的矩阵，由ｙｉ和ｙｊ的点积构成。Ｋ是一个８×８的矩阵，表示 φ（ｘｉ）和φ（ｘｊ）之间的相似度。同时注意，根据定义，Ｈ是一个ｎ×ｎ（在本例中是８×８）的常数矩阵，每行每列的和都等于０。因此，在上述示例中，每一行（列）都包含７个（－１８）和１个７８。５基于局部保留投影的多可选聚类发掘算法由于通过ＨＳＩＣ（Ｘ，Ｙ）可以自然地评估结构很复杂的样本Ｘ和Ｙ之间的相关性，因此结合ＨＳＩＣ（Ｘ，Ｙ）对ＬＰＰ的目标函数进行修改。要求是转换矩阵Ａ必须能够发掘嵌入在高维数据中的低维流形结构，并且与已知的聚类结果Ｃ（１）完全独立。换句话说，在所有与已经存在的聚类结果Ｃ（１）不同的子空间中，要选出能够最好地保持高维数据流形结构的子空间。因此，改进ＬＰＰ的目标函数如下：Ａｏｐｔ＝ａｒｇｍｉｎＡＴＸＬＸＴＡ＋ＨＳＩＣ（ＡＴＸ，Ｃ（１））＝ａｒｇｍｉｎＡＴＸＬＸＴＡ＋ｔｒＨＫＨＬｙ ( ) （６）式中：Ａｏｐｔ表示Ａ的最佳解，且由迹的性质可知ｔｒＨＫＨＬｙ ( ) ＝ｔｒ(ＫＨＬｙＨ) 。不同的核函数在计算变量之间的独立性时结果不同，这里采用线性核函数，映射函数定义为： φ（ｘ）＝ＡＴｘ，因此，Ｋ＝〈φ（Ｘ），φ（Ｘ）〉＝ＸＴＡＡＴＸ。即ＡＴＸＬＸＴＡ＋ｔｒＨＫＨＬｙ ( ) ＝ＡＴＸＬＸＴＡ＋ＡＴＸＨＬｙＨＸＴＡ＝ＡＴＸＬＸＴ＋ＸＨＬｙＨＸＴ ( ) Ａ（７）将数据集合Ｘ映射到高维特征空间中后，就可以最终得到 φ（Ｘ）＝［φ（ｘ１） φ（ｘ２） … φ（ｘｎ）］。其中，核矩阵Ｋ的元素为Ｋｉｊ＝φ （ｘｉ）Ｔ·φ（ｘｊ）。即：Ａｏｐｔ＝ＡＴ（φ（Ｘ）Ｌφ （Ｘ）Ｔ＋ φ（Ｘ）ＨＬｙＨφ （Ｘ）Ｔ）Ａ（８）因为Ｈ和Ｌｙ都是对称矩阵，所以 φ（Ｘ）ＨＬｙＨφ （Ｘ）Ｔ也是对称矩阵，同样，因为Ｌ是对称矩阵，所以 φ(Ｘ) Ｌφ （Ｘ）Ｔ也是对称矩阵。因此，φ（Ｘ）Ｌφ （Ｘ）Ｔ＋φ（Ｘ）ＨＬｙＨφ （Ｘ）Ｔ是实对称矩阵。作为一个特征分解问题，Ａｏｐｔ的最优解由前ｋ个最小非零特征值对应的特征向量构成，即Ａ＝［α１ α２… αｋ］。下一步，可以使用ｋ⁃ｍｅａｎｓ［１９］算法对子空间Ａ进行聚类，得到可供选择的聚类结果Ｃ（２）。可以看到，φ（Ｘ）ＨＬｙＨφ （Ｘ）Ｔ直接影响了ＬＰＰ算法中 φ（Ｘ）Ｌφ （Ｘ）Ｔ项，也就是说，可以把两个聚类结果之间的独立性看作添加的约束项。同时，通过添加更多的ＨＳＩＣ项，将算法推广可以找到更多可供选择的聚类结果。举例来说，在寻找第３个可供选择的聚类结果Ｃ（３）时，只要提供之前找到的两个聚类结果Ｃ（１）和Ｃ（２），并把式（６）中的ＨＳＩＣ（ＡＴＸ，Ｃ（１））一项替换为ＨＳＩＣ（ＡＴＸ，Ｃ（１））＋ＨＳＩＣ（ＡＴＸ，Ｃ（２））即可。因此只要在式（８）中使用ＡＴＸＨＬｙ１ＨＸＴＡ＋ＡＴＸＨＬｙ２ＨＸＴＡ，即直接使用ＡＴＸＨ（Ｌｙ１＋Ｌｙ２）ＨＸＴＡ代替ＡＴＸＨＬｙＨＸＴＡ。也就是说，使用（Ｌｙ１＋Ｌｙ２）代替了Ｌｙ，其他矩阵保持不变即可。ＲＬＰＰ算法描述如下：１）输入数据集Ｘ；一个Ｘ上的参考聚类结果Ｃ（１）。２）输出一个数据集Ｘ上可供选择的参考聚类结果Ｃ（２）。３）算法流程： ①计算Ｌｙ，Ｌｙ＝〈ｙｉ，ｙｊ〉，其中ｙｉ是一个二元向量，表示Ｃ（１）中ｘｉ的类标签的编码。 ②计算Ｈ＝Ｉ－１ｎｅｎｅＴｎ。 ③计算权值矩阵Ｗ，如果ｘｊ是ｘｉ的ｋ近邻点，那么Ｗｉｊ＝ｅｘｐ－ ‖ｘｉ－ｘｊ‖２ｔ（ｔ∈Ｒ），否则Ｗｉｊ＝０。 ④计算矩阵Ｄ，Ｄｉｉ＝ ∑ ｊＷｉｊ，计算拉普拉斯矩阵Ｌ，Ｌ＝Ｄ－Ｗ。 ⑤使用高斯核计算核矩阵Ｋ，Ｋｉｊ＝ φ （ｘｉ）Ｔ · φ（ｘｊ）。 ⑥分解核矩阵Ｋ，Ｋ＝ＰＴΛＰ，根据 φ（Ｘ）＝ Λ １２Ｐ得到 φ（Ｘ）。 ⑦计算 φ（Ｘ）Ｌφ （Ｘ）Ｔ＋φ（Ｘ）ＨＬｙＨφ（Ｘ）Ｔ的特征值和特征向量。 ⑧按特征值从小到大的顺序对特征向量排序。 ⑨选择前ｋ个最小的特征值对应的特征向量，即Ａ＝［ａ０ａ１… ａｋ－１］。 ⑩Ｃ（２）＝ｋ⁃ｍｅａｎｓ（ＡＴφ（Ｘ））。ＲＬＰＰ算法的时间复杂度完全由计算最近邻矩第５期程旸，等：基于局部保留投影的多可选聚类发掘算法 ·６０３·

<<向上翻页向下翻页>>

点击下载：【机器学习】基于局部保留投影的多可选聚类发掘算法