表１人工数据集Ｓｙｎ１上３种算法的表现Ｔａｂｌｅ１Ｃｌｕ

正在加载图片...

第5期程肠，等：基于局部保留投影的多可选聚类发掘算法 ·605. 表1人工数据集Syml上3种算法的表现 Table 1 Clustering performance of all algorithms for synthetic dataset Synl 算法 NMI2 NMI NMI2 e J 几 F2 FB RPCA 0.00 0.33 1.00 RegGB 0.00 0.00 0.00 0.33 0.33 0.33 1.00 1.00 1.00 RLPP 0.00 0.00 0.00 0.33 0.33 0.33 1.00 1.00 1.00 表2人工数据集Sym2上3种算法的表现 Table 2 Clustering performance of all algorithms for synthetic dataset Syn2 算法 NMI2 NMI NMI2 JI2 几g J几 S RegGB 0.00 0.00 0.00 0.33 0.33 0.33 1.00 1.00 1.00 RLPP 0.00 0.00 0.00 0.33 0.33 0.33 1.00 1.00 1.00 6.3舍尔图数据集虽然图2(f)的结果看似更佳，但是图2(d)保留了选择文献[11]中所介绍的埃舍尔图(escher im- 原图中更多的信息，每只爬行动物的轮廓都能够得 age)作为另一个用于寻找多个可选聚类结果实验的到保留，这是由于RLPP采用了流形子空间学习技数据集。对于人眼来说，埃舍尔图有多种分割结果 (即聚类结果)。图2(a)显示的图片为原始图片，术，能够最大程度地保留原始数据的结构。对每种可以看到图中有多只爬行动物，并且聚类时明显可算法重复运行了10次，表3给出了这些算法的平均以有多种聚类结果。在分割过程中，图中的每个像表现。素点都表示一个反映了RGB信息的数据点。我们使用k-means对图2(a)进行聚类。图2(b)为k- means得到的聚类结果，作为其他算法所需要的参考聚类结果。图2(c)和图2(d)分别为RLPP得到产的可选聚类结果C(2)和C3),可以看出图2(c)中的 (b) (c) 爬行动物为水平姿势，图2(d)中的爬行动物为垂直姿势。为了对比，提供了由RegGB算法得到的结果 (RPCA算法得到的C(2)与RegGB算法近似，C3)则效果很差，因此不加入对比)。图2(e)和图2(f)为 2 RegGB得到的可选聚类结果C(2)和C3)。从肉眼观 (d) (e) (f 察的角度可以发现，图2(c)与图2(e)相比轮廓更图2埃舍尔图数据集上的图像分割结果加清晰，聚类的效果更好。图2(d)与图2()相比， Fig.2 Image segmentation results on Escher image data 表3埃舍尔图数据集上两种算法的表现 Table 3 Clustering performance of two algorithms on the Escher image data 算法 NMI2 NMI3 NMI JIp JI2 DI DIs DL RegGB 0.05 0.27 0.26 0.39 0.33 0.28 3.81 0.05 2.38 RLPP 0.03 0.06 0.01 0.19 0.39 0.34 3.81 0.02 1.60 6.4 CMUFace数据集随机选取了3个人的全部图像进行试验。使用UCI数据库中的CMUFace数据集检验算图3显示的是聚类结果的平均值的图像。其中法。CMUFace数据集包含20个人的图像，每个人第1行是原始图像经由k-means算法得到的平均值又分为不同的面部表情（正常、高兴、悲伤、生气），图像，第2行由LPP算法得到，第3行和第4行由不同的头部朝向（向左、向右、向前、向上），不同眼 RPCA与RegGB算法得到。部状况（睁开、墨镜）。每个人有32张图片，包含了从图像上看，第1行聚类的依据是不同的人，其上述特征的组合。由于图片中的人的身份是已知余3行聚类的依据是人不同的头部朝向。很明显，3 的，因此身份信息可以作为参考聚类结果直接使用。种算法都从数据集中得到了另一组完全不同，但是表１人工数据集Ｓｙｎ１上３种算法的表现Ｔａｂｌｅ１ＣｌｕｓｔｅｒｉｎｇｐｅｒｆｏｒｍａｎｃｅｏｆａｌｌａｌｇｏｒｉｔｈｍｓｆｏｒｓｙｎｔｈｅｔｉｃｄａｔａｓｅｔＳｙｎ１算法ＮＭＩ１２ＮＭＩ１３ＮＭＩ２３ＪＩ１２ＪＩ１３ＪＩ２３Ｆ１２Ｆ１３Ｆ２３ＲＰＣＡ０．００＼＼０．３３＼＼１．００＼＼ＲｅｇＧＢ０．０００．０００．０００．３３０．３３０．３３１．００１．００１．００ＲＬＰＰ０．０００．０００．０００．３３０．３３０．３３１．００１．００１．００表２人工数据集Ｓｙｎ２上３种算法的表现Ｔａｂｌｅ２ＣｌｕｓｔｅｒｉｎｇｐｅｒｆｏｒｍａｎｃｅｏｆａｌｌａｌｇｏｒｉｔｈｍｓｆｏｒｓｙｎｔｈｅｔｉｃｄａｔａｓｅｔＳｙｎ２算法ＮＭＩ１２ＮＭＩ１３ＮＭＩ２３ＪＩ１２ＪＩ１３ＪＩ２３Ｆ１２Ｆ１３Ｆ２３ＲｅｇＧＢ０．０００．０００．０００．３３０．３３０．３３１．００１．００１．００ＲＬＰＰ０．０００．０００．０００．３３０．３３０．３３１．００１．００１．００６．３舍尔图数据集选择文献［１１］中所介绍的埃舍尔图（ｅｓｃｈｅｒｉｍ⁃ ａｇｅ）作为另一个用于寻找多个可选聚类结果实验的数据集。对于人眼来说，埃舍尔图有多种分割结果（即聚类结果）。图２（ａ）显示的图片为原始图片，可以看到图中有多只爬行动物，并且聚类时明显可以有多种聚类结果。在分割过程中，图中的每个像素点都表示一个反映了ＲＧＢ信息的数据点。我们使用ｋ⁃ｍｅａｎｓ对图２（ａ）进行聚类。图２（ｂ）为ｋ⁃ ｍｅａｎｓ得到的聚类结果，作为其他算法所需要的参考聚类结果。图２（ｃ）和图２（ｄ）分别为ＲＬＰＰ得到的可选聚类结果Ｃ（２）和Ｃ（３），可以看出图２（ｃ）中的爬行动物为水平姿势，图２（ｄ）中的爬行动物为垂直姿势。为了对比，提供了由ＲｅｇＧＢ算法得到的结果（ＲＰＣＡ算法得到的Ｃ（２）与ＲｅｇＧＢ算法近似，Ｃ（３）则效果很差，因此不加入对比）。图２（ｅ）和图２（ｆ）为ＲｅｇＧＢ得到的可选聚类结果Ｃ（２）和Ｃ（３）。从肉眼观察的角度可以发现，图２（ｃ）与图２（ｅ）相比轮廓更加清晰，聚类的效果更好。图２（ｄ）与图２（ｆ）相比，虽然图２（ｆ）的结果看似更佳，但是图２（ｄ）保留了原图中更多的信息，每只爬行动物的轮廓都能够得到保留，这是由于ＲＬＰＰ采用了流形子空间学习技术，能够最大程度地保留原始数据的结构。对每种算法重复运行了１０次，表３给出了这些算法的平均表现。图２埃舍尔图数据集上的图像分割结果Ｆｉｇ．２ＩｍａｇｅｓｅｇｍｅｎｔａｔｉｏｎｒｅｓｕｌｔｓｏｎＥｓｃｈｅｒｉｍａｇｅｄａｔａ表３埃舍尔图数据集上两种算法的表现Ｔａｂｌｅ３ＣｌｕｓｔｅｒｉｎｇｐｅｒｆｏｒｍａｎｃｅｏｆｔｗｏａｌｇｏｒｉｔｈｍｓｏｎｔｈｅＥｓｃｈｅｒｉｍａｇｅｄａｔａ算法ＮＭＩ１２ＮＭＩ１３ＮＭＩ２３ＪＩ１２ＪＩ１３ＪＩ２３ＤＩ１２ＤＩ１３ＤＩ２３ＲｅｇＧＢ０．０５０．２７０．２６０．３９０．３３０．２８３．８１０．０５２．３８ＲＬＰＰ０．０３０．０６０．０１０．１９０．３９０．３４３．８１０．０２１．６０６．４ＣＭＵＦａｃｅ数据集使用ＵＣＩ数据库中的ＣＭＵＦａｃｅ数据集检验算法。ＣＭＵＦａｃｅ数据集包含２０个人的图像，每个人又分为不同的面部表情（正常、高兴、悲伤、生气），不同的头部朝向（向左、向右、向前、向上），不同眼部状况（睁开、墨镜）。每个人有３２张图片，包含了上述特征的组合。由于图片中的人的身份是已知的，因此身份信息可以作为参考聚类结果直接使用。随机选取了３个人的全部图像进行试验。图３显示的是聚类结果的平均值的图像。其中第１行是原始图像经由ｋ⁃ｍｅａｎｓ算法得到的平均值图像，第２行由ＲＬＰＰ算法得到，第３行和第４行由ＲＰＣＡ与ＲｅｇＧＢ算法得到。从图像上看，第１行聚类的依据是不同的人，其余３行聚类的依据是人不同的头部朝向。很明显，３种算法都从数据集中得到了另一组完全不同，但是第５期程旸，等：基于局部保留投影的多可选聚类发掘算法 ·６０５·

<<向上翻页向下翻页>>

点击下载：【机器学习】基于局部保留投影的多可选聚类发掘算法