正在加载图片...
第5期 程肠,等:基于局部保留投影的多可选聚类发掘算法 ·605. 表1人工数据集Syml上3种算法的表现 Table 1 Clustering performance of all algorithms for synthetic dataset Synl 算法 NMI2 NMI NMI2 e J 几 F2 FB RPCA 0.00 0.33 1.00 RegGB 0.00 0.00 0.00 0.33 0.33 0.33 1.00 1.00 1.00 RLPP 0.00 0.00 0.00 0.33 0.33 0.33 1.00 1.00 1.00 表2人工数据集Sym2上3种算法的表现 Table 2 Clustering performance of all algorithms for synthetic dataset Syn2 算法 NMI2 NMI NMI2 JI2 几g J几 S RegGB 0.00 0.00 0.00 0.33 0.33 0.33 1.00 1.00 1.00 RLPP 0.00 0.00 0.00 0.33 0.33 0.33 1.00 1.00 1.00 6.3舍尔图数据集 虽然图2(f)的结果看似更佳,但是图2(d)保留了 选择文献[11]中所介绍的埃舍尔图(escher im- 原图中更多的信息,每只爬行动物的轮廓都能够得 age)作为另一个用于寻找多个可选聚类结果实验的 到保留,这是由于RLPP采用了流形子空间学习技 数据集。对于人眼来说,埃舍尔图有多种分割结果 (即聚类结果)。图2(a)显示的图片为原始图片, 术,能够最大程度地保留原始数据的结构。对每种 可以看到图中有多只爬行动物,并且聚类时明显可 算法重复运行了10次,表3给出了这些算法的平均 以有多种聚类结果。在分割过程中,图中的每个像 表现。 素点都表示一个反映了RGB信息的数据点。我们 使用k-means对图2(a)进行聚类。图2(b)为k- means得到的聚类结果,作为其他算法所需要的参 考聚类结果。图2(c)和图2(d)分别为RLPP得到 产 的可选聚类结果C(2)和C3),可以看出图2(c)中的 (b) (c) 爬行动物为水平姿势,图2(d)中的爬行动物为垂直 姿势。为了对比,提供了由RegGB算法得到的结果 (RPCA算法得到的C(2)与RegGB算法近似,C3)则 效果很差,因此不加入对比)。图2(e)和图2(f)为 2 RegGB得到的可选聚类结果C(2)和C3)。从肉眼观 (d) (e) (f 察的角度可以发现,图2(c)与图2(e)相比轮廓更 图2埃舍尔图数据集上的图像分割结果 加清晰,聚类的效果更好。图2(d)与图2()相比, Fig.2 Image segmentation results on Escher image data 表3埃舍尔图数据集上两种算法的表现 Table 3 Clustering performance of two algorithms on the Escher image data 算法 NMI2 NMI3 NMI JIp JI2 DI DIs DL RegGB 0.05 0.27 0.26 0.39 0.33 0.28 3.81 0.05 2.38 RLPP 0.03 0.06 0.01 0.19 0.39 0.34 3.81 0.02 1.60 6.4 CMUFace数据集 随机选取了3个人的全部图像进行试验。 使用UCI数据库中的CMUFace数据集检验算 图3显示的是聚类结果的平均值的图像。其中 法。CMUFace数据集包含20个人的图像,每个人 第1行是原始图像经由k-means算法得到的平均值 又分为不同的面部表情(正常、高兴、悲伤、生气), 图像,第2行由LPP算法得到,第3行和第4行由 不同的头部朝向(向左、向右、向前、向上),不同眼 RPCA与RegGB算法得到。 部状况(睁开、墨镜)。每个人有32张图片,包含了 从图像上看,第1行聚类的依据是不同的人,其 上述特征的组合。由于图片中的人的身份是已知 余3行聚类的依据是人不同的头部朝向。很明显,3 的,因此身份信息可以作为参考聚类结果直接使用。 种算法都从数据集中得到了另一组完全不同,但是表 1 人工数据集 Syn1 上 3 种算法的表现 Table 1 Clustering performance of all algorithms for synthetic dataset Syn1 算法 NMI12 NMI13 NMI23 JI12 JI13 JI23 F12 F13 F23 RPCA 0.00 \ \ 0.33 \ \ 1.00 \ \ RegGB 0.00 0.00 0.00 0.33 0.33 0.33 1.00 1.00 1.00 RLPP 0.00 0.00 0.00 0.33 0.33 0.33 1.00 1.00 1.00 表 2 人工数据集 Syn2 上 3 种算法的表现 Table 2 Clustering performance of all algorithms for synthetic dataset Syn2 算法 NMI12 NMI13 NMI23 JI12 JI13 JI23 F12 F13 F23 RegGB 0.00 0.00 0.00 0.33 0.33 0.33 1.00 1.00 1.00 RLPP 0.00 0.00 0.00 0.33 0.33 0.33 1.00 1.00 1.00 6.3 舍尔图数据集 选择文献[11]中所介绍的埃舍尔图( escher im⁃ age)作为另一个用于寻找多个可选聚类结果实验的 数据集。 对于人眼来说,埃舍尔图有多种分割结果 (即聚类结果)。 图 2( a) 显示的图片为原始图片, 可以看到图中有多只爬行动物,并且聚类时明显可 以有多种聚类结果。 在分割过程中,图中的每个像 素点都表示一个反映了 RGB 信息的数据点。 我们 使用 k⁃means 对图 2( a) 进行聚类。 图 2( b) 为 k⁃ means 得到的聚类结果,作为其他算法所需要的参 考聚类结果。 图 2(c)和图 2(d)分别为 RLPP 得到 的可选聚类结果 C (2)和 C (3) ,可以看出图 2(c)中的 爬行动物为水平姿势,图 2(d)中的爬行动物为垂直 姿势。 为了对比,提供了由 RegGB 算法得到的结果 (RPCA 算法得到的 C (2)与 RegGB 算法近似,C (3) 则 效果很差,因此不加入对比)。 图 2(e)和图 2(f)为 RegGB 得到的可选聚类结果 C (2)和 C (3) 。 从肉眼观 察的角度可以发现,图 2(c)与图 2( e)相比轮廓更 加清晰,聚类的效果更好。 图 2(d)与图 2(f)相比, 虽然图 2(f)的结果看似更佳,但是图 2( d)保留了 原图中更多的信息,每只爬行动物的轮廓都能够得 到保留,这是由于 RLPP 采用了流形子空间学习技 术,能够最大程度地保留原始数据的结构。 对每种 算法重复运行了 10 次,表 3 给出了这些算法的平均 表现。 图 2 埃舍尔图数据集上的图像分割结果 Fig.2 Image segmentation results on Escher image data 表 3 埃舍尔图数据集上两种算法的表现 Table 3 Clustering performance of two algorithms on the Escher image data 算法 NMI12 NMI13 NMI23 JI12 JI13 JI23 DI12 DI13 DI23 RegGB 0.05 0.27 0.26 0.39 0.33 0.28 3.81 0.05 2.38 RLPP 0.03 0.06 0.01 0.19 0.39 0.34 3.81 0.02 1.60 6.4 CMUFace 数据集 使用 UCI 数据库中的 CMUFace 数据集检验算 法。 CMUFace 数据集包含 20 个人的图像,每个人 又分为不同的面部表情(正常、高兴、悲伤、生气), 不同的头部朝向(向左、向右、向前、向上),不同眼 部状况(睁开、墨镜)。 每个人有 32 张图片,包含了 上述特征的组合。 由于图片中的人的身份是已知 的,因此身份信息可以作为参考聚类结果直接使用。 随机选取了 3 个人的全部图像进行试验。 图 3 显示的是聚类结果的平均值的图像。 其中 第 1 行是原始图像经由 k⁃means 算法得到的平均值 图像,第 2 行由 RLPP 算法得到,第 3 行和第 4 行由 RPCA 与 RegGB 算法得到。 从图像上看,第 1 行聚类的依据是不同的人,其 余 3 行聚类的依据是人不同的头部朝向。 很明显,3 种算法都从数据集中得到了另一组完全不同,但是 第 5 期 程旸,等:基于局部保留投影的多可选聚类发掘算法 ·605·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有