正在加载图片...
第5期 储德润,等:公理化模糊共享近邻自适应谱聚类算法 ·903· 实例和2007个测试实例(总共9298个)。为了展 100 ✉SC ▣STSC 示该方法的可伸缩性,考虑了不同数量的集群。 具体来说,数字子集{0,8}、{4,9}、{0,5,8}、{3,5,8}、 60 {1,2,3,4}、{0,2,4,6,7}和整个集合{0,1,…,9}用于测 %/IWN 试本文提出的算法。这些子集的详细信息如表4 所示。分别在每个子集上进行实验,并使用 20 CE和NMI来测量性能。 表4USPS实验数据集的特性 0,8 49 05 35,8 {0,24,6,7 {1,23,49 9 0,1 Table 4 Characteristics of the USPS experimental datasets 数据集 数据总数 类数 维数 图2USPS数据集上NMI的性能比较 Fig.2 Performance comparison of NMI on the USPS data- {0,8} 2261 256 sets {4,9} 1673 256 4 结束语 {0,5,8} 2977 3 256 {3,5,8} 2248 3 256 本文提出了一种新的无监督广义数据亲和图 {1,23.4} 3837 4 256 的构造方法,该方法具有更强的鲁棒性和更有意 {0,2,4,6,7} 4960 J 256 义的数据亲和图,以提高谱聚类精度。采用模糊 10 256 理论定义数据相似度,利用模糊隶属度函数导出 {0,1,…,9} 9298 亲和图。此外,亲和图不是盲目地相信所有可用 从图1可以看出,在CE方面,所提算法在所 变量,而是通过捕捉和通过对每个样本的模糊描 有的情况下都优于STSC和SC,尤其在{0,8}、 述,确定了特征子空间中组合分布的微妙两两相 {0,5,8}、{3,5,8}、{0,2,4,6,7}、{0,1,…,9}数据集上 似关系。同时采用共享近邻的方法发现密集区域 CE均改善了5%以上,甚至在{3,5,8}上CE相较 样本点分布的结构和密度信息,并且根据每个点 于其他对比算法,所提算法改进了10%以上。总 所处领域的稠密程度自动调节参数σ,从而生成 体而言与SC和STSC相比,可以从图1中看出所 更强大的亲和矩阵,进一步提高聚类准确率,证 提出的方法均得到明显的改善。 明了该方法对不同类型数据集的有效性。实验结 50r✉SC 果表明,该方法与其他先进的方法相比具有一定 STSC 40AFSSNNSC 的优越性。数据大小的多样性在一定程度上体现 了该方法对于大数据集的可扩展性。在未来将通 30 过系统地将所提出的算法与一些采样或量化策略 20 相结合来处理一般的可伸缩性问题。 10 参考文献: 2 0,24,6,7 .9 [1]XU Dongkuan,TIAN Yingjie.A comprehensive survey of 0,1 clustering algorithms[J].Annals of data science,2015, 2(2:165-193. 图1USPS数据集上CE的性能比较 [2]LIU Hanqiang,ZHAO Feng,JIAO Licheng.Fuzzy spec- Fig.1 Performance comparison of CE on the USPS data- tral clustering with robust spatial information for image sets segmentation[J].Applied soft computing,2012,12(11): 图2显示了基于NMI的USPS数据集的结 3636-3647. 果。从图2中可以看出,所提出的方法在所有情 [3]TUNG F,WONG A,CLAUSI D A.Enabling scalable 况下都比SC和STSC有优势。在{0,8}、 spectral clustering for image segmentation[J].Pattern re- {1,2,3,4}、{0,1,…,9}上相较于其他对比算法,所提 c0 gnition,2010,43(12:4069-4076. 算法的NM都提高了10%以上,特别是对于具有 [4]ZENG Shan,HUANG Rui,KANG Zhen,et al.Image seg- mentation using spectral clustering of Gaussian mixture 挑战性的情况{3,5,8}和多类情况{1,2,3,4}、 models[J].Neurocomputing,2014,144:346-356. {0,2,4,6,7}、{0,1,…,9},所提出的算法都具有一定 [5]JIANG J Q,DRESS A W M,YANG Genke.A spectral 的优越性。 clustering-based framework for detecting community struc-实例和 2 007 个测试实例 (总共 9 298 个)。为了展 示该方法的可伸缩性,考虑了不同数量的集群。 具体来说,数字子集{0,8}、{4,9}、{0,5,8}、{3,5,8}、 {1,2,3,4}、{0,2,4,6,7}和整个集合{0,1,···,9}用于测 试本文提出的算法。这些子集的详细信息如表 4 所示。分别在每个子集上进行实验,并使 用 CE 和 NMI 来测量性能。 表 4 USPS 实验数据集的特性 Table 4 Characteristics of the USPS experimental datasets 数据集 数据总数 类数 维数 {0,8} 2 261 2 256 {4,9} 1 673 2 256 {0,5,8} 2 977 3 256 {3,5,8} 2 248 3 256 {1,2,3,4} 3 837 4 256 {0,2,4,6,7} 4 960 5 256 {0,1,···,9} 9 298 10 256 从图 1 可以看出,在 CE 方面,所提算法在所 有的情况下都优于 STSC 和 SC,尤其在{0,8}、 {0,5,8}、{3,5,8}、{0,2,4,6,7}、{0,1,···,9}数据集上 CE 均改善了 5% 以上,甚至在{3,5,8}上 CE 相较 于其他对比算法,所提算法改进了 10% 以上。总 体而言与 SC 和 STSC 相比,可以从图 1 中看出所 提出的方法均得到明显的改善。 CE/% 0 10 20 30 40 {0,8} {4,9} {0,5,8} {3,5,8} {1,2,3,4} {0,2,4,6,7} {0,1,···,9} 50 SC STSC AFSSNNSC 图 1 USPS 数据集上 CE 的性能比较 Fig. 1 Performance comparison of CE on the USPS data￾sets 图 2 显示了基于 NMI 的 USPS 数据集的结 果。从图 2 中可以看出,所提出的方法在所有情 况下都 比 S C 和 STS C 有优势。在 {0,8} 、 {1,2,3,4}、{0,1,···,9}上相较于其他对比算法,所提 算法的 NMI 都提高了 10% 以上,特别是对于具有 挑战性的情况 {3,5,8}和多类情况 {1,2,3,4}、 {0,2,4,6,7}、{0,1,···,9},所提出的算法都具有一定 的优越性。 NMI/% 0 20 40 60 80 100 SC STSC AFSSNNSC {0,8} {4,9} {0,5,8} {3,5,8} {1,2,3,4} {0,2,4,6,7} {0,1,···,9} 图 2 USPS 数据集上 NMI 的性能比较 Fig. 2 Performance comparison of NMI on the USPS data￾sets 4 结束语 σ 本文提出了一种新的无监督广义数据亲和图 的构造方法,该方法具有更强的鲁棒性和更有意 义的数据亲和图,以提高谱聚类精度。采用模糊 理论定义数据相似度,利用模糊隶属度函数导出 亲和图。此外,亲和图不是盲目地相信所有可用 变量,而是通过捕捉和通过对每个样本的模糊描 述,确定了特征子空间中组合分布的微妙两两相 似关系。同时采用共享近邻的方法发现密集区域 样本点分布的结构和密度信息,并且根据每个点 所处领域的稠密程度自动调节参数 ,从而生成 更强大的亲和矩阵,进一步提高聚类准确率,证 明了该方法对不同类型数据集的有效性。实验结 果表明,该方法与其他先进的方法相比具有一定 的优越性。数据大小的多样性在一定程度上体现 了该方法对于大数据集的可扩展性。在未来将通 过系统地将所提出的算法与一些采样或量化策略 相结合来处理一般的可伸缩性问题。 参考文献: XU Dongkuan, TIAN Yingjie. A comprehensive survey of clustering algorithms[J]. Annals of data science, 2015, 2(2): 165–193. [1] LIU Hanqiang, ZHAO Feng, JIAO Licheng. Fuzzy spec￾tral clustering with robust spatial information for image segmentation[J]. Applied soft computing, 2012, 12(11): 3636–3647. [2] TUNG F, WONG A, CLAUSI D A. Enabling scalable spectral clustering for image segmentation[J]. Pattern re￾cognition, 2010, 43(12): 4069–4076. [3] ZENG Shan, HUANG Rui, KANG Zhen, et al. Image seg￾mentation using spectral clustering of Gaussian mixture models[J]. Neurocomputing, 2014, 144: 346–356. [4] JIANG J Q, DRESS A W M, YANG Genke. A spectral clustering-based framework for detecting community struc- [5] 第 5 期 储德润,等:公理化模糊共享近邻自适应谱聚类算法 ·903·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有