正在加载图片...
·718 智能系统学报 第10卷 10 10 6 4 2 0 0 (a)K-means算法 (d)DSMC算法 图5对不同重叠程度的团状和环状数据集的分类结果比较 Fig.5 Comparison of classification results on different de- gree of overlap between group and cyclicdata sets 从图5的实验结果可以看出,对于团状数据集, K-means、Ncuts和DSMC(参数k和Q自上而下依次 取为6,200:6,160)算法都能够很好的处理重叠问 题,而DBSCAN算法(参数m和r自上而下依次取 为8,0.4:10,0.6)虽然对一般的团状数据集聚类效 果显著,但随着数据集重叠程度的逐渐增大,聚类效 2 0 果也开始变差。对于环状数据集,像K-means、.Ncuts 这种无法很好的聚类非凸数据集的算法,对于重叠 0 6 0 2 的环状数据集一样效果不好:而DBSCAN算法(参 数m和r自上而下依次取为15,0.4:10,0.5)对环状 (b)Ncuts算法 数据集的聚类类似于团状数据集,对重叠度较高的 数据集不能很好地聚类;本文提出的DSMC算法 (参数k和Q自上而下依次取为7,15:7,75)对于高 重叠度的环状数据集虽然没有得到完美的聚类结 果,但将内环与外环数据归为2类的结果基本令人 满意。相比其他3种聚类算法而言,DSMC算法对 重叠的鲁棒性较好。 3.3噪声点个数不同的人工数据集实验 随着数据源含有噪声现象的增多,算法对噪声 的处理效果也越来越受到人们的关注。为检验本文 0 提出的DSMC算法对含有噪声的数据集的聚类效 果,对逐渐增加噪声点的两类非凸数据集进行实验。 4 1 其中,第1个数据集含有400个数据点,第2个数据 (c)DBSCAN算法 集含有1000个数据点,自上而下对2个数据集分别 加入100、200、300个噪声点。 图6的实验结果说明,DSMC算法(参数k和Q(a)K⁃means 算法 (b)Ncuts 算法 (c)DBSCAN 算法 (d)DSMC 算法 图 5 对不同重叠程度的团状和环状数据集的分类结果比较 Fig.5 Comparison of classification results on different de⁃ gree of overlap between group and cyclicdata sets 从图 5 的实验结果可以看出,对于团状数据集, K⁃means、Ncuts 和 DSMC(参数 k 和 Q 自上而下依次 取为 6,200;6,160)算法都能够很好的处理重叠问 题,而 DBSCAN 算法(参数 m 和 r 自上而下依次取 为 8,0.4;10,0.6)虽然对一般的团状数据集聚类效 果显著,但随着数据集重叠程度的逐渐增大,聚类效 果也开始变差。 对于环状数据集,像 K⁃means、Ncuts 这种无法很好的聚类非凸数据集的算法,对于重叠 的环状数据集一样效果不好;而 DBSCAN 算法(参 数 m 和 r 自上而下依次取为 15,0.4;10,0.5)对环状 数据集的聚类类似于团状数据集,对重叠度较高的 数据集不能很好地聚类;本文提出的 DSMC 算法 (参数 k 和 Q 自上而下依次取为 7,15;7,75)对于高 重叠度的环状数据集虽然没有得到完美的聚类结 果,但将内环与外环数据归为 2 类的结果基本令人 满意。 相比其他 3 种聚类算法而言,DSMC 算法对 重叠的鲁棒性较好。 3.3 噪声点个数不同的人工数据集实验 随着数据源含有噪声现象的增多,算法对噪声 的处理效果也越来越受到人们的关注。 为检验本文 提出的 DSMC 算法对含有噪声的数据集的聚类效 果,对逐渐增加噪声点的两类非凸数据集进行实验。 其中,第 1 个数据集含有 400 个数据点,第 2 个数据 集含有1 000个数据点,自上而下对 2 个数据集分别 加入 100、200、300 个噪声点。 图 6 的实验结果说明,DSMC 算法(参数 k 和 Q ·718· 智 能 系 统 学 报 第 10 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有