正在加载图片...
·430 智能系统学报 第11卷 表2不同数据集上聚类结果的比较 Table 2 The comparison of the clustering results among different datasets 数据集 顶点数 边数 原始社区个数 算法 聚类个数 未聚类节点数 Q 运行时间/ms BDSG 2 0.8205 93 CPM 3 22 0.1923 87 空手道 俱乐部 304 78 k-dense 2 22 0.2948 129 CPM+CE 3 3 0.4102 117 k-dense+CE 0.8205 165 BDSG 0 0.7735 149 CPM 4 34 0.4088 175 海豚 社交网络 159 k-dense 4 34 04088 568 CPM+CE 4 16 0.5911 202 k-dense+CE 16 0.5911 599 BDSG 12 0 0.6390 480 CPM 13 2 0.5951 920 大学生 115 613 k-dense 12 2 0.6370 足球网络 1860 CPM+CE 13 0 0.6010 1028 k-dense+CE 12 0 0.6480 1986 BDSG 28 34 0.7224 60797 CPM 55 562 0.2687 592410 电子 邮件网络 11335451 k-dense 6 558 0.2517 55240 CPM+CE 55 341 0.2897 601835 k-dense+CE 6 14 0.5034 63938 BDSG 134 657 0.7828 21273 CPM 159 843 0.5201 97161 合作网络 1589 2742 k-dense 91 843 0.7305 15352 CPM+CE 159 688 0.5675 120927 A-dense+CE 91 790 0.7631 23451 实验结果表明BDSG算法在这些网络数据上均 类性能。实验结果(见表2)表明CPM与k-dense算 具有较好的性能表现。BDSG算法在空手道俱乐部 法的聚类有效性均显著提高。在空手道俱乐部、海 和大学生足球网络上所得到社区个数与网络实际的 豚社交网络、电子邮件网络和合作网络中,在CPM 社区个数相同,而电子邮件网络和合作网络缺乏原 与k-dense算法运行时间略有增大的情况下,CE算 始社区个数信息,无法进行比较:海豚社交网络和大 法的加入使得其未聚类结点个数降幅较大,社区模 学生足球网络中,BDSG算法所用时间明显少于 块性具有较为明显的提高。同时CPM与k-dense算 CPM与k-dense算法:在电子邮件网络和合作网络 法在加入扩展策略CE之后与BDSG算法相比, 中,BDSG运行时间比k-dense算法慢,但最终未聚 BDSG算法在未聚类结点数以及社区模块性方面优 类结点数少于k-dense算法:在这些实验数据集上, 势依然较为明显。 本算法所产生的未聚类结点个数明显较少、社区模 综上所述,BDSG算法在空手道俱乐部、海豚社 块性较高。 交网络、大学生足球网络、电子邮件网络和合作网络 此外,本文给出的中心社区扩展算法也可应用 等数据集上,与CPM、k-dense算法相比运行时间较 于CPM、k-dense等算法以处理未聚类节点,提高聚 短、未聚类结点个数较少、社区模块性较高,具有良表 2 不同数据集上聚类结果的比较 Table 2 The comparison of the clustering results among different datasets 数据集 顶点数 边数 原始社区个数 算法 聚类个数 未聚类节点数 Q 运行时间/ ms 空手道 俱乐部 34 78 2 BDSG 2 1 0.820 5 93 CPM 3 22 0.192 3 87 k⁃dense 2 22 0.294 8 129 CPM+CE 3 3 0.410 2 117 k⁃dense+CE 2 1 0.820 5 165 海豚 社交网络 62 159 2 BDSG 4 0 0.773 5 149 CPM 4 34 0.408 8 175 k⁃dense 4 34 0408 8 568 CPM+CE 4 16 0.591 1 202 k⁃dense+CE 4 16 0.591 1 599 大学生 足球网络 115 613 12 BDSG 12 0 0.639 0 480 CPM 13 2 0.595 1 920 k⁃dense 12 2 0.637 0 1 860 CPM+CE 13 0 0.601 0 1 028 k⁃dense+CE 12 0 0.648 0 1 986 电子 邮件网络 1 133 5 451 — BDSG 28 34 0.722 4 60 797 CPM 55 562 0.268 7 592 410 k⁃dense 6 558 0.251 7 55 240 CPM+CE 55 341 0.289 7 601 835 k⁃dense+CE 6 14 0.503 4 63 938 合作网络 1 589 2 742 — BDSG 134 657 0.782 8 21 273 CPM 159 843 0.520 1 97 161 k⁃dense 91 843 0.730 5 15 352 CPM+CE 159 688 0.567 5 120 927 k⁃dense+CE 91 790 0.763 1 23 451 实验结果表明 BDSG 算法在这些网络数据上均 具有较好的性能表现。 BDSG 算法在空手道俱乐部 和大学生足球网络上所得到社区个数与网络实际的 社区个数相同,而电子邮件网络和合作网络缺乏原 始社区个数信息,无法进行比较;海豚社交网络和大 学生足球网络中,BDSG 算法所用时间明显少于 CPM 与 k⁃dense 算法;在电子邮件网络和合作网络 中,BDSG 运行时间比 k⁃dense 算法慢,但最终未聚 类结点数少于 k⁃dense 算法;在这些实验数据集上, 本算法所产生的未聚类结点个数明显较少、社区模 块性较高。 此外,本文给出的中心社区扩展算法也可应用 于 CPM、k⁃dense 等算法以处理未聚类节点,提高聚 类性能。 实验结果(见表 2)表明 CPM 与 k⁃dense 算 法的聚类有效性均显著提高。 在空手道俱乐部、海 豚社交网络、电子邮件网络和合作网络中,在 CPM 与 k⁃dense 算法运行时间略有增大的情况下,CE 算 法的加入使得其未聚类结点个数降幅较大,社区模 块性具有较为明显的提高。 同时 CPM 与 k⁃dense 算 法在加入扩展策略 CE 之后与 BDSG 算法相比, BDSG 算法在未聚类结点数以及社区模块性方面优 势依然较为明显。 综上所述,BDSG 算法在空手道俱乐部、海豚社 交网络、大学生足球网络、电子邮件网络和合作网络 等数据集上,与 CPM、k⁃dense 算法相比运行时间较 短、未聚类结点个数较少、社区模块性较高,具有良 ·430· 智 能 系 统 学 报 第 11 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有