正在加载图片...
第6期 谢娟英,等:聚类有效性评价新指标 ·879· 经典外部评价指标F-measure、Rand index、Jaccard 比较。图5给出了PS2指标的实验测试结果与其 系数和ARI指数进行比较,并将S2和PS2指标与 他指标的比较。S2与PS2的性能比较如图6所示, 聚类准确率独立比较。图4展示了S2指标在人工 图6同时展示了聚类准确率指标。图4和图5中 模拟数据集和真实数据集的测试结果与其他指标的 的R是Rand index的简写。 1.0 1.2 -R 0.9 1.0 -F measure 0 0 0.6 装0.6 04 0.5 0.2 0.4 +Jaccard 0 F measure 数据集 数据集 (a)人工模拟数据集 (b)UCI真实数据集 图4S2指标与其他指标的测试结果比较 Fig.4 The comparison of S2 with other criteria 1.2 PS2 一R -Jaccard 1.0 F_measure 0.8 0.8 0.7 0.6 装0.6 -PS2 架0.4 0.5 Accuracy -ARI 0.2 R 0.4 +-Jaccard 0 -F measure 数据集 数据集 (a)人工模拟数据集 (b)UCI真实数据集 图5PS2指标的测试结果与其他指标的比较 Fig.5 The comparison of PS2 with other criteria 1.00 1.0 0-S2 0.95 0.9 -PS2 0.90 Accuracy g085 竖0.80 装0.75 -S2 PS2 0.70 0.65 0.4 数据集 数据集 (a)人工模拟数据集 (b)UCI真实数据集 图6S2与PS2指标与聚类准确率比较 Fig.6 The comparison of S2 and PS2 and clustering accuracy 图4(a)人工模拟数据集的实验结果揭示,除了 数据集测试的指标值走势一致。因此.可以说提出 含有6个不平衡类簇的人工模拟数据集外,本文提 的S2指标可以有效评价存在类偏斜分布的聚类结 出的同时考虑正负类信息的聚类有效性评价指标 果。图4(b)所示的UCI机器学习数据库真实数据 S2与其他指标相比具有最高值,且与其他指标在各 集的实验测试结果显示,提出的外部评价指标经典外部评价指标 F-measure、Rand index、Jaccard 系数和 ARI 指数进行比较,并将 S2 和 PS2 指标与 聚类准确率独立比较。图 4 展示了 S2 指标在人工 模拟数据集和真实数据集的测试结果与其他指标的 比较。图 5 给出了 PS2 指标的实验测试结果与其 他指标的比较。S2 与 PS2 的性能比较如图 6 所示, 图 6 同时展示了聚类准确率指标。图 4 和图 5 中 的 R 是 Rand index 的简写。 图 4(a) 人工模拟数据集的实验结果揭示,除了 含有 6 个不平衡类簇的人工模拟数据集外,本文提 出的同时考虑正负类信息的聚类有效性评价指标 S2 与其他指标相比具有最高值,且与其他指标在各 数据集测试的指标值走势一致。因此,可以说提出 的 S2 指标可以有效评价存在类偏斜分布的聚类结 果。图 4(b) 所示的 UCI 机器学习数据库真实数据 集的实验测试结果显示,提出的外部评价指标 Ec2 Ec3 Ec4 Ec5 Ec6 UEc2 UEc3 UEc4 UEc5 UEc6 0.4 0.5 0.6 0.7 0.8 0.9 1.0 ᪜ᢚ䯲 ᠳᴳը S2 Accuracy ARI R Jaccard F_measure Iris Seeds Seg Soy wine wdbc Bupa pima Bal New Iono Haber 0 0.2 0.4 0.6 0.8 1.0 1.2 ᪜ᢚ䯲 ᠳᴳը S2 Accuracy ARI R Jaccard F_measure (a) Ϧ጑Ὅ᠋᪜ᢚ䯲 (b) UCI ⱋ჊᪜ᢚ䯲 图 4 S2 指标与其他指标的测试结果比较 Fig. 4 The comparison of S2 with other criteria 0.4 0.5 0.6 0.7 0.8 0.9 1.0 ᠳᴳը 0 0.2 0.4 0.6 0.8 1.0 1.2 ᠳᴳը PS2 Accuracy ARI R Jaccard F_measure PS2 Accuracy ARI R Jaccard F_measure Ec2 Ec3 Ec4 Ec5 Ec6 UEc2 UEc3 UEc4 UEc5 UEc6 ᪜ᢚ䯲 Iris Seeds Seg Soy wine wdbc Bupa pima Bal New Iono Haber ᪜ᢚ䯲 (a) Ϧ጑Ὅ᠋᪜ᢚ䯲 (b) UCI ⱋ჊᪜ᢚ䯲 图 5 PS2 指标的测试结果与其他指标的比较 Fig. 5 The comparison of PS2 with other criteria 0.65 0.70 0.75 0.80 0.85 0.90 0.95 1.00 ᠳᴳը S2 PS2 Accuracy 0.4 0.5 0.6 0.7 0.8 0.9 1.0 ᠳᴳը S2 PS2 Accuracy Ec2 Ec3 Ec4 Ec5 Ec6 UEc2 UEc3 UEc4 UEc5 UEc6 ᪜ᢚ䯲 Iris Seeds Seg Soy wine wdbc Bupa pima Bal New Iono Haber ᪜ᢚ䯲 (a) Ϧ጑Ὅ᠋᪜ᢚ䯲 (b) UCI ⱋ჊᪜ᢚ䯲 图 6 S2 与 PS2 指标与聚类准确率比较 Fig. 6 The comparison of S2 and PS2 and clustering accuracy 第 6 期 谢娟英,等:聚类有效性评价新指标 ·879·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有