正在加载图片...
·804· 智能系统学报 第12卷 表4数据集1算法结果(NMI) Table 4 Result of algorithms on data set 1 (NMI) 模型 LDA Kmeans++ GNMF TNMF GSDMM BTM 0.3617 0.2058 0.2739 0.4173 0.4413 0.4799 Title (0.0009) (±0.0028) (±0.0002) (±0.0090) (0.0086) (±0.0124) 0.4010 0.2247 0.5670 0.4637 0.4400 0.4675 Co-query enhancement (±0.0103) (0) (0.0059) (±0.0010) (±0.0068) (±0.0122) 0.4679 0.2778 0.6082 0.3809 0.4724 0.4668 Co-click enhancement (±0.0016) (0) (0) (±0.0080) (±0.0019) (±0.0017) 0.4203 0.2422 0.6745 0.5038 0.4025 0.4646 All enhancement (±0.0057 (0) (0) (0.0005) (±0.0023) (±0.0043) 表5数据集2算法结果(ACC) Table 5 Result of algorithms on data set 2(ACC) 模型 LDA Kmeans++ GNMF TNMF GSDMM BTM 0.3895 0.2979 0.3053 0.3460 0.4925 0.5127 Title (±0.0009) (±0.0004) (±0.0001) (±0.0009) (±0.0012) (±0.0005) 0.4383 0.3301 0.4291 0.3662 0.4204 0.4782 Co-query enhancement (0.0011) (±0.0007) (0.0002) (±0.0024) (±0.0022) (±0.0002) 0.4646 0.3758 0.4172 0.3285 0.4614 0.4654 Co-click enhancement (±0.0008) (±0.0007) (±0.0006) (±0.0014) (±0.0019) (±0.0001) 0.4517 0.3582 0.4389 0.3739 0.4182 0.4593 All enhancement (±0.0006) (±0.0004) (±0.0008) (±0.0012) (±0.0015) (±0.0005) 表6数据集2算法结果(NMI) Table 6 Result of algorithms on data set 2(NMI) 模型 LDA Kmeans++ GNMF TNMF GSDMM BTM 0.2598 0.1719 0.1948 0.2173 0.3670 0.3629 Title (±0.0002) (±0.0005) (±0.0001) (0.0004) (±0.0003) (±0.0001) 0.2987 0.2345 0.2659 0.2208 0.3098 0.3533 Co-query enhancement (±0.0003) (±0.0003) (0.0001) (±0.0007) (±0.0005) (±0.0006) 0.3725 0.3088 0.3148 0.1764 0.3985 0.3936 Co-click enhancement (0.0002) (±0.0005) (0.0001) (±0.0006) (±0.0008) (±0.0002) 0.3468 0.2697 0.3129 0.2538 0.3321 0.3691 All enhancement (±0.0003) (±0.0001) (0.0003) (±0.0005) (±0.0005) (±0.0002) 4结束语 型上效果欠佳,将在今后工作中进一步研究以提高 改进。同时本文局限在利用文本信息扩展进行视频 随着网络信息的爆炸式增长,文本聚类算法在 表示,在之后的研究工作中考虑将共点击视频的网 很多数据挖掘工作中都发挥着越来越重要的作用, 络结构和视频内容相结合,展开更深层次的研究。 比如话题发现、个性化推荐、有效检索等。本文提 参考文献: 出了利用网络视频的多源数据构建文本扩展模型, 从视频标题、共点击视频、相关查询词等多角度进 [1]WU X,ZHAO WL,NGO C W.Towards google challenge: 行补充表示,最后应用文本聚类算法在对文本进行 combining contextual and social information for web video categorization[C]//International Conference on Multimedia 划分的同时实现网络视频的聚类。在两个数据集上 2009.Vancouver,Canada,2009:1109-1110. 的多个实验验证了本文方法的有效性,进一步印证 [2]YANG L,LIU J,YANG X,et al.Multi-modality web video 了利用外部信息进行扩展可以一定程度地提高网络 categorization[C]//ACM Sigmm International Workshop on 视频聚类性能。但短文本聚类方法在本文提出的模 Multimedia Information Retrieval.Augsburg,Germany,4 结束语 随着网络信息的爆炸式增长,文本聚类算法在 很多数据挖掘工作中都发挥着越来越重要的作用, 比如话题发现、个性化推荐、有效检索等。本文提 出了利用网络视频的多源数据构建文本扩展模型, 从视频标题、共点击视频、相关查询词等多角度进 行补充表示,最后应用文本聚类算法在对文本进行 划分的同时实现网络视频的聚类。在两个数据集上 的多个实验验证了本文方法的有效性,进一步印证 了利用外部信息进行扩展可以一定程度地提高网络 视频聚类性能。但短文本聚类方法在本文提出的模 型上效果欠佳,将在今后工作中进一步研究以提高 改进。同时本文局限在利用文本信息扩展进行视频 表示,在之后的研究工作中考虑将共点击视频的网 络结构和视频内容相结合,展开更深层次的研究。 参考文献: WU X, ZHAO W L, NGO C W. Towards google challenge: combining contextual and social information for web video categorization[C]//International Conference on Multimedia 2009. Vancouver, Canada, 2009: 1109–1110. [1] YANG L, LIU J, YANG X, et al. Multi-modality web video categorization[C]//ACM Sigmm International Workshop on Multimedia Information Retrieval. Augsburg, Germany, [2] 表 4 数据集 1 算法结果(NMI) Table 4 Result of algorithms on data set 1 (NMI) 模型 LDA Kmeans++ GNMF TNMF GSDMM BTM Title 0.361 7 0.205 8 0.273 9 0.417 3 0.441 3 0.479 9 (±0.000 9) (±0.002 8) (±0.000 2) (±0.009 0) (±0.008 6) (±0.012 4) Co-query enhancement 0.401 0 0.224 7 0.567 0 0.463 7 0.440 0 0.467 5 (±0.010 3) (0) (±0.005 9) (±0.001 0) (±0.006 8) (±0.012 2) Co-click enhancement 0.467 9 0.277 8 0.608 2 0.380 9 0.472 4 0.466 8 (±0.001 6) (0) (0) (±0.008 0) (±0.001 9) (±0.001 7) All enhancement 0.420 3 0.242 2 0.674 5 0.503 8 0.402 5 0.464 6 (±0.005 7) (0) (0) (±0.000 5) (±0.002 3) (±0.004 3) 表 5 数据集 2 算法结果(ACC) Table 5 Result of algorithms on data set 2 (ACC) 模型 LDA Kmeans++ GNMF TNMF GSDMM BTM Title 0.389 5 0.297 9 0.305 3 0.346 0 0.492 5 0.512 7 (±0.000 9) (±0.000 4) (±0.000 1) (±0.000 9) (±0.001 2) (±0.000 5) Co-query enhancement 0.438 3 0.330 1 0.429 1 0.366 2 0.420 4 0.478 2 (±0.001 1) (±0.000 7) (±0.000 2) (±0.002 4) (±0.002 2) (±0.000 2) Co-click enhancement 0.464 6 0.375 8 0.417 2 0.328 5 0.461 4 0.465 4 (±0.000 8) (±0.000 7) (±0.000 6) (±0.001 4) (±0.001 9) (±0.000 1) All enhancement 0.451 7 0.358 2 0.438 9 0.373 9 0.418 2 0.459 3 (±0.000 6) (±0.000 4) (±0.000 8) (±0.001 2) (±0.001 5) (±0.000 5) 表 6 数据集 2 算法结果(NMI) Table 6 Result of algorithms on data set 2 (NMI) 模型 LDA Kmeans++ GNMF TNMF GSDMM BTM Title 0.259 8 0.171 9 0.194 8 0.217 3 0.367 0 0.362 9 (±0.000 2) (±0.000 5) (±0.000 1) (±0.000 4) (±0.000 3) (±0.000 1) Co-query enhancement 0.298 7 0.234 5 0.265 9 0.220 8 0.309 8 0.353 3 (±0.000 3) (±0.000 3) (±0.000 1) (±0.000 7) (±0.000 5) (±0.000 6) Co-click enhancement 0.372 5 0.308 8 0.314 8 0.176 4 0.398 5 0.393 6 (±0.000 2) (±0.000 5) (±0.000 1) (±0.000 6) (±0.000 8) (±0.000 2) All enhancement 0.346 8 0.269 7 0.312 9 0.253 8 0.332 1 0.369 1 (±0.000 3) (±0.000 1) (±0.000 3) (±0.000 5) (±0.000 5) (±0.000 2) ·804· 智 能 系 统 学 报 第 12 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有