正在加载图片...
·750 智能系统学报 第12卷 在用户发的带有文本和图片的微博数据中,我 息、地理位置信息等。如何有效地利用这些因素提 们可以发现,本文所提出的基于语义特征的多视图 高情感分类精度有待进一步的研究。 微博情感分类方法的效果明显优于只考虑纯文本 的情况。例如,微博“我希望躺在向日葵上,即使沮 参考文献: 丧,也能朝着阳光”,其配图如图3所示。若使用纯 [1]LIU B.Sentiment analysis and opinion mining[J].Synthesis 文本将其分类得到的是负面的,而若采用本文提出 lectures on human language technologies,2012,5(1): 的多视图语义特征方法将其分类得到的为正面情 1-167. 感。再如,微博“一个人不会,也不可能,将祂的全 [2]PANG T B,PANG B,LEE L.Thumbs up?Sentiment 部呈现给你。你所看到的永远是祂的局部,而局部 classification using machine learning J].Proceedings of EMNLP,2002:79-86. 永远是美好的。”其配图如图4所示。若仅使用纯 [3]TACKSTROM O,MCDONALD R.Semi-supervised latent 文本分类则分类结果为正面情感。采用本文提出 variable models for sentence-level sentiment analysis[C]// 的方法,则得到的是负面情感,而负面情感更加符 The 49th Annual Meeting of the Association for 合事实的判断。进而说明了本文方法的有效性。 Computational Linguistics.Stroudsburg,USA,2011: 569-574. [4]QIU G,LIU B,BU J,et al.Opinion word expansion and target extraction through double propagation[]]. Computational linguistics,2011,37(1):9-27. [5]WU Y.ZAHNG Q.HUANG X,et al.Phrase Dependency Parsing for Opinion Mining[C]//Proceedings of the 2009 Conference on Empirical Methods in Natural Language 图3示例1配图 Processing.Stroudsburg,USA,2009:1533-1541. Fig.3 Image in case 1 [6]LIU Y,HUANG X,AN A,et al.ARSA:a sentiment- aware model for predicting sales performance using blogs [C]//International ACM SIGIR Conference on Research and Development in Information Retrieval.New York,USA, 2007:607-614. [7]MISHNE G,GLANCE N S.Predicting movie sales from blogger sentiment [C]//National Conference on Artificial Intelligence.Menlo Park,USA,2006:155-158. [8]O'CONNOR B,BALASUBRAMANYAN R,ROUTLEDGE 图4示例2配图 B R,et al.From tweets to polls:linking text sentiment to Fig.4 Image in case 2 public opinion time series[C]//Proceedings of the Fourth International AAAI Conference on Weblogs and Social 4结束语 Media.Menlo Park,USA,2010:122-129. 9]CHIANG H C,MOSES R L,POTTER L C.Model-based 本文首先利用并行特征融合方式,将文本和图 Bayesian feature matching with application to synthetic 像合理地组合在一起,然后用潜在语义分析技术, aperture radar target recognition[J].Pattern recognition, 将文本和图像特征统一地映射到一个语义空间,最 2001,34(8):1539-1553. 后使用多视图分类器SVM-2K进行分类。实验表 [10]MCCULLOUGH C L.Feature and data-level fusion of 明,基于本文多视图的语义特征方法的情感分类获 infrared and visual images[J].Proceedings of SPIE-the 得了比单纯的文本特征或者图像特征更好的效果。 international society for optical engineering,1999,3719: 312-318. 使用融合后的语义特征不管是文本特征做情感分 [11]YANG J,YANG J Y,ZHANG D,et al.Feature fusion: 类还是单从图像特征做情感分类,都比原来的分类 parallel strategy vs.serial strategy[J].Pattern 精度有所提高。但是在31小节数据预处理时难免 recognition,2003,36(6):1369-1381. 会剔除一些有用的信息,如表情、终端信息、转发信 [12]SALTON G,WONG A,YANG C S.A vector space model在用户发的带有文本和图片的微博数据中,我 们可以发现,本文所提出的基于语义特征的多视图 微博情感分类方法的效果明显优于只考虑纯文本 的情况。 例如,微博“我希望躺在向日葵上,即使沮 丧,也能朝着阳光”,其配图如图 3 所示。 若使用纯 文本将其分类得到的是负面的,而若采用本文提出 的多视图语义特征方法将其分类得到的为正面情 感。 再如,微博“一个人不会,也不可能,将祂的全 部呈现给你。 你所看到的永远是祂的局部,而局部 永远是美好的。” 其配图如图 4 所示。 若仅使用纯 文本分类则分类结果为正面情感。 采用本文提出 的方法,则得到的是负面情感,而负面情感更加符 合事实的判断。 进而说明了本文方法的有效性。 图 3 示例 1 配图 Fig.3 Image in case 1 图 4 示例 2 配图 Fig.4 Image in case 2 4 结束语 本文首先利用并行特征融合方式,将文本和图 像合理地组合在一起,然后用潜在语义分析技术, 将文本和图像特征统一地映射到一个语义空间,最 后使用多视图分类器 SVM⁃2K 进行分类。 实验表 明,基于本文多视图的语义特征方法的情感分类获 得了比单纯的文本特征或者图像特征更好的效果。 使用融合后的语义特征不管是文本特征做情感分 类还是单从图像特征做情感分类,都比原来的分类 精度有所提高。 但是在 3.1 小节数据预处理时难免 会剔除一些有用的信息,如表情、终端信息、转发信 息、地理位置信息等。 如何有效地利用这些因素提 高情感分类精度有待进一步的研究。 参考文献: [1]LIU B. Sentiment analysis and opinion mining[J]. Synthesis lectures on human language technologies, 2012, 5 ( 1): 1-167. [2] PANG T B, PANG B, LEE L. Thumbs up? Sentiment classification using machine learning [ J ]. Proceedings of EMNLP, 2002: 79-86. [3] TÄCKSTRÖM O, MCDONALD R. Semi⁃supervised latent variable models for sentence⁃level sentiment analysis[C] / / The 49th Annual Meeting of the Association for Computational Linguistics. Stroudsburg, USA, 2011: 569-574. [4]QIU G, LIU B, BU J, et al. Opinion word expansion and target extraction through double propagation[J]. Computational linguistics, 2011, 37(1): 9-27. [5]WU Y, ZAHNG Q, HUANG X, et al. Phrase Dependency Parsing for Opinion Mining [ C] / / Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing. Stroudsburg, USA, 2009: 1533-1541. [6] LIU Y, HUANG X, AN A, et al. ARSA: a sentiment - aware model for predicting sales performance using blogs [C] / / International ACM SIGIR Conference on Research and Development in Information Retrieval. New York, USA, 2007: 607-614. [7] MISHNE G, GLANCE N S. Predicting movie sales from blogger sentiment [ C] / / National Conference on Artificial Intelligence. Menlo Park, USA, 2006: 155-158. [8] O􀆳CONNOR B, BALASUBRAMANYAN R, ROUTLEDGE B R, et al. From tweets to polls: linking text sentiment to public opinion time series[C] / / Proceedings of the Fourth International AAAI Conference on Weblogs and Social Media. Menlo Park, USA, 2010: 122-129. [9]CHIANG H C, MOSES R L, POTTER L C. Model-based Bayesian feature matching with application to synthetic aperture radar target recognition [ J]. Pattern recognition, 2001, 34(8): 1539-1553. [ 10 ] MCCULLOUGH C L. Feature and data⁃level fusion of infrared and visual images [ J]. Proceedings of SPIE⁃the international society for optical engineering, 1999, 3719: 312-318. [11]YANG J, YANG J Y, ZHANG D, et al. Feature fusion: parallel strategy vs. serial strategy[J]. Pattern recognition, 2003, 36(6): 1369-1381. [12]SALTON G, WONG A, YANG C S. A vector space model ·750· 智 能 系 统 学 报 第 12 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有