在用户发的带有文本和图片的微博数据中，我们可以发现，本文所提出的基于语义

正在加载图片...

·750 智能系统学报第12卷在用户发的带有文本和图片的微博数据中，我息、地理位置信息等。如何有效地利用这些因素提们可以发现，本文所提出的基于语义特征的多视图高情感分类精度有待进一步的研究。微博情感分类方法的效果明显优于只考虑纯文本的情况。例如，微博“我希望躺在向日葵上，即使沮参考文献：丧，也能朝着阳光”，其配图如图3所示。若使用纯 [1]LIU B.Sentiment analysis and opinion mining[J].Synthesis 文本将其分类得到的是负面的，而若采用本文提出 lectures on human language technologies,2012,5(1): 的多视图语义特征方法将其分类得到的为正面情 1-167. 感。再如，微博“一个人不会，也不可能，将祂的全 [2]PANG T B,PANG B,LEE L.Thumbs up?Sentiment 部呈现给你。你所看到的永远是祂的局部，而局部 classification using machine learning J].Proceedings of EMNLP,2002:79-86. 永远是美好的。”其配图如图4所示。若仅使用纯 [3]TACKSTROM O,MCDONALD R.Semi-supervised latent 文本分类则分类结果为正面情感。采用本文提出 variable models for sentence-level sentiment analysis[C]// 的方法，则得到的是负面情感，而负面情感更加符 The 49th Annual Meeting of the Association for 合事实的判断。进而说明了本文方法的有效性。 Computational Linguistics.Stroudsburg,USA,2011: 569-574. [4]QIU G,LIU B,BU J,et al.Opinion word expansion and target extraction through double propagation[]]. Computational linguistics,2011,37(1):9-27. [5]WU Y.ZAHNG Q.HUANG X,et al.Phrase Dependency Parsing for Opinion Mining[C]//Proceedings of the 2009 Conference on Empirical Methods in Natural Language 图3示例1配图 Processing.Stroudsburg,USA,2009:1533-1541. Fig.3 Image in case 1 [6]LIU Y,HUANG X,AN A,et al.ARSA:a sentiment- aware model for predicting sales performance using blogs [C]//International ACM SIGIR Conference on Research and Development in Information Retrieval.New York,USA, 2007:607-614. [7]MISHNE G,GLANCE N S.Predicting movie sales from blogger sentiment [C]//National Conference on Artificial Intelligence.Menlo Park,USA,2006:155-158. [8]O'CONNOR B,BALASUBRAMANYAN R,ROUTLEDGE 图4示例2配图 B R,et al.From tweets to polls:linking text sentiment to Fig.4 Image in case 2 public opinion time series[C]//Proceedings of the Fourth International AAAI Conference on Weblogs and Social 4结束语 Media.Menlo Park,USA,2010:122-129. 9]CHIANG H C,MOSES R L,POTTER L C.Model-based 本文首先利用并行特征融合方式，将文本和图 Bayesian feature matching with application to synthetic 像合理地组合在一起，然后用潜在语义分析技术， aperture radar target recognition[J].Pattern recognition, 将文本和图像特征统一地映射到一个语义空间，最 2001,34(8)：1539-1553. 后使用多视图分类器SVM-2K进行分类。实验表 [10]MCCULLOUGH C L.Feature and data-level fusion of 明，基于本文多视图的语义特征方法的情感分类获 infrared and visual images[J].Proceedings of SPIE-the 得了比单纯的文本特征或者图像特征更好的效果。 international society for optical engineering,1999,3719: 312-318. 使用融合后的语义特征不管是文本特征做情感分 [11]YANG J,YANG J Y,ZHANG D,et al.Feature fusion: 类还是单从图像特征做情感分类，都比原来的分类 parallel strategy vs.serial strategy[J].Pattern 精度有所提高。但是在31小节数据预处理时难免 recognition,2003,36(6):1369-1381. 会剔除一些有用的信息，如表情、终端信息、转发信 [12]SALTON G,WONG A,YANG C S.A vector space model在用户发的带有文本和图片的微博数据中，我们可以发现，本文所提出的基于语义特征的多视图微博情感分类方法的效果明显优于只考虑纯文本的情况。例如，微博“我希望躺在向日葵上，即使沮丧，也能朝着阳光”，其配图如图３所示。若使用纯文本将其分类得到的是负面的，而若采用本文提出的多视图语义特征方法将其分类得到的为正面情感。再如，微博“一个人不会，也不可能，将祂的全部呈现给你。你所看到的永远是祂的局部，而局部永远是美好的。” 其配图如图４所示。若仅使用纯文本分类则分类结果为正面情感。采用本文提出的方法，则得到的是负面情感，而负面情感更加符合事实的判断。进而说明了本文方法的有效性。图３示例１配图Ｆｉｇ．３Ｉｍａｇｅｉｎｃａｓｅ１图４示例２配图Ｆｉｇ．４Ｉｍａｇｅｉｎｃａｓｅ２４结束语本文首先利用并行特征融合方式，将文本和图像合理地组合在一起，然后用潜在语义分析技术，将文本和图像特征统一地映射到一个语义空间，最后使用多视图分类器ＳＶＭ⁃２Ｋ进行分类。实验表明，基于本文多视图的语义特征方法的情感分类获得了比单纯的文本特征或者图像特征更好的效果。使用融合后的语义特征不管是文本特征做情感分类还是单从图像特征做情感分类，都比原来的分类精度有所提高。但是在３．１小节数据预处理时难免会剔除一些有用的信息，如表情、终端信息、转发信息、地理位置信息等。如何有效地利用这些因素提高情感分类精度有待进一步的研究。参考文献：［１］ＬＩＵＢ．Ｓｅｎｔｉｍｅｎｔａｎａｌｙｓｉｓａｎｄｏｐｉｎｉｏｎｍｉｎｉｎｇ［Ｊ］．Ｓｙｎｔｈｅｓｉｓｌｅｃｔｕｒｅｓｏｎｈｕｍａｎｌａｎｇｕａｇｅｔｅｃｈｎｏｌｏｇｉｅｓ，２０１２，５（１）：１－１６７．［２］ＰＡＮＧＴＢ，ＰＡＮＧＢ，ＬＥＥＬ．Ｔｈｕｍｂｓｕｐ？Ｓｅｎｔｉｍｅｎｔｃｌａｓｓｉｆｉｃａｔｉｏｎｕｓｉｎｇｍａｃｈｉｎｅｌｅａｒｎｉｎｇ［Ｊ］．ＰｒｏｃｅｅｄｉｎｇｓｏｆＥＭＮＬＰ，２００２：７９－８６．［３］ＴÄＣＫＳＴＲÖＭＯ，ＭＣＤＯＮＡＬＤＲ．Ｓｅｍｉ⁃ｓｕｐｅｒｖｉｓｅｄｌａｔｅｎｔｖａｒｉａｂｌｅｍｏｄｅｌｓｆｏｒｓｅｎｔｅｎｃｅ⁃ｌｅｖｅｌｓｅｎｔｉｍｅｎｔａｎａｌｙｓｉｓ［Ｃ］／／Ｔｈｅ４９ｔｈＡｎｎｕａｌＭｅｅｔｉｎｇｏｆｔｈｅＡｓｓｏｃｉａｔｉｏｎｆｏｒＣｏｍｐｕｔａｔｉｏｎａｌＬｉｎｇｕｉｓｔｉｃｓ．Ｓｔｒｏｕｄｓｂｕｒｇ，ＵＳＡ，２０１１：５６９－５７４．［４］ＱＩＵＧ，ＬＩＵＢ，ＢＵＪ，ｅｔａｌ．Ｏｐｉｎｉｏｎｗｏｒｄｅｘｐａｎｓｉｏｎａｎｄｔａｒｇｅｔｅｘｔｒａｃｔｉｏｎｔｈｒｏｕｇｈｄｏｕｂｌｅｐｒｏｐａｇａｔｉｏｎ［Ｊ］．Ｃｏｍｐｕｔａｔｉｏｎａｌｌｉｎｇｕｉｓｔｉｃｓ，２０１１，３７（１）：９－２７．［５］ＷＵＹ，ＺＡＨＮＧＱ，ＨＵＡＮＧＸ，ｅｔａｌ．ＰｈｒａｓｅＤｅｐｅｎｄｅｎｃｙＰａｒｓｉｎｇｆｏｒＯｐｉｎｉｏｎＭｉｎｉｎｇ［Ｃ］／／Ｐｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅ２００９ＣｏｎｆｅｒｅｎｃｅｏｎＥｍｐｉｒｉｃａｌＭｅｔｈｏｄｓｉｎＮａｔｕｒａｌＬａｎｇｕａｇｅＰｒｏｃｅｓｓｉｎｇ．Ｓｔｒｏｕｄｓｂｕｒｇ，ＵＳＡ，２００９：１５３３－１５４１．［６］ＬＩＵＹ，ＨＵＡＮＧＸ，ＡＮＡ，ｅｔａｌ．ＡＲＳＡ：ａｓｅｎｔｉｍｅｎｔ－ａｗａｒｅｍｏｄｅｌｆｏｒｐｒｅｄｉｃｔｉｎｇｓａｌｅｓｐｅｒｆｏｒｍａｎｃｅｕｓｉｎｇｂｌｏｇｓ［Ｃ］／／ＩｎｔｅｒｎａｔｉｏｎａｌＡＣＭＳＩＧＩＲＣｏｎｆｅｒｅｎｃｅｏｎＲｅｓｅａｒｃｈａｎｄＤｅｖｅｌｏｐｍｅｎｔｉｎＩｎｆｏｒｍａｔｉｏｎＲｅｔｒｉｅｖａｌ．ＮｅｗＹｏｒｋ，ＵＳＡ，２００７：６０７－６１４．［７］ＭＩＳＨＮＥＧ，ＧＬＡＮＣＥＮＳ．Ｐｒｅｄｉｃｔｉｎｇｍｏｖｉｅｓａｌｅｓｆｒｏｍｂｌｏｇｇｅｒｓｅｎｔｉｍｅｎｔ［Ｃ］／／ＮａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ．ＭｅｎｌｏＰａｒｋ，ＵＳＡ，２００６：１５５－１５８．［８］Ｏ􀆳ＣＯＮＮＯＲＢ，ＢＡＬＡＳＵＢＲＡＭＡＮＹＡＮＲ，ＲＯＵＴＬＥＤＧＥＢＲ，ｅｔａｌ．Ｆｒｏｍｔｗｅｅｔｓｔｏｐｏｌｌｓ：ｌｉｎｋｉｎｇｔｅｘｔｓｅｎｔｉｍｅｎｔｔｏｐｕｂｌｉｃｏｐｉｎｉｏｎｔｉｍｅｓｅｒｉｅｓ［Ｃ］／／ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＦｏｕｒｔｈＩｎｔｅｒｎａｔｉｏｎａｌＡＡＡＩＣｏｎｆｅｒｅｎｃｅｏｎＷｅｂｌｏｇｓａｎｄＳｏｃｉａｌＭｅｄｉａ．ＭｅｎｌｏＰａｒｋ，ＵＳＡ，２０１０：１２２－１２９．［９］ＣＨＩＡＮＧＨＣ，ＭＯＳＥＳＲＬ，ＰＯＴＴＥＲＬＣ．Ｍｏｄｅｌ－ｂａｓｅｄＢａｙｅｓｉａｎｆｅａｔｕｒｅｍａｔｃｈｉｎｇｗｉｔｈａｐｐｌｉｃａｔｉｏｎｔｏｓｙｎｔｈｅｔｉｃａｐｅｒｔｕｒｅｒａｄａｒｔａｒｇｅｔｒｅｃｏｇｎｉｔｉｏｎ［Ｊ］．Ｐａｔｔｅｒｎｒｅｃｏｇｎｉｔｉｏｎ，２００１，３４（８）：１５３９－１５５３．［１０］ＭＣＣＵＬＬＯＵＧＨＣＬ．Ｆｅａｔｕｒｅａｎｄｄａｔａ⁃ｌｅｖｅｌｆｕｓｉｏｎｏｆｉｎｆｒａｒｅｄａｎｄｖｉｓｕａｌｉｍａｇｅｓ［Ｊ］．ＰｒｏｃｅｅｄｉｎｇｓｏｆＳＰＩＥ⁃ｔｈｅｉｎｔｅｒｎａｔｉｏｎａｌｓｏｃｉｅｔｙｆｏｒｏｐｔｉｃａｌｅｎｇｉｎｅｅｒｉｎｇ，１９９９，３７１９：３１２－３１８．［１１］ＹＡＮＧＪ，ＹＡＮＧＪＹ，ＺＨＡＮＧＤ，ｅｔａｌ．Ｆｅａｔｕｒｅｆｕｓｉｏｎ：ｐａｒａｌｌｅｌｓｔｒａｔｅｇｙｖｓ．ｓｅｒｉａｌｓｔｒａｔｅｇｙ［Ｊ］．Ｐａｔｔｅｒｎｒｅｃｏｇｎｉｔｉｏｎ，２００３，３６（６）：１３６９－１３８１．［１２］ＳＡＬＴＯＮＧ，ＷＯＮＧＡ，ＹＡＮＧＣＳ．Ａｖｅｃｔｏｒｓｐａｃｅｍｏｄｅｌ ·７５０· 智能系统学报第１２卷

<<向上翻页向下翻页>>

点击下载：【自然语言处理与理解】基于语义特征的多视图情感分类方法