正在加载图片...
第9卷第1期 智能系统学报 Vol.9 No.I 2014年2月 CAAI Transactions on Intelligent Systems Feb.2014 D0:10.3969/j.issn.1673-4785.201208020 网络出版地址:http:/www.cmki.net/kcms/doi/10.3969/j.issn.1673-4785.201208020.html 语义规则在微博热点话题情感分析中的应用 赵文清,侯小可,沙海虹2 (1.华北电力大学(保定)控制与计算机工程学院,河北保定071003:2.英业达集团(北京)电子技术有限公司开发 部,北京100086) 摘要:近来,针对微博热点话题的情感分析研究得到了广泛关注,而基于监督的学习方法在分析文本时会忽视词 语的上下文联系。根据中文微博的特点,提出了一种基于语义规则的方法对微博热点话题进行情感分析。该方法 首先需要人工整理出程度副词表、否定词表和微博中默认表情符号的褒贬分类。然后在情感词语计算的基础上,考 虑上下文中否定词和程度词对修饰情感词语的情感倾向和情感强度的影响,同时也设定规则计算表情符号对一条 微博的情感倾向判断的作用。最后与基于情感词典的方法做实验对比,实验结果表明该方法在文本情感倾向性识 别的准确率上有了一定提高。 关键词:微博:热点话题:情感分析:语义规则:情感词典 中图分类号:TP391.1文献标志码:A文章编号:1673-4785(2014)01-0121-05 中文引用格式:赵文清,侯小可,沙海虹.语义规则在微博热点话题情感分析中的应用[J].智能系统学报,2014,9(1):121-125. 英文引用格式:ZHAO Wenqing,.HOU Xiaoke,SHA Haihong.Application of semantic rules to sentiment analysis of microblog hot topics[J].CAAI Transactions on Intelligent Systems,2014,9(1):121-125. Application of semantic rules to sentiment analysis of microblog hot topics ZHAO Wenqing',HOU Xiaoke',SHA Haihong? (1.School of Control and Computer Engineering,North China Electric Power University Baoding),Baoding 071003,China;2.In- ventec Beijing)Electronics Technology Co.,Ltd.,Beijing 100086,China) Abstract:The research on the sentiment analysis for microblog hot topics has attracted much attention recently, while the studying method on the basis of supervision neglects the context of a word in the analysis of text.Accord- ing to the characteristics of Chinese microblogs,a method based on semantic rules is proposed for sentiment analy- sis of microblog hot topics.As for the method,firstly,we need to manually sort out a degree adverb list,a negative word list and the appraisal category of the expression symbols defaulted in a microblog.Secondly,on the basis of the calculation of sentiment words,we consider the impact of negative words and degree words in the context of the emotional tendency and strength decorating sentiment words;in addition,we also set rules for calculating the influ- ence of the expression symbol on the sentiment tendency judgment of a piece of microblog.Finally,our proposed method is compared with the method based on the emotional dictionary.The experimental results show that the pro- posed method improves the identification accuracy of the text sentiment tendency. Keywords:microblog;hot topics;sentiment analysis;semantic rules;emotional dictionary 随着微博的飞速发展,微博作为一种通过关注 已达到2.5亿人次,占我国网民总数的48.7%,比 机制分享简短实时信息的广播式社交网络平台,吸 2010年增加了296%。微博改变了公众信息获取的 引了越来越多的网民参与。从2011年12月底中国 方式,是一种能够观察和了解正在发生什么的实时 互联网中心显示的报告可知,我国拥有微博的人数 民意调查系统。中国的微博已由一种单纯的社交工 具,变成奥论监督的利器,便于决策者做出决策。 收稿日期:2012-08-14.网络出版日期:2014-02-20. 目前关于微博情感分析的研究主要集中在英文 基金项目:国家自然科学基金资助项目(70671039):中央高校基本科 研业务费专项资金资助项目(12MS121). 微博方面,而面向中文微博的情感分析研究还在起 通信作者:侯小可.E-mail:houxiaoke.2008@163.com. 步阶段。情感分析的主流方法依然是基于监督学习第 9 卷第 1 期 智 能 系 统 学 报 Vol.9 №.1 2014 年 2 月 CAAI Transactions on Intelligent Systems Feb. 2014 DOI:10.3969 / j.issn.1673⁃4785.201208020 网络出版地址:http: / / www.cnki.net / kcms/ doi / 10.3969 / j.issn.1673⁃4785.201208020.html 语义规则在微博热点话题情感分析中的应用 赵文清1 ,侯小可1 ,沙海虹2 (1. 华北电力大学(保定) 控制与计算机工程学院,河北 保定 071003; 2. 英业达集团(北京)电子技术有限公司 开发 部,北京 100086) 摘 要:近来,针对微博热点话题的情感分析研究得到了广泛关注,而基于监督的学习方法在分析文本时会忽视词 语的上下文联系。 根据中文微博的特点,提出了一种基于语义规则的方法对微博热点话题进行情感分析。 该方法 首先需要人工整理出程度副词表、否定词表和微博中默认表情符号的褒贬分类。 然后在情感词语计算的基础上,考 虑上下文中否定词和程度词对修饰情感词语的情感倾向和情感强度的影响,同时也设定规则计算表情符号对一条 微博的情感倾向判断的作用。 最后与基于情感词典的方法做实验对比,实验结果表明该方法在文本情感倾向性识 别的准确率上有了一定提高。 关键词:微博;热点话题;情感分析;语义规则;情感词典 中图分类号:TP391.1 文献标志码:A 文章编号:1673⁃4785(2014)01⁃0121⁃05 中文引用格式:赵文清,侯小可,沙海虹.语义规则在微博热点话题情感分析中的应用[J]. 智能系统学报, 2014, 9(1): 121⁃125. 英文引用格式:ZHAO Wenqing, HOU Xiaoke, SHA Haihong. Application of semantic rules to sentiment analysis of microblog hot topics[J]. CAAI Transactions on Intelligent Systems, 2014, 9(1): 121⁃125. Application of semantic rules to sentiment analysis of microblog hot topics ZHAO Wenqing 1 , HOU Xiaoke 1 , SHA Haihong 2 (1. School of Control and Computer Engineering, North China Electric Power University (Baoding), Baoding 071003, China; 2. In⁃ ventec (Beijing) Electronics Technology Co., Ltd., Beijing 100086, China) Abstract:The research on the sentiment analysis for microblog hot topics has attracted much attention recently, while the studying method on the basis of supervision neglects the context of a word in the analysis of text. Accord⁃ ing to the characteristics of Chinese microblogs, a method based on semantic rules is proposed for sentiment analy⁃ sis of microblog hot topics. As for the method, firstly, we need to manually sort out a degree adverb list, a negative word list and the appraisal category of the expression symbols defaulted in a microblog. Secondly, on the basis of the calculation of sentiment words, we consider the impact of negative words and degree words in the context of the emotional tendency and strength decorating sentiment words; in addition, we also set rules for calculating the influ⁃ ence of the expression symbol on the sentiment tendency judgment of a piece of microblog. Finally, our proposed method is compared with the method based on the emotional dictionary. The experimental results show that the pro⁃ posed method improves the identification accuracy of the text sentiment tendency. Keywords:microblog; hot topics; sentiment analysis; semantic rules; emotional dictionary 收稿日期:2012⁃08⁃14. 网络出版日期:2014⁃02⁃20. 基金项目:国家自然科学基金资助项目(70671039);中央高校基本科 研业务费专项资金资助项目(12MS121). 通信作者:侯小可. E⁃mail:houxiaoke2008@ 163.com. 随着微博的飞速发展,微博作为一种通过关注 机制分享简短实时信息的广播式社交网络平台,吸 引了越来越多的网民参与。 从 2011 年 12 月底中国 互联网中心显示的报告可知,我国拥有微博的人数 已达到 2. 5 亿人次,占我国网民总数的 48. 7%,比 2010 年增加了 296%。 微博改变了公众信息获取的 方式,是一种能够观察和了解正在发生什么的实时 民意调查系统。 中国的微博已由一种单纯的社交工 具,变成舆论监督的利器,便于决策者做出决策。 目前关于微博情感分析的研究主要集中在英文 微博方面,而面向中文微博的情感分析研究还在起 步阶段。 情感分析的主流方法依然是基于监督学习
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有