正在加载图片...
第12卷第5期 智能系统学报 Vol.12 No.5 2017年10月 CAAI Transactions on Intelligent Systems 0ct.2017 D0I:10.11992/tis.201312032 网络出版地址:http:/kns.cmki.net/kcms/detail/23.1538.TP.20171021.1342.002.html 一种基于OCC模型的文本情感挖掘方法 皇甫璐雯,毛文吉 (中国科学院自动化研究所复杂系统管理与控制国家重点实验室,北京100190) 摘要:观点挖掘(或情感分析)作为面向网络社会媒体分析挖掘领域的一个核心研究课题,具有重要的研究意义和 应用价值。针对传统观点挖掘方法存在的不足和局限性,本文设计并实现了一种基于OCC情感模型的观点挖掘方 法。该方法首先采用统计方法,利用WordNet词典、句法依存关系及少量标注数据,自动构建情感维度词典:其次,对 所构建的情感维度词典进行求精,通过语义、情感倾向的不一致性处理和非情感词的过滤,得到高质量的情感维度 词典:最后,基于所得到的情感维度词典,结合0CC模型中情感维度值与情感类型的对应关系,生成6种主要的情感 类型。实验方法表明,此方法在使用灵活性、可解释性和有效性上具有明显的优势。 关键词:观点挖掘;0CC情感模型:情感维度:情感类型:情感词典;认知心理学;情感挖掘;共现 中图分类号:TP391文献标志码:A文章编号:1673-4785(2017)05-0645-08 中文引用格式:皇甫璐雯,毛文吉.一种基于0CC模型的文本情感挖掘方法[J].智能系统学报,2017,12(5):645-652 英文引用格式:HUANGFU Luwen,MAO Wenji.OCC-model-based text-emotion mining method[J].CAAI transactions on intelligent systems,2017,12(5):645-652. OCC-model-based text-emotion mining method HUANGFU Luwen,MAO Wenji (State Key Laboratory of Management and Control for Complex Systems,Institute of Automation,Chinese Academy of Science,Beijing 100190,China) Abstract:Opinion mining,also called sentiment analysis,as one of the core research areas in the network-oriented social media analysis and mining domain,has important practical and research significance.Due to the weaknesses and limitations of traditional opinion mining methods,in this study,we designe and implemente an OCC emotion model-based opinion mining method for extracting emotion types from text.First,we adopte a statistical method to construct an emotion dictionary,based on candidate sets collected by the WordNet dictionary,as well as several syntactic dependent relationships and a small amount of annotated data.Next,we refine the constructed emotion- dimension dictionary to improve its quality by filtering out non-emotional words as well as emotional words that have conflicting syntactic or orientation.Lastly,we generate six main emotion types based on the obtained emotion- dimension dictionary combined with the corresponding relations between emotional dimensions and the different emotion types identified by the OCC model.Experimental results show that the proposed method has obvious advantages with respect to flexibility of usage,interpretability,and effectiveness. Keywords:opinion mining;OCC emotion model;emotional dimension;emotion types;emotion dictionary; cognitive psychology;emotion mining;co-occurrence 近年来,社会媒体迅猛发展并快速渗透到了社 值的信息,而且其数量随时间累积呈指数级增长。 会、经济、政治、文化等各方面,互联网用户产生的 这些信息主要是用户的主观性观点,与客观的事实 内容中包含大量关于用户意见、态度、情绪等有价 有很大的不同。这些包含用户观点的海量数据蕴 含着巨大的实际应用价值,亟需自动化的计算分析 收稿日期:2013-12-17.网络出版日期:2017-10-21. 与处理技术,这种现象促进了观点挖掘与情感分析 基金项目:国家自然科学基金项目(61175040,71025001). 通信作者:毛文吉.E-mail:wenji.mao@ia.ac.cn 这一新兴研究领域的蓬勃发展。目前,观点挖掘第 12 卷第 5 期 智 能 系 统 学 报 Vol.12 №.5 2017 年 10 月 CAAI Transactions on Intelligent Systems Oct. 2017 DOI:10.11992 / tis.201312032 网络出版地址:http: / / kns.cnki.net / kcms/ detail / 23.1538.TP.20171021.1342.002.html 一种基于 OCC 模型的文本情感挖掘方法 皇甫璐雯,毛文吉 (中国科学院自动化研究所 复杂系统管理与控制国家重点实验室,北京 100190) 摘 要:观点挖掘(或情感分析)作为面向网络社会媒体分析挖掘领域的一个核心研究课题,具有重要的研究意义和 应用价值。 针对传统观点挖掘方法存在的不足和局限性,本文设计并实现了一种基于 OCC 情感模型的观点挖掘方 法。 该方法首先采用统计方法,利用 WordNet 词典、句法依存关系及少量标注数据,自动构建情感维度词典;其次,对 所构建的情感维度词典进行求精,通过语义、情感倾向的不一致性处理和非情感词的过滤,得到高质量的情感维度 词典;最后,基于所得到的情感维度词典,结合 OCC 模型中情感维度值与情感类型的对应关系,生成 6 种主要的情感 类型。 实验方法表明,此方法在使用灵活性、可解释性和有效性上具有明显的优势。 关键词:观点挖掘;OCC 情感模型;情感维度;情感类型;情感词典;认知心理学;情感挖掘;共现 中图分类号:TP391 文献标志码:A 文章编号:1673-4785(2017)05-0645-08 中文引用格式:皇甫璐雯,毛文吉.一种基于 OCC 模型的文本情感挖掘方法[J]. 智能系统学报, 2017, 12(5): 645-652. 英文 引 用 格 式: HUANGFU Luwen, MAO Wenji. OCC⁃model⁃based text⁃emotion mining method [ J ]. CAAI transactions on intelligent systems, 2017, 12(5): 645-652. OCC⁃model⁃based text⁃emotion mining method HUANGFU Luwen, MAO Wenji ( State Key Laboratory of Management and Control for Complex Systems, Institute of Automation, Chinese Academy of Science, Beijing 100190, China) Abstract:Opinion mining, also called sentiment analysis, as one of the core research areas in the network⁃oriented social media analysis and mining domain, has important practical and research significance. Due to the weaknesses and limitations of traditional opinion mining methods, in this study, we designe and implemente an OCC emotion model⁃based opinion mining method for extracting emotion types from text. First, we adopte a statistical method to construct an emotion dictionary, based on candidate sets collected by the WordNet dictionary, as well as several syntactic dependent relationships and a small amount of annotated data. Next, we refine the constructed emotion⁃ dimension dictionary to improve its quality by filtering out non⁃emotional words as well as emotional words that have conflicting syntactic or orientation. Lastly, we generate six main emotion types based on the obtained emotion - dimension dictionary combined with the corresponding relations between emotional dimensions and the different emotion types identified by the OCC model. Experimental results show that the proposed method has obvious advantages with respect to flexibility of usage, interpretability, and effectiveness. Keywords: opinion mining; OCC emotion model; emotional dimension; emotion types; emotion dictionary; cognitive psychology; emotion mining; co⁃occurrence 收稿日期:2013-12-17. 网络出版日期:2017-10-21. 基金项目:国家自然科学基金项目(61175040, 71025001). 通信作者:毛文吉. E⁃mail:wenji.mao@ ia.ac.cn. 近年来,社会媒体迅猛发展并快速渗透到了社 会、经济、政治、文化等各方面,互联网用户产生的 内容中包含大量关于用户意见、态度、情绪等有价 值的信息,而且其数量随时间累积呈指数级增长。 这些信息主要是用户的主观性观点,与客观的事实 有很大的不同。 这些包含用户观点的海量数据蕴 含着巨大的实际应用价值,亟需自动化的计算分析 与处理技术,这种现象促进了观点挖掘与情感分析 这一新兴研究领域的蓬勃发展。 目前,观点挖掘
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有