第3卷第6期 智能系统学报 Vol.3 No.6 2008年12月 CAAI Transactions on Intelligent Systems Dec.2008 基于Chunk-CRF的情感问答研究 唐琴,宋锐,林鸿飞 (大连理工大学计算机科学与工程系,辽宁大连116024) 摘要:相对于事实性问答系统而言,观点或情感问答系统的研究除了需要考虑观点持有者及情感倾向性等与情感 相关问题以外,其难点还在于答案形式更复杂更分散.从百度知道人工搜集了大量的情感问题,并根据情感问题的 特征,统计并归纳了五大情感问题类型.问题分类模式与传统事实性问答系统不同,不能仅仅根据疑问词对其进行 分类,还需要考虑到观点以及受众的反应.问题分类使用基于Chuk的CRF模型与规则相结合的情感问题分类方 法.在答案抽取时结合组块识别的结果和情感的倾向性,并根据情感问题类型的不同采取不同的方法以获取答案. 实验结果表明了评价体系的有效性, 关键词:事实性问答;情感问答;组块分析:知网 中图分类号:TP391文献标识码:A文章编号:16734785(2008)060504-07 Research on emotional question answering based on Chunk-CRF TANG Qin,SONG Rui,LIN Hong-fei (Department of Computer Science and Engineering,Dalian University of Technology,Dalian 116024,China) Abstract:Emotional question answering analyses opinions,polarity,and other factors related to sentiment analysis. Evaluations are complex compared to those for responses to factual questions.A great number of emotional ques- tions were collected from the internet,and a chunk-conditional random field (CRF)model and heuristic rules were applied to classify them into five types based on the emotional features of the questions.This classification method is different from the factual question classification method,which is mainly based on interrogative words,as it has to take the opinions and responses from users into account.Combined with polarity and recognition results from Chunk-CRF,different answers were extracted according to different question types.The experiment shows that this evaluation system for emotional question answering is effective and efficient. Keywords:factual question answering;emotional QA;chunk-CRF;HowNet 目前事实性问答系统在国内外已有大量的研不同的文档中;另外,观点、情感的抽取及其倾向性 究,然而偏重于观点或情感的问答系统的研究却相 识别以及其持有者的识别等也是结合主观信息的问 对较少.人们不仅想要了解既定的事实,也想了解大 答系统研究的一个难点. 众或他人对于某些特别的话题、人物、或者事件所 近几年情感分析方面的研究使得多视角问答系 持有的观点、想法和感情,诸如“医学界反对克隆人 统研究有一定的进展.文献[1]中构建了一个由535 吗?”,“谁支持克隆人?”,“美国人对布什有什么看 篇新闻文章组成的MPQA(multi-perspective question 法?”等.此类偏重于观点或情感的问答系统研究的 answering))语料集,手工对其中的观点性词语进行了 难点是一个由于主观性问题的答案相对于事实性问 标注,其标注属性有类型、强度大小、观点持有者等, 题而言可能更分散更复杂,其答案甚至可能分布在 文献[2]在文献[1]的语料基础上构造了一个 OpQA(opinion question answering)语料集,对新闻 收稿日期:2008-05-26. 语料中的每个话题构造了6~8个问题,事实性和观 基金项目:国家自然科学基金资助项目(60373095,60673039);国家 点性的问题各一半,在此之上实验,并得出结论,传 863高科技计划资助项目(2006AA01Z151);教育部留学人 员归国科研启动基金资助项目(教外司留[2007]1108). 统问答系统方法不能有效地应用于MPQA,同时也 通信作者:林鸿飞.E-mail:hin@dlut.edu.cm. 表明回答观点性问题时过滤掉事实性句子对MPQA