正在加载图片...
·646 智能系统学报 第12卷 (或情感分析)【]已成为社会媒体分析挖掘领域的 OCC情感模型的观点挖掘方法。 一个核心研究课题,其研究成果已应用于用户观点 1 情感的认知结构模型OCC 发现、产品评论分析及社会舆情监控等领域,并在 推动社会和谐发展、改善人们生活方面发挥重要 认知评估理论[02]是认知心理学研究中最为 作用)。 成熟和影响最广的情感理论。认知评估理论认为 互联网中的文本数据大致可以分为两类:一类 评估过程是个体评价其与所处环境间的关系,包括 用来陈述客观性的事实,另一类用来表达主观性的 目前的条件、导致当前状态的事件和对未来的预 观,点。相对于客观性的事实数据,主观性的观点数 期。评估理论认为评估本身尽管不是一个慎思的 据由于其内在的复杂性,在研究方法和技术上与前 过程,但其确实由认知的过程提供信息,尤其是那 者区别较大。目前观点挖掘分为两类工作:识别观 些参与理解和与环境交互的过程。评估将这些异 点的正负极性和文本中的情感类型。文本中的情 类过程的特征映射到一个共同的中介术语集(即维 感类型比正负极性包含更为丰富的信息,因而挖掘 度变量)。这些维度变量作为个体与环境之间关系 文本中的情感类型更具有挑战性,但往往需要大量 的中介描述,在刺激源和反应之间进行协调。维度 的手工标注数据,并且所获得的情感类型常常缺乏 变量刻画了对个体而言事件的重要特征。 可解释性。 认知评估理论中的不同情感模型采用了不同 挖掘观点正负极性的方法主要有文档级观点 的情感维度变量,但它们所使用的情感维度变量间 挖掘)、语句级观点挖掘s-】、基于情感对象特征 有很大的相似性,其中文献[23]工作中的分类最 的观点挖掘o等。Turney!提出了一种利用非监 全,包括相关性(relevance)、合意性(desirability)、行 督学习方法计算词之间的互信息(PM)来判断整个 动性(actionability)、责备/褒奖(praise/blame- 文档的正负极性。Pang等[)提出采用多种机器学 worthiness)、可能性(likelihood)、意外性 习方法分类每篇电影评论的正负极性。Wiebe等[] (unexpectedness)、自我投入(ego-involvement)、可 通过大量数据集学习线索和特征,区分主观观点和 控性(controllability)、权力(power)、适应性 客观事实,并在语句级判断观点的正负极性。Zhang (adaptability)。 等)提出利用词之间的依赖关系分析中文语句的 不同的情感维度变量及其取值产生不同的情 正负倾向性。H山等[)利用频繁挖掘算法获得情感 感类型。比如,在一个具体的经济环境下,“赔钱” 对象特征,再利用语义词典确定情感词的正负极 是个不合人意的事件,并导致负性情感评估。在此 性,从而输出针对每个情感对象特征的相关正负 情形下,其他变量的不同取值可引发不同的情感评 评论。 估。诸如,如果可能性是不确定的,引发“恐惧” 挖掘文本中情感类型的方法主要包括基于统 (fear)情感,否则引发“悲伤”(distress)情感。自我 计的方法[)、机器学习方法[13-6]、基于情感结构/ 的行动带来应受到责备的行为后果引发“羞耻” 模型的方法[16-]等。基于机器学习的情感类型挖 (shame),如果事件是不合己意的,则带来“悔恨” 掘工作主要采用分类学习算法[13-14,6,18- (remorse)。如果不合己意的事件带来的后果是他 Mostafa[7J提出了一种基于情感模型的方法,该方法 人应受到责备的行为引发的,则导致“生气” 利用大量的手工标注数据,并基于主要的情感变量 (anger)情感。 计算语句中几乎所有词的情感变量值,进而计算得 OCC情感模型[2]是认知心理学中经典的情感 到整个语句的情感类型。但是,这种方法不但需要 认知结构模型,也是在计算领域近年来采用最多的 大量人力,费时费力,而且不加区分地计算句子中 心理学情感模型,在情感的计算建模中有着非常广 出现的词,导致该方法的效率和性能较低。 泛的应用。 综上,观点倾向性的传统挖掘方法主要关注观 OCC情感模型的整个层次结构主要包括3个 点的正负极性而忽略了其丰富的情感类型:已有的 部分:与事件结果相关的情感,与智能体行为相关 情感类型挖掘尽管能够输出丰富的情感类型,但是 的情感和与对象属性相关的情感。这3个部分也可 需要大量的标注数据支持。此外,以往工作几乎都 以结合起来组合成更为复杂的情感类型。该模型 未考虑情感认知理论模型在观点挖掘和情感分析 共描述了22种不同情感类型的认知结构。OCC模 中的重要作用。因此,为了更好地实现从网上文本 型中每个情感类型的出现都由一定的条件触发,这 数据中挖掘出丰富的情感类型,文中提出一种基于 些条件通过不同的情感维度值表达。其中,“合意(或情感分析) [1-2]已成为社会媒体分析挖掘领域的 一个核心研究课题,其研究成果已应用于用户观点 发现、产品评论分析及社会舆情监控等领域,并在 推动社会和谐发展、改善人们生活方面发挥重要 作用[3] 。 互联网中的文本数据大致可以分为两类:一类 用来陈述客观性的事实,另一类用来表达主观性的 观点。 相对于客观性的事实数据,主观性的观点数 据由于其内在的复杂性,在研究方法和技术上与前 者区别较大。 目前观点挖掘分为两类工作:识别观 点的正负极性和文本中的情感类型。 文本中的情 感类型比正负极性包含更为丰富的信息,因而挖掘 文本中的情感类型更具有挑战性,但往往需要大量 的手工标注数据,并且所获得的情感类型常常缺乏 可解释性。 挖掘观点正负极性的方法主要有文档级观点 挖掘[3-4] 、语句级观点挖掘[5-8] 、基于情感对象特征 的观点挖掘[9-10]等。 Turney [4]提出了一种利用非监 督学习方法计算词之间的互信息(PMI)来判断整个 文档的正负极性。 Pang 等[3] 提出采用多种机器学 习方法分类每篇电影评论的正负极性。 Wiebe 等[8] 通过大量数据集学习线索和特征,区分主观观点和 客观事实,并在语句级判断观点的正负极性。 Zhang 等[11]提出利用词之间的依赖关系分析中文语句的 正负倾向性。 Hu 等[9] 利用频繁挖掘算法获得情感 对象特征,再利用语义词典确定情感词的正负极 性,从而输出针对每个情感对象特征的相关正负 评论。 挖掘文本中情感类型的方法主要包括基于统 计的方法[12] 、机器学习方法[13-16] 、基于情感结构/ 模型的方法[16-17] 等。 基于机器学习的情感类型挖 掘 工 作 主 要 采 用 分 类 学 习 算 法[13-14,16,18-19] 。 Mostafa [17]提出了一种基于情感模型的方法,该方法 利用大量的手工标注数据,并基于主要的情感变量 计算语句中几乎所有词的情感变量值,进而计算得 到整个语句的情感类型。 但是,这种方法不但需要 大量人力,费时费力,而且不加区分地计算句子中 出现的词,导致该方法的效率和性能较低。 综上,观点倾向性的传统挖掘方法主要关注观 点的正负极性而忽略了其丰富的情感类型;已有的 情感类型挖掘尽管能够输出丰富的情感类型,但是 需要大量的标注数据支持。 此外,以往工作几乎都 未考虑情感认知理论模型在观点挖掘和情感分析 中的重要作用。 因此,为了更好地实现从网上文本 数据中挖掘出丰富的情感类型,文中提出一种基于 OCC 情感模型的观点挖掘方法。 1 情感的认知结构模型 OCC 认知评估理论[20-23] 是认知心理学研究中最为 成熟和影响最广的情感理论。 认知评估理论认为 评估过程是个体评价其与所处环境间的关系,包括 目前的条件、导致当前状态的事件和对未来的预 期。 评估理论认为评估本身尽管不是一个慎思的 过程,但其确实由认知的过程提供信息,尤其是那 些参与理解和与环境交互的过程。 评估将这些异 类过程的特征映射到一个共同的中介术语集(即维 度变量)。 这些维度变量作为个体与环境之间关系 的中介描述,在刺激源和反应之间进行协调。 维度 变量刻画了对个体而言事件的重要特征。 认知评估理论中的不同情感模型采用了不同 的情感维度变量,但它们所使用的情感维度变量间 有很大的相似性,其中文献[23] 工作中的分类最 全,包括相关性(relevance)、合意性(desirability)、行 动 性 ( actionability )、 责 备/ 褒 奖 ( praise / blame⁃ worthiness )、 可 能 性 ( likelihood )、 意 外 性 (unexpectedness)、自我投入( ego -involvement)、可 控 性 ( controllability )、 权 力 ( power )、 适 应 性 (adaptability)。 不同的情感维度变量及其取值产生不同的情 感类型。 比如,在一个具体的经济环境下,“赔钱” 是个不合人意的事件,并导致负性情感评估。 在此 情形下,其他变量的不同取值可引发不同的情感评 估。 诸如,如果可能性是不确定的,引发 “ 恐惧” (fear)情感,否则引发“悲伤” ( distress)情感。 自我 的行动带来应受到责备的行为后果引发“ 羞耻” (shame),如果事件是不合己意的,则带来“悔恨” (remorse)。 如果不合己意的事件带来的后果是他 人应受 到 责 备 的 行 为 引 发 的, 则 导 致 “ 生 气” (anger)情感。 OCC 情感模型[21] 是认知心理学中经典的情感 认知结构模型,也是在计算领域近年来采用最多的 心理学情感模型,在情感的计算建模中有着非常广 泛的应用。 OCC 情感模型的整个层次结构主要包括 3 个 部分:与事件结果相关的情感,与智能体行为相关 的情感和与对象属性相关的情感。 这 3 个部分也可 以结合起来组合成更为复杂的情感类型。 该模型 共描述了 22 种不同情感类型的认知结构。 OCC 模 型中每个情感类型的出现都由一定的条件触发,这 些条件通过不同的情感维度值表达。 其中,“合意 ·646· 智 能 系 统 学 报 第 12 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有