正在加载图片...
李实等:中文网络客户评论的产品特征挖掘方法研究 据领域研究者已经初步取得一些成果,而针对中1)挖掘重要产品特征;2)挖掘用户对于产品特征 文网络用户评论的研究还处于起步阶段随着我的主观观点;3)判断评论观点的情感导向4)根 国网络用户群的不断壮大,中国电子商务的发展据观点的重要性进行排名相关研究包括评论的 也逐渐为世界所瞩目.截至2007年12月,中国网情感分析6,评论的主客观分析“以及评论中商 民人数已经达到21亿预计208年将超过美国品特征挖掘9等 成为世界第一.不断增长的中文评论已经成为11网络客户评论情感分析 互联网上一个重要的组成部分,为了给企业和个 情感分析以客户在互联网上发布的产品评论 人提供更为方便的工具,自动化和智能化地挖掘为研究对象挖掘客户的情感倾向,从而自动判断 中文评论中的有价值信息是非常必要的但是由该评论的极性( the polarity of the review),即正面 于中英文语言存在着较大的差异,目前针对英文评论或负面评论通过对大量客户评论的情感 评论的研究成果很多无法直接应用于中文评论.分类可以综合得出这些客户对该种产品或服务 这些差异主要根源在如下一些问题上 的普遍看法 (1)文化差异导致语言表达方式不同.正如 目前情感分析技术,主要包括机器学习方法 rosenzweig"曾指出的,文化差异将导致管理研及语义方法( ( semantic orientation两类·一些学 究的不等价性;而网络评论这一文本的风格毋庸者已经开始应用这两种方法对英文客户评论的情 置疑和商品评论的撰写者—客户的文化背景深感分类进行了一定的研究最初Pag6在研究中 刻相关2 提出来用机器学习的方法进行情感倾向的挖掘工 (2)语言结构的差异例如英语中的单词是作,准确率达到875%,之后的一些学者在此研 自然分开的而中文评论的分析首先要进行分词充基础上扩展和延伸,取得了很好的研究结果 处理 (3)中英文词汇语法的差别与英文评论相进行了研究提取了投资者对其所关注股票的态 比较,中文词性标注算法更为复杂,词性标注工具 度. Beineke等用机器学习和人的注释评论相 本身的研究还在不断完善中 结合提高了英文文本情感分析的准确度Feil 本文正是在中英文语言差异存在的条件下,等利用机器学习方法,针对yaho网站的英文体 探索中文网络客户评论的产品特征信息提取技育评论研究情感分析 术.通过对基于关联规则的产品特征挖掘方法进 基于机器学习的情感分类方法在针对每一种 行原理创新和技术拓展把目前主要面向英文的产品使用前都需要用大量的训练样本对分类模 评论挖掘方法拓展到中文世界从而解决中文环型进行训练而训练样本集的建立则需要采用人 工方法对大量的评论文章逐一阅读甄别,并进行 境下,如何对客户评论中所蕴含的产品特征信息 手工标识这与利用自动情感分类降低人的阅读 进行自动挖掘的问题该方法的应用,将有望帮助负担这一初衷还有着一定的差距因此近来许多 对相应产品或者服务的反馈信息 研究者将情感分析研究的重点集中在对训练样本 的需求量较低的语义方法上 Tumey最早提出 了基于PMR算法的语义情感分类思想,该方 1相关研究背景 将点互信息(PMI)与信息汲取方法(IR)相结合 借助搜索引擎的后台数据库获得语义倾向信息, 近年来在客户关系管理的研究中有学者强调从而做出情感判断,得到汽车评论的准确率是 客户感知利失在影响顾客满意、品牌忠诚和CRM84%,电影评论的准确率是66%.其可靠性已经 效果中的作用必将逐渐增大.而目前网络经济在英文客户情感分类的研究中得到了初步的验 时代中从网络评论中挖掘客户的感知利失信息证.2003年,Dave利用该方法对亚马逊 是新兴起的研究领域对于网络评论的挖掘问题,( Amazon)和C-Net等网上商店的客户评论进行 学者 Popescu明确将其分为以下几个子任务:了情感分析,再次验证了该方法的性能zhou23 万方数据第2期 李实等:中文网络客户评论的产品特征挖掘方法研究 一143一 掘领域,研究者已经初步取得一些成果,而针对中 文网络用户评论的研究还处于起步阶段.随着我 国网络用户群的不断壮大,中国电子商务的发展 也逐渐为世界所瞩目.截至2007年12月,中国网 民人数已经达到2.1亿,预计2008年将超过美国 成为世界第一【l 0|.不断增长的中文评论已经成为 互联网上一个重要的组成部分,为了给企业和个 人提供更为方便的工具,自动化和智能化地挖掘 中文评论中的有价值信息是非常必要的.但是由 于中英文语言存在着较大的差异,目前针对英文 评论的研究成果很多无法直接应用于中文评论. 这些差异主要根源在如下一些问题上: (1)文化差异导致语言表达方式不同.正如 Ro舱n删eig[…曾指出的,文化差异将导致管理研 究的不等价性;而网络评论这一文本的风格毋庸 置疑和商品评论的撰写者——客户的文化背景深 刻相关¨…. (2)语言结构的差异.例如,英语中的单词是 自然分开的,而中文评论的分析首先要进行分词 处理; (3)中英文词汇语法的差别.与英文评论相 比较,中文词性标注算法更为复杂,词性标注工具 本身的研究还在不断完善中. 本文正是在中英文语言差异存在的条件下, 探索中文网络客户评论的产品特征信息提取技 术.通过对基于关联规则的产品特征挖掘方法进 行原理创新和技术拓展,把目前主要面向英文的 评论挖掘方法拓展到中文世界,从而解决中文环 境下,如何对客户评论中所蕴含的产品特征信息 进行自动挖掘的问题.该方法的应用,将有望帮助 企业和客户在商务过程中更便捷地获取其他客户 对相应产品或者服务的反馈信息. 1相关研究背景 近年来在客户关系管理的研究中有学者强调 客户感知利失在影响顾客满意、品牌忠诚和cRM 效果中的作用必将逐渐增大¨3|.而目前网络经济 时代中,从网络评论中挖掘客户的感知利失信息 是新兴起的研究领域.对于网络评论的挖掘问题, 学者Popescu[41明确将其分为以下几个子任务: 1)挖掘重要产品特征;2)挖掘用户对于产品特征 的主观观点;3)判断评论观点的情感导向;4)根 据观点的重要性进行排名.相关研究包括评论的 情感分析‘6|,评论的主客观分析¨41以及评论中商 品特征挖掘Hj'91等. 1.1 网络客户评论情感分析 情感分析以客户在互联网上发布的产品评论 为研究对象,挖掘客户的情感倾向,从而自动判断 该评论的极性(the polarity of the review),即正面 评论或负面评论拍].通过对大量客户评论的情感 分类,可以综合得出这些客户对该种产品或服务 的普遍看法. 目前情感分析技术,主要包括机器学习方法 及语义方法(semantic orientation)两类¨引.一些学 者已经开始应用这两种方法对英文客户评论的情 感分类进行了一定的研究.最初Pang【l钊在研究中 提出来用机器学习的方法进行情感倾向的挖掘工 作,准确率达到87.5%,之后的一些学者在此研 究基础上扩展和延伸,取得了很好的研究结果. Sanjiv m1等针对yahoo网站股票留言板中的评论 进行了研究,提取了投资者对其所关注股票的态 度.Beineke【l引等用机器学习和人的注释评论相 结合,提高了英文文本情感分析的准确度.Fei¨引 等利用机器学习方法,针对yahoo网站的英文体 育评论研究情感分析. 基于机器学习的情感分类方法在针对每一种 产品使用前,都需要用大量的训练样本对分类模 型进行训练,而训练样本集的建立则需要采用人 工方法对大量的评论文章逐一阅读甄别,并进行 手工标识,这与利用自动情感分类降低人的阅读 负担这一初衷还有着一定的差距.因此,近来许多 研究者将情感分析研究的重点集中在对训练样本 的需求量较低的语义方法上.Tumey旧1最早提出 了基于PMI-IR算法的语义情感分类思想,该方法 将点互信息(PMI)与信息汲取方法(IR)相结合, 借助搜索引擎的后台数据库获得语义倾向信息, 从而做出情感判断,得到汽车评论的准确率是 84%,电影评论的准确率是66%.其可靠性已经 在英文客户情感分类的研究中得到了初步的验 证.2003年,Davel揶。利用该方法对亚马逊 (Amazon)和c-Net等网上商店的客户评论进行 了情感分析,再次验证了该方法的性能.Zhou[15] 万方数据
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有