正在加载图片...
第12卷第2期 管理科学学报 Vol 12 No. 2 009年4月 JOURNAL OF MANAGEMENT SCIENCES IN CHINA Apr.2009 中文网络客户评论的产品特征挖掘方法研究 李实,叶强2,李一军, Rob law (1.哈尔滨工业大学管理学院,哈尔滨15001;2.香港理工大学,中国香港10005) 摘要:随着互联网的广泛应用,在Blog、BS、Wiki等网络站点中出现了大量的针对商品或服 务的客户评论,这些客户评论中所包含的丰富信息,对企业管理具有重要的价值.通过数据挖 掘算法对客户针对某一产品的大量评论进行分析,可以挖掘出这些产品的主要特征,并有望进 步发现客户对这些特征的意见和态度.在英文世界中已经有学者开始对这一研究进行探索, 然而由于语言结构等方面的差异,英文的研究成果尚无法直接应用于中文客户评论的挖掘中 本研究针对中文的特点,提出了面向中文的客户评论挖掘方法.该方法基于改进关联规则算法 实现了针对中文产品评论的产品特征信息挖掘.本研究采用通过互联网获得的针对手机、数码 相杋、书籍等5种产品的评论语料,对该方法进行了数据实验,实验结果初步验诬了该方法有 关键词:用户评论;产品特征;关联规则;数据挖掘 中图分类号:TP311文献标识码:A文章编号:1007-9807(2009)02-0142-11 0引言 户评论信息为目标的非结构化数据分析技术 “评论挖掘”吸引∫很多学者关注,评论挖掘作 过去十几年中, Internet技术与应用的快速发为非结构化信息挖掘的一个新兴领域,主要涉及 展不仅给企业的业务流程带来了巨大的变革,也网络评论情感倾向的分析,评论中产品特征的提 对消费者的行为模式产生了深刻的影响一方面取以及评论中产品比较信息挖掘等等3,消 改变了消费者表达对于产品观点和看法的方费者可以借助于评论挖掘工具了解产品的性能和 式—他们可以在销售网站网络论坛讨论小其他用户对该产品的态度;同时网络客户评论作 组以及博客(Bog)中撰写产品评论;另一方面这为反馈机制,可以为销售商和生产商提供哪些产 些产品的“口碑”也反过来影响其他消费者做出品特征是客户所关注的以及客户对于产品的情感 购买决策12. Doubleclick inc.进行了针对美国 倾向分布等信息,从而可以帮助企业改进产品、改 服装业、计算机硬件设备业、运动健身产品行业及 旅游业网络客户的研究,发现这些行业中,近善服务获得竞争优势面向网络用户评论的产品 半以上的互联网用户做出购买决定前会在互特征提取研究作为评论挖掘的研究方向之一,旨 联网上搜索有关产品介绍及商品评论等信息. 在从客户评论中挖掘出备受关注的产品特征信 但是随着网络评论数量的飞速增长,庞杂的息,并且总结基于这些产品特征的观点依靠情感 信息使得人工方法难以获得全部客户评论中的有分类( sentiment classification技术自动得出用户 用信息因此,迫切需要借助一定的技术手段来使对各个属性的态度倾向,从而可以为用户提供更 这一过程变得更为便捷近来,以有效获取网络用为具体和有价值的信息”在英文世界的评论挖 ①收稿H期:2007-11-23;修订日期:200804-25 基金项H:国家自然科学基金资助项日(70771032,70501009);香港理工大学研究基金资助项目(G-YX93) 作者简介:李实(1976-),女,黑龙江哈尔滨人,博生Emil:shishili@gmail.com 万方数据第12卷第2期 管理科学学报 V01.12 No.2 2009年4月 JOURNAL 0F MANAGEMENT SCIENCES IN CHINA ApL 2009 中文网络客户评论的产品特征挖掘方法研究① 李 实1,叶 强1’2,李一军1,Rob Law2 (1.哈尔滨工业大学管理学院,哈尔滨150001;2.香港理工大学,中国香港lO0085) 摘要:随着互联网的广泛应用,在Blog、BBS、wiki等网络站点中出现了大量的针对商品或服 务的客户评论,这些客户评论中所包含的丰富信息,对企业管理具有重要的价值.通过数据挖 掘算法对客户针对某一产品的大量评论进行分析,可以挖掘出这些产品的主要特征,并有望进 一步发现客户对这些特征的意见和态度.在英文世界中已经有学者开始对这一研究进行探索, 然而由于语言结构等方面的差异,英文的研究成果尚无法直接应用于中文客户评论的挖掘中. 本研究针对中文的特,最,提出了面向中文的客户评论挖掘方法.该方法基于改进关联规则算法 实现了针对中文产品评论的产品特征信息挖掘.本研究采用通过互联网获得的针对手机、数码 相机、书籍等5种产品的评论语料,对该方法进行了数据实验,实验结果初步验证了该方法有 效性. 关键词:用户评论;产品特征;关联规则;数据挖掘 中图分类号:TP3ll 文献标识码:A 文章编号:1007—9807(2009)02—0142—1l O 引 言 过去十几年中,Intemet技术与应用的快速发 展不仅给企业的业务流程带来了巨大的变革,也 对消费者的行为模式产生了深刻的影响.一方面 改变了消费者表达对于产品观点和看法的方 式——他们可以在销售网站,网络论坛,讨论小 组,以及博客(B109)中撰写产品评论;另一方面这 些产品的“口碑”也反过来影响其他消费者做出 购买决策‘L川.DoubleClick Inc.进行了针对美国 服装业、计算机硬件设备业、运动健身产品行业及 旅游业网络客户的研究"J,发现这些行业中,近 一半以上的互联网用户做出购买决定前,会在互 联网上搜索有关产品介绍及商品评论等信息. 但是,随着网络评论数量的飞速增长,庞杂的 信息使得人工方法难以获得全部客户评论中的有 用信息.因此,迫切需要借助一定的技术手段来使 这一过程变得更为便捷.近来,以有效获取网络用 户评论信息为目标的非结构化数据分析技术—— “评论挖掘”吸引.r很多学者关注HJ.评论挖掘作 为非结构化信息挖掘的一个新兴领域,主要涉及 网络评论情感倾向的分析,评论中产品特征的提 取,以及评论中产品比较信息挖掘等等一qj.消 费者可以借助于评论挖掘工具了解产品的性能和 其他用户对该产品的态度;同时,网络客户评论作 为反馈机制,可以为销售商和生产商提供哪些产 品特征是客户所关注的以及客户对于产品的情感 倾向分布等信息,从而可以帮助企业改进产品、改 善服务,获得竞争优势.面向网络用户评论的产品 特征提取研究,作为评论挖掘的研究方向之一,旨 在从客户评论中挖掘出备受关注的产品特征信 息,并且总结基于这些产品特征的观点,依靠情感 分类(sentiment classification)技术自动得出用户 对各个属性的态度倾向,从而可以为用户提供更 为具体和有价值的信息旧J.在英文世界的评论挖 ①收稿R期:20cr7一ll一23;修订日期:2008—04q5. 基金项目:国家自然科学基金资助项日(70771032,70501009);香港理丁大学研究基金资助项目(G—Yx93) 作者简介:李实(1976一),女,黑龙江哈尔滨人。博f:生.E舢lil:sIIi8llili@印lail.com 万方数据
向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有