数据挖掘实用案例分析 数据挖掘 第8章商务宾馆竞争分析 实用案例分析 复旦大学赵卫东博士 0ta间g wdzhao@fudan.edu.cn dicta
数据挖掘实用案例分析 第8章 商务宾馆竞争分析 复旦大学 赵卫东 博士 wdzhao@fudan.edu.cn
章节介绍 过对点评网站中的酒店评价数据进行抓取,获得用户对酒店的评分和评论 内容,结合评论人、评价数量、评价内容、评价频次及评分随时间变化的 走势,可以对酒店中存在的主要问题进行分析,并对用户复购率进行统计 结合线性回归等数据分析算法统计分析得到酒店竞争力影响因素。对评 价内容进行词频统计和情感分析,综合正面、中立、负面情感对酒店的竞 争情况进行比较,最终得出酒店的竞争过程中存在的主要问题,并给出改 进建议,从而提高酒店的市场竞争能力
章节介绍 • 过对点评网站中的酒店评价数据进行抓取,获得用户对酒店的评分和评论 内容,结合评论人、评价数量、评价内容、评价频次及评分随时间变化的 走势,可以对酒店中存在的主要问题进行分析,并对用户复购率进行统计 ,结合线性回归等数据分析算法统计分析得到酒店竞争力影响因素。对评 价内容进行词频统计和情感分析,综合正面、中立、负面情感对酒店的竞 争情况进行比较,最终得出酒店的竞争过程中存在的主要问题,并给出改 进建议,从而提高酒店的市场竞争能力
章节结构 目前经济型酒店行业竞争态势 用户相关数据准备 通过 Python编程抓取评论 数据预处理 商务宾馆客户数据分析 酒店评分影响因素 酒店评分与酒店业绩的关系 酒店评分分析 客户情感分析 竞争分析 建议
章节结构 • 目前经济型酒店行业竞争态势 • 用户相关数据准备 • 通过Python编程抓取评论 • 数据预处理 • 商务宾馆客户数据分析 – 酒店评分影响因素 – 酒店评分与酒店业绩的关系 – 酒店评分分析 – 客户情感分析 – 竞争分析 • 建议
目前经济型酒店行业竞争态势 图中A商务宾馆是一家定位为较高性价比的经济型商务酒店 其位于高铁站附近,直线距离高铁东站不超过500m。酒店拥有大床房、温 馨家庭房、舒适三人间、舒适双床房、舒适大床房、观景双大床房、阳光 双床房、阳光商务大床房等房型,房内配设齐全,提供24小时热水、空调 卫浴、电视、电话等配套设施 当阳记,、周边询 七车
目前经济型酒店行业竞争态势 • 图中A商务宾馆是一家定位为较高性价比的经济型商务酒店 • 其位于高铁站附近,直线距离高铁东站不超过500m。酒店拥有大床房、温 馨家庭房、舒适三人间、舒适双床房、舒适大床房、观景双大床房、阳光 双床房、阳光商务大床房等房型,房内配设齐全,提供24小时热水、空调 、卫浴、电视、电话等配套设施
目前经济型酒店行业竞争态势 服务、位置、餐饮、配套等是酒店的重要影响因素,A商务宾馆距离火车站 非常近,直线距离只有05km,并且在宾馆2km内有两个商业广场,具有较 高的客源流量基础,这是其重要的竞争优势 A商务宾馆面临的威胁是酒店行业进入门槛较低,吸引了众多的行业竞争者 进入,在酒店附近存在数十家同样价位的商务宾馆,由于差异化不明显, 竞争者都釆用针对式的营销策略,在开发新客户时推出层出不穷的优惠方 案,对A商务宾馆的经营产生较大影响。另外,虽然交通枢纽处的餐饮较多 但其质量和价格参差不齐对A宾馆易带来负面评价。综上,A商务宾馆要 想在竞争中立于不败之地,需要具有较强的竞争能力和客户服务能力 能否在竞争中脱颖而出取决于如何进行差异化经营,如何增强商务宾馆的 商业竞争力为了实现这一目标,通过对入住客人的评论内容进行不同维度 的数据挖掘,获取A商务宾馆竟争现状和存在的主要问题,并为其提出酒店 经营的合理化建议,以提高其市场竞争能力
目前经济型酒店行业竞争态势 • 服务、位置、餐饮、配套等是酒店的重要影响因素,A商务宾馆距离火车站 非常近,直线距离只有0.5km,并且在宾馆2km内有两个商业广场,具有较 高的客源流量基础,这是其重要的竞争优势 • A商务宾馆面临的威胁是酒店行业进入门槛较低,吸引了众多的行业竞争者 进入,在酒店附近存在数十家同样价位的商务宾馆,由于差异化不明显, 竞争者都采用针对式的营销策略,在开发新客户时推出层出不穷的优惠方 案,对A商务宾馆的经营产生较大影响。另外,虽然交通枢纽处的餐饮较多 ,但其质量和价格参差不齐对A宾馆易带来负面评价。综上,A商务宾馆要 想在竞争中立于不败之地,需要具有较强的竞争能力和客户服务能力 • 能否在竞争中脱颖而出取决于如何进行差异化经营,如何增强商务宾馆的 商业竞争力为了实现这一目标,通过对入住客人的评论内容进行不同维度 的数据挖掘,获取A商务宾馆竟争现状和存在的主要问题,并为其提出酒店 经营的合理化建议,以提高其市场竞争能力
用户相关数据准备 为了分析A宾馆目前在其行业内的竞争情况、客户满意情况以及客户反馈的 主要问题,需要获得顾客对酒店的评论内容和评价分数,这些数据可以通 过使用“爬虫”软件或编程的方式从酒店预订网站上抓取。不仅可以抓取A 商务宾馆的客户评论数据,还可以抓取其周围竞争对手酒店的评论数据, 作为对比分析依据。结合网站上的客户点评数据,可以提取客户对酒店的 评分、评论内容、评论人、评价数量、评价人等级等信息,并将上述文本 内容进行格式化存储,用于后续的数据分析
用户相关数据准备 • 为了分析A宾馆目前在其行业内的竞争情况、客户满意情况以及客户反馈的 主要问题,需要获得顾客对酒店的评论内容和评价分数,这些数据可以通 过使用“爬虫”软件或编程的方式从酒店预订网站上抓取。不仅可以抓取A 商务宾馆的客户评论数据,还可以抓取其周围竞争对手酒店的评论数据, 作为对比分析依据。结合网站上的客户点评数据,可以提取客户对酒店的 评分、评论内容、评论人、评价数量、评价人等级等信息,并将上述文本 内容进行格式化存储,用于后续的数据分析
使用软件工具抓取评论 可使用“八爪鱼(http://www.bazhuayu.com)等工具软件实现内容自动抓取 操作过程简单快速,其原理是模拟浏览器对网站的浏览,在页面加载完 成之后,通过提取页面HTML代码中的对应节点的文本内容来获取网站上的 目标数据,数据提取之后以文本文件方式存储,对于海量评论数据,还可 提供云端抓取和下载
议程使用软件工具抓取评论 • 可使用“八爪鱼(http://www.bazhuayu.com)”等工具软件实现内容自动抓取 ,操作过程简单快速,其原理是模拟浏览器对网站的浏览,在页面加载完 成之后,通过提取页面HTML代码中的对应节点的文本内容来获取网站上的 目标数据,数据提取之后以文本文件方式存储,对于海量评论数据,还可 提供云端抓取和下载
用户评论内容抓取 携程”网站上对酒店的评论页面是分页显示评论内容的,需要制作两级规 则来抓取数据:第一级规则模拟单击“更多点评”按钮,并设置爬虫路线 链接到下级规则;第二级规则通过重复单击下一页的爬虫路线抓取数据
议程用户评论内容抓取 • 携程”网站上对酒店的评论页面是分页显示评论内容的,需要制作两级规 则来抓取数据:第一级规则模拟单击“更多点评”按钮,并设置爬虫路线 链接到下级规则;第二级规则通过重复单击下一页的爬虫路线抓取数据
用户评论内容抓取 数据抓取命名 涂洲叶红馆 回45
议程用户评论内容抓取 • 数据抓取命名
用户评论内容抓取 创建规则-新建 45 DAa
议程用户评论内容抓取 • 创建规则-新建