正在加载图片...
7.1.1数据分析与数据挖掘 狭义的数据分析和数据挖掘是有着明显的区分的,具体如下 (1)在定义层面。狭义的数据分析,在上面已经定义过。而数据挖掘是指 从大量的数据中,通过统计学、人工智能、机器学习等方法,挖掘出未知 的、且有价值的信息和知识的过程。 (2)在作用层面。数据分析主要实现三大作用:现状分析、原因分析、预 测分析(定量)。数据分析的目标明确,先做假设,然后通过数据分析来 验证假设是否正确,从而得到相应的结论。数据挖掘主要侧重解决四类问 题:分类、聚类、关联和预测(定量、定性),数据挖掘的重点在寻找未 知的模式与规律;如著名的数据挖掘案例—啤酒与尿布,就是事先未知 的,但又是非常有价值的信息。 (3)在方法层面。数据分析主要采用对比分析、分组分析、交叉分析、回 归分析等常用分析方法;数据挖掘主要采用决策树、神经网络、关联规则、 聚类分析等统计学、人工智能、机器学习等方法进行挖掘; (4)在结果层面。数据分析一般都是得到一个指标统计量结果,如总和 平均值等,这些指标数据都需要与业务结合进行解读,才能发挥出数据的 价值与作用。数据挖掘则是输岀模型或规则,并且可相应得到模型得分或 标签,模型得分如流失概率值、总和得分、相似度、预测值等,标签如高 中低价值用户、流失与非流失、信用优良中差等。 大数据导论》厦门大学计算机科学系 林子雨 ziyulin@xmu.edu.cn《大数据导论》 厦门大学计算机科学系 林子雨 ziyulin@xmu.edu.cn 7.1.1 数据分析与数据挖掘 狭义的数据分析和数据挖掘是有着明显的区分的,具体如下: (1)在定义层面。狭义的数据分析,在上面已经定义过。而数据挖掘是指 从大量的数据中,通过统计学、人工智能、机器学习等方法,挖掘出未知 的、且有价值的信息和知识的过程。 (2)在作用层面。数据分析主要实现三大作用:现状分析、原因分析、预 测分析(定量)。数据分析的目标明确,先做假设,然后通过数据分析来 验证假设是否正确,从而得到相应的结论。数据挖掘主要侧重解决四类问 题:分类、聚类、关联和预测(定量、定性),数据挖掘的重点在寻找未 知的模式与规律;如著名的数据挖掘案例——啤酒与尿布,就是事先未知 的,但又是非常有价值的信息。 (3)在方法层面。数据分析主要采用对比分析、分组分析、交叉分析、回 归分析等常用分析方法;数据挖掘主要采用决策树、神经网络、关联规则、 聚类分析等统计学、人工智能、机器学习等方法进行挖掘; (4)在结果层面。数据分析一般都是得到一个指标统计量结果,如总和、 平均值等,这些指标数据都需要与业务结合进行解读,才能发挥出数据的 价值与作用。数据挖掘则是输出模型或规则,并且可相应得到模型得分或 标签,模型得分如流失概率值、总和得分、相似度、预测值等,标签如高 中低价值用户、流失与非流失、信用优良中差等
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有