第7讲数据的关联性分析 马秀麟 2014年11月
马秀麟 2014年11月 第7讲 数据的关联性分析
、数据关联性分析的概念 统计学中的关联性数据 ◆什么是关联性数据? 基本特征 两组数据或者多组数据 数据之间存在一一对应关系 可能来源 来源于同一组样本的多次测量 针对同一组样本不同视角的测量 强调 。数据关联性分析是针对关联性数据的分析 。不能对独立的无关样本数据进行关联性分析 待测试数据之间存在顺序关系
一、数据关联性分析的概念 ➢ 1、统计学中的关联性数据 ◆什么是关联性数据? 基本特征 两组数据或者多组数据 数据之间存在一一对应关系 可能来源 来源于同一组样本的多次测量 针对同一组样本不同视角的测量 ◆强调 数据关联性分析是针对关联性数据的分析 不能对独立的无关样本数据进行关联性分析 待测试数据之间存在顺序关系
数据关联性分析的概念 >2、关联性数据之间的关系 >数据之间不存在关联关系 找不到趋势相同或者趋势相反的关联关系 数据之间存在相关性 数据之间有相关性,但关系比较模糊,仅仅是一种分布 或者趋势关系 数据之间存在明确的控制关系 >可以通过一个函数式来表达数据之间的逻辑关系
一、数据关联性分析的概念 ➢ 2、关联性数据之间的关系 ➢ 数据之间不存在关联关系 ➢ 找不到趋势相同或者趋势相反的关联关系 ➢ 数据之间存在相关性 ➢ 数据之间有相关性,但关系比较模糊,仅仅是一种分布 或者趋势关系 ➢ 数据之间存在明确的控制关系 ➢ 可以通过一个函数式来表达数据之间的逻辑关系
数据关联性分析的概念 3、靳捉关联性分析括术 游戏时间 oooo o o ooo 数学
一、数据关联性分析的概念 ➢ 3、数据关联性分析技术 ◆散点图 以某列数据作为X轴, 以另一列数据作为Y轴 绘制散点图,观察两列数据之间是否存在清晰的关系
数据关联性分析的概念 ◆相关性分析 通过相关性分析技术,分析数据之间的相关性 普通相关性分析 √中高测度变量的相关性分析 Pearson/相关性分析 pearman/相关性分析 低测度变量的相关性分析 Spearman相关性分析 肯德尔相关性分析 基于交叉表的相关性分析 去掉控制变量的相关性分析 √偏相关分析
一、数据关联性分析的概念 ◆相关性分析 通过相关性分析技术,分析数据之间的相关性 普通相关性分析 ✓中高测度变量的相关性分析 • Pearson相关性分析 • Spearman相关性分析 ✓低测度变量的相关性分析 • Spearman相关性分析 • 肯德尔相关性分析 • 基于交叉表的相关性分析 去掉控制变量的相关性分析 ✓偏相关分析
数据关联性分析的概念 ◆数据回归分析 目标 查找关联性数据内部隐含的函数关系式 用函数关系式描述数据之间的关系 发展趋势及预测 适应性 。对于关联性关系比较清晰的情形 类型 。定距或高测度定序的结果变量 ˇ线性关系 曲线关系 针对二元结果变量 二元 Logistic回归
一、数据关联性分析的概念 ◆数据回归分析 目标 查找关联性数据内部隐含的函数关系式 用函数关系式描述数据之间的关系 发展趋势及预测 适应性 对于关联性关系比较清晰的情形 类型 定距或高测度定序的结果变量 ✓线性关系 ✓曲线关系 针对二元结果变量 ✓二元Logistic回归
、基于散点图观察数据关联性 适应性 ◆两列关联性的数据 ◆数据类型 定距或者高测度的定序数据 。对于定类数据,尽可能采取按序编码的方式转化为定序类型
二、基于散点图观察数据关联性 ➢ 1、适应性 ◆两列关联性的数据 ◆数据类型 定距或者高测度的定序数据 对于定类数据,尽可能采取按序编码的方式转化为定序类型
、基于散点图观察数据关联性 >2、操作方法 ◆命令 图形—旧对话框—散点图 ◆设置 简单分布 设置ⅹ轴变量、设置Y轴变量 重叠分布 设置ⅹ轴变量、设置Y轴变量 ◆观察效果 显示点呈现为比较集中的直线 显示点呈现为比较集中的曲线 显示点混乱分布在整个区域
二、基于散点图观察数据关联性 ➢ 2、操作方法 ◆命令 图形——旧对话框——散点图 ◆设置 简单分布 设置X轴变量、设置Y轴变量 重叠分布 设置X轴变量、设置Y轴变量 ◆观察效果 显示点呈现为比较集中的直线 显示点呈现为比较集中的曲线 显示点混乱分布在整个区域
、基于散点图观察数据关联性 40000 30000 20000 10000 1234567
二、基于散点图观察数据关联性
、基于散点图观察数据关联性 相关关系 40000 30000 20000 10000 0 0 2 4 8
二、基于散点图观察数据关联性 ➢ 相关关系