当前位置:高等教育资讯网  >  中国高校课件下载中心  >  大学文库  >  浏览文档

延安大学:《社会统计学 Social Statistics》课程教学资源(PPT课件讲稿)第十二章 相关与回归分析

资源类别:文库,文档格式:PPT,文档页数:92,文件大小:994KB,团购合买
◼ 第一节 相关关系及种类 ◼ 第二节 定类变量的相关分析 ◼ 第三节 定序变量的相关分析 ◼ 第四节 定距变量的相关分析 ◼ 第五节 回归分析
点击下载完整版文档(PPT)

第十二章相关与回归分析 ■第一节相关关系及种类 ■第二节定类变量的相关分析 第三节定序变量的相关分析 第四节定距变量的相关分析 第五节回归分析

第十二章 相关与回归分析 ◼ 第一节 相关关系及种类 ◼ 第二节 定类变量的相关分析 ◼ 第三节 定序变量的相关分析 ◼ 第四节 定距变量的相关分析 ◼ 第五节 回归分析

社会上,许多现象之间也都有相互联系,例如: 身高与体重、教育程度和收入、学业成就和家庭环境 智商与父母智力等。在这些有关系的现象中,它们之 间联系的程度和性质也各不相同。 本书第十章提出了两总体的检验及估计的问题,这 意味着我们开始与双变量统计方法打交道了。双变量 统计与单变量统计最大的不同之处是,客观事物间的 关联性开始披露出来。这一章我们将把相关关系的讨 论深入下去,不仅要对相关关系的存在给出判断,更 要对相关关系的强度给出测量,同时要披露两变量间 的因果联系,其内容分为相关分析和回归分析这两个 大的方面

社会上,许多现象之间也都有相互联系,例如: 身高与体重、教育程度和收入、学业成就和家庭环境、 智商与父母智力等。在这些有关系的现象中,它们之 间联系的程度和性质也各不相同。 本书第十章提出了两总体的检验及估计的问题,这 意味着我们开始与双变量统计方法打交道了。双变量 统计与单变量统计最大的不同之处是,客观事物间的 关联性开始披露出来。这一章我们将把相关关系的讨 论深入下去,不仅要对相关关系的存在给出判断,更 要对相关关系的强度给出测量,同时要披露两变量间 的因果联系,其内容分为相关分析和回归分析这两个 大的方面

第一节变量之间的相互关系 1.相关程度 完全相关,指变量之间为函数关系;完全不相关指变 量之间不存在任何依存关系,彼此独立。不完全相关介于 两者之间。不完全相关是本章讨论的重点。 由于数学手段上的局限性,统计学探讨的最多的是定 距一定距变量间能近似地表现为一条直线的线性相关。在 统计中,对于线性相关,采用相关系数(记作/)这一指标 来量度相关关系程度或强度。就线性相关来说,当/= 时,表示为完全相关;当/=0时,表现为无相关或零相 关;当0<<1时,表现为不完全相关

第一节 变量之间的相互关系 1. 相关程度 完全相关,指变量之间为函数关系;完全不相关指变 量之间不存在任何依存关系,彼此独立。不完全相关介于 两者之间。不完全相关是本章讨论的重点。 由于数学手段上的局限性,统计学探讨的最多的是定 距—定距变量间能近似地表现为一条直线的线性相关。在 统计中,对于线性相关,采用相关系数(记作r)这一指标 来量度相关关系程度或强度。就线性相关来说,当r =l 时,表示为完全相关;当r =0时,表现为无相关或零相 关;当0< r <1时,表现为不完全相关

2.相关方向:正相关和负相关 所谓正相关关系是指一个变量的值增加时,另一变 量的值也增加。例如,受教育水平越高找到高薪水工作的 机会也越大。而负相关关系是指一个变量的值增加时,另 变量的值却减少。例如,受教育水平越高,理想子女数 目越少。要强调的是,只有定序以上测量层次的变量才分 析相关方向,因为只有这些变量的值有高低或多少之分。 至于定类变量,由于变量的值并无大小、高低之分,故定 类变量与其他变量相关时就没有正负方向了

2. 相关方向:正相关和负相关 所谓正相关关系是指一个变量的值增加时,另一变 量的值也增加。例如,受教育水平越高找到高薪水工作的 机会也越大。而负相关关系是指一个变量的值增加时,另 一变量的值却减少。例如,受教育水平越高,理想子女数 目越少。要强调的是,只有定序以上测量层次的变量才分 析相关方向,因为只有这些变量的值有高低或多少之分。 至于定类变量,由于变量的值并无大小、高低之分,故定 类变量与其他变量相关时就没有正负方向了

3.因果关系与对称关系 因果关系中两个变量有自变量( independent variable)和因变量 dependent Variable)之分 (1)两个变量有共变关系; (2)因变量的变化是由自变量的变化引起的 (3)两个变量的产生和变化有明确的时间顺序,前者 称为自变量,后者称为因变量。 表现为对称关系的相关关系,互为根据,不能区分自 变量和因变量,或者说自变量和因变量可以根据研究目的 任意选定,例如身高和体重之间的关系

3. 因果关系与对称关系 因果关系中两个变量有自变量(independent Variable)和因变量(dependent Variable)之分: (1)两个变量有共变关系; (2)因变量的变化是由自变量的变化引起的; (3)两个变量的产生和变化有明确的时间顺序,前者 称为自变量,后者称为因变量。 表现为对称关系的相关关系,互为根据,不能区分自 变量和因变量,或者说自变量和因变量可以根据研究目的 任意选定,例如身高和体重之间的关系

4.单相关和复相关 从变量的多少上看,单相关只涉及两个变量,亦称二元 相关;三个或三个以上变量之间的关系称为复相关,亦称多 元相关。 5直线相关和曲线相关 从变量变化的形式上看,如果关系近似地表现为一条直 线,称为直线相关或线性相关;如果关系近似地表现为一条 曲线,则称为曲线相关或称为非线性相关 由于数学手段的局限性,我们以学习线性相关为主。在 统计学中,通过分段处理线性相关也可以用于处理曲线相 关

4. 单相关和复相关 从变量的多少上看,单相关只涉及两个变量,亦称二元 相关;三个或三个以上变量之间的关系称为复相关,亦称多 元相关。 5.直线相关和曲线相关 从变量变化的形式上看,如果关系近似地表现为一条直 线,称为直线相关或线性相关;如果关系近似地表现为一条 曲线,则称为曲线相关或称为非线性相关。 由于数学手段的局限性,我们以学习线性相关为主。在 统计学中,通过分段处理线性相关也可以用于处理曲线相 关

第二节定类变量的相关分析 本节内容: 1.列联表 2.消减误差比例 3.λ系数 4.τ系数

第二节 定类变量的相关分析 本节内容: 1. 列联表 2. 消减误差比例 3. λ系数 4. τ系数

列联表 列联表,是按品质标志把两个变量的频数分布进 行交互分类,由于表内的每一个频数都需同时满足两个 变量的要求,所以列联表又称条件频数表。 例如,某区调查了357名选民,考察受教育程度与投 票行为之间的关系,将所得资料作成下表,便是一种关 于频数的列联表。 表12.9受教育程度与投票行为 受教育程度X 投票行为Y 合计:Fy 大学以上 大学以下 投票 114 214 弃权 67 76 143 合计:Fx 167 190 357

1. 列联表 列联表,是按品质标志把两个变量的频数分布进 行交互分类,由于表内的每一个频数都需同时满足两个 变量的要求,所以列联表又称条件频数表。 例如,某区调查了357名选民,考察受教育程度与投 票行为之间的关系,将所得资料作成下表,便是一种关 于频数的列联表

2×2频数分布列联表的一般形式 表12.22×2列联表的一般形式 ∑∑f=n 习惯上把因变量Y放在表侧,把自变量X放在表头 2×2列联表是最简单的交互分类表。 rXc列联表r(ow)、c( column)

2×2频数分布列联表的一般形式 ◼ 习惯上把因变量Y放在表侧,把自变量X放在表头。 ◼ 2×2列联表是最简单的交互分类表。 ◼ r×c列联表 r(row)、c(column)

r×c频数分布列联表的一般形式 表12.3rxc频数分布列联表的一般形式 X X X X fn fa f Y f2 f A? F ∑∑f=n

r×c频数分布列联表的一般形式

点击下载完整版文档(PPT)VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
共92页,可试读20页,点击继续阅读 ↓↓
相关文档

关于我们|帮助中心|下载说明|相关软件|意见反馈|联系我们

Copyright © 2008-现在 cucdc.com 高等教育资讯网 版权所有