白上次课复习: 1、什么是抽样平均误差?其影响因素有哪些? 2、什么是抽样极限误差,它与抽样平均误差有何关系? 3、抽样平均误差与抽样极限误差在抽样估计中各自发挥着什么作 用? □本次课题:第八章相关与回归分析(8课时) 口教学过程: 1.导入新课 2.讲授新课 3.总结及布置练习 □讲授内容: e 号引言:通过展示一份网络调查问卷引入新课。 导入新课: 在前面章节中,我们己经学习了分析总体特征的一些方法, 通过指标可以说明总体的具体数量特征,用抽样估计解决了无法 进行全面调查统计的难题。但是在一项统计活动中,我们不但要 了解某个总体或某些总体的特征,还要了解一些总体之间的联系 以及互相影响的程度。如下例: 1
1 上次课复习: 1、什么是抽样平均误差?其影响因素有哪些? 2、什么是抽样极限误差,它与抽样平均误差有何关系? 3、抽样平均误差与抽样极限误差在抽样估计中各自发挥着什么作 用? 本次课题: 第八章 相关与回归分析(8 课时) 教学过程: 1.导入新课 2.讲授新课 3.总结及布置练习 讲授内容: 引言:通过展示一份网络调查问卷引入新课。 导入新课: 在前面章节中,我们已经学习了分析总体特征的一些方法, 通过指标可以说明总体的具体数量特征,用抽样估计解决了无法 进行全面调查统计的难题。但是在一项统计活动中,我们不但要 了解某个总体或某些总体的特征,还要了解一些总体之间的联系 以及互相影响的程度。如下例:
某车间工人的基本情况: 职工 工资 一周工时生活支出 食用支出比例 年龄 850 49 600 20% 30 8 48 590 22% 3 830 590l 2.5% 5 820 6 87 23% 5 810 58 235% 22 6 800 570 24% 8 7 43 562 26% 52 9 7 124 560 26.5% 23 590 27% 24 在这里,在这个车间的所有9名工人(总体)中,我们一方 面可以了解职工工资总额、生活支出总数、平均工时数等,现在 我们要分析的是工资、一周工时及生活支出和食用支出比例等方 面的关系,有没有什么关联。 我们设工资为x,通过观察,工资数额大,是因为工时量大 产生的,同时又影响着生活支出,我们把这个总体称为二元(三 元).多元总体。 在上表中,工资与工时,工资(收入)与生活支出,工资与 食用支出比例等都有一定的关系。如:工资收入越高,生活支出 额也越大:工资收入越大,食用支出比例越小,那么它们之间的 关系到底如何?在统计学中,我们主要的任务就是将这种根据表 面资料的“感觉”转化成理性的认识,即由定性转移至定量。这 就是咱们这一章的学习内容:研究变量之间的关系,相关分析和 回归分析
2 某车间工人的基本情况: 职工 工资 一周工时 生活支出 食用支出比例 年龄 1 2 3 4 5 6 7 8 9 850 840 830 820 810 800 795 790 785 49 48 47 46 45 44 43 42 41 600 590 590 587 585 570 562 560 590 20% 22% 22.5% 23% 23.5% 24% 26% 26.5% 27% 30 29 45 26 22 48 52 23 24 在这里,在这个车间的所有 9 名工人(总体)中,我们一方 面可以了解职工工资总额、生活支出总数、平均工时数等,现在 我们要分析的是工资、一周工时及生活支出和食用支出比例等方 面的关系,有没有什么关联。 我们设工资为 x,通过观察,工资数额大,是因为工时量大 产生的,同时又影响着生活支出,我们把这个总体称为二元(三 元).多元总体。 在上表中,工资与工时,工资(收入)与生活支出,工资与 食用支出比例等都有一定的关系。如:工资收入越高,生活支出 额也越大;工资收入越大,食用支出比例越小,那么它们之间的 关系到底如何?在统计学中,我们主要的任务就是将这种根据表 面资料的“感觉”转化成理性的认识,即由定性转移至定量。这 就是咱们这一章的学习内容:研究变量之间的关系,相关分析和 回归分析
讲授新课: 一.相关分析(4课时) (一)相关分析的含义: 对总体中确实具有联系的标志进行分析,其主体是对总 体中具有因果关系标志的分析。有两种类型的分析: 1.函数关系:这是一个典型的数学概念,反映的是一个变 量数值随着另一个变量的给定也确定下来(完全依存 关系)。 如:c=2πR 只要知道圆的半径R的值(R=3), 则马上可知道该圆周长(C=6π) M=P×Q设一条毛巾价格为5元/条, 则销售5条的销售额为25元。 2、相关关系:是一种不完全确定的随机关系。 如:设一块田的面积,长度是固定的1,如果每株的间 隔是变量x,则一列栽苗的株数则是间隔变量的函 数:n=1/x 但是一株苗的粮食产量则不是间隔变量的一个函数,不 能随机被确定,但是又受它的影响,这种变量之间的关系则 称相关关系。 3.函数关系与相关关系的关系 1)区别:定义上的区别 一个是完全的依存关系,一个则是不完全依存关系
3 讲授新课: 一. 相关分析(4 课时) (一)相关分析的含义: 对总体中确实具有联系的标志进行分析,其主体是对总 体中具有因果关系标志的分析。有两种类型的分析: 1.函数关系:这是一个典型的数学概念,反映的是一个变 量数值随着另一个变量的给定也确定下来(完全依存 关系)。 如: c = 2R 只要知道圆的半径 R 的值(R=3), 则马上可知道该圆周长(C=6π)。 M = PQ 设一条毛巾价格为 5 元/条, 则销售 5 条的销售额为 25 元。 2、相关关系:是一种不完全确定的随机关系。 如:设一块田的面积,长度是固定的 l ,如果每株的间 隔是变量 x,则一列栽苗的株数则是间隔变量的函 数:n=l/x 但是一株苗的粮食产量则不是间隔变量的一个函数,不 能随机被确定,但是又受它的影响,这种变量之间的关系则 称相关关系。 3.函数关系与相关关系的关系 1) 区别:定义上的区别。 一个是完全的依存关系,一个则是不完全依存关系
2)联系:相关关系是相关分析的研究对象 函数关系是相关分析的工具 (二)相关的种类 1.按相关的程度分为完全相关和不完全相关,不相关 2.按相关的方向分为正相关和负相关 3.按相关的形式分为线性相关和非线性相关。 对应数值的图形近似一条直线 4.按影响因素的多少可分为单相关和复相关。 特别强调:关于相关的种类,在考试中出题经常出现,大 家一方面要掌握不同种类的名称,另外,还要判断相关的类型。 (三)相关分析的主要内容。研究两个变量之间的密切程度, 将定性→定量,包括如下几个环节。 1.确定相关关系的存在,相关关系的形态和方向。 2.确定相关关系的数学表达式。将两个变量用一个近似的 方程来表示,这就是本章第二重点一一回归分析。 3.确定因变量估计值误差的程度。既然在(2)中提到,用 一个近似方程来定义两变量的关系,这就表明用方程确 定出来的数值与实际数值之间仍有一定的差距,只是一 个估计值而已,所以我们应该对方程值与实际值计算误 差,来检验方程的代表程度。 (四)相关图表 1.相关表的编制。 可以直观地判断现象之间大致呈何种关系形式。 (1)简单相关表:未分组的相关表,把因素标志(x) 按照从小到大的顺序并配合结果标志(因变量y) 4
4 2) 联系:相关关系是相关分析的研究对象, 函数关系是相关分析的工具 (二)相关的种类 1.按相关的程度分为完全相关和不完全相关,不相关 2.按相关的方向分为正相关和负相关 3.按相关的形式分为线性相关和非线性相关。 对应数值的图形近似一条直线 4.按影响因素的多少可分为单相关和复相关。 特别强调:关于相关的种类,在考试中出题经常出现,大 家一方面要掌握不同种类的名称,另外,还要判断相关的类型。 (三)相关分析的主要内容。研究两个变量之间的密切程度, 将定性 → 定量,包括如下几个环节。 1.确定相关关系的存在,相关关系的形态和方向。 2.确定相关关系的数学表达式。将两个变量用一个近似的 方程来表示,这就是本章第二重点——回归分析。 3.确定因变量估计值误差的程度。既然在(2)中提到,用 一个近似方程来定义两变量的关系,这就表明用方程确 定出来的数值与实际数值之间仍有一定的差距,只是一 个估计值而已,所以我们应该对方程值与实际值计算误 差,来检验方程的代表程度。 (四)相关图表 1.相关表的编制。 可以直观地判断现象之间大致呈何种关系形式。 (1) 简单相关表:未分组的相关表,把因素标志(x) 按照从小到大的顺序并配合结果标志(因变量 y)
一一对应而平行排列起来。如图: 2345.min-max 少53974.对应值 (2)分组相关表。 单变量分组相关表:对自变量进行分组,编制统计分布, 计算因变量的平均数 双变量分组相关表:对自变量和因变量都进行分组 2、相关图的编制。将(x,y)实际数值放于指教坐标系中去, 结合各有序实数所对应的点形成的大致图象来判断相关密 切程度、相关方向。 (五)相关系数 1.相关系数的基本公式 r= 表明度量x、y关系主要是通过两个变量的变异程度来说明的。 此公式中包括这几个方面: (1)62xy是协方差 x是x的标准差可是y的标准差 (②)62xy协方差对相关系数r的影响,决定: [r>0或<0(正、负) r数值的大小 2.相关系数的性质 (1)r取值范围:H≤1 -1≤r≤1
5 一一对应而平行排列起来。如图: ( 2 (2)分组相关表。 双变量分组相关表:对自变量和因变量都进行分组 计算因变量的平均数 单变量分组相关表:对自变量进行分组,编制统计分布, 2、 相关图的编制。将(x, y)实际数值放于指教坐标系中去, 结合各有序实数所对应的点形成的大致图象来判断相关密 切程度、相关方向。 (五)相关系数 1.相关系数的基本公式 x y xy r 2 = 表明度量 x、y 关系主要是通过两个变量的变异程度来说明的。 此公式中包括这几个方面: (1) xy 2 是协方差 x 是 x 的标准差 y 是 y 的标准差 (2) xy 2 协方差对相关系数 r 的影响,决定: 数值的大小 或 正、负) r r 0 r 0( 2.相关系数的性质 (1) r 取值范围: r 1 -1 r 1 X 1 2 3 4 5 .min——max y 5 3 9 7 4 .对应值
(2)=1r=±1表明x与y之间存在着确定的函数关系。 (3)r>0表明两变量成正相关。r<0成负相关r=0 不相关 (4)H→1存在着一定的线性相关:川绝对值越接近1, 相关程度越高。 <0.3微弱相关 0.3<<0.5低度相关, 0.5<<0.8显著相关, 0.8<<1高度相关。 3.相关系数的简化式: n∑y-∑x∑y r=- Σx-(ΣΣy2-②] 变形:分子分母同时除以n2得 ∑xy∑x∑y 可 xy-x×y _xy-x×月 -小-时- ∑2-2xx+] n g-22时原-时
6 (2) r =1 r = 1 表明 x 与y 之间存在着确定的函数关系。 (3) r >0 表明两变量成正相关。 r <0 成负相关 r =0 不相关 (4) r → 1 存在着一定的线性相关; r 绝对值越接近 1, 相关程度越高。 r <0.3 微弱相关, 0.3< r <0.5 低度相关, 0.5< r <0.8 显著相关, 0.8< r <1 高度相关。 3.相关系数的简化式: ( ) ( ) − − − = 2 2 2 2 n x x n y y n x y x y r 变形:分子分母同时除以 2 n 得 − − − 2 2 2 2 n y n y n x n x n y n x n x y = ( ) ( ) 2 2 2 2 x x y y xy x y − − − = x y xy x y − − n x x x − = 2 ( ) = ( ) n x − x x + x 2 2 2 = ( ) 2 2 2 x n x x n x − + = ( ) 2 2 x − x
例题1:某企业上半年产品产量与单位成本资料如下: 产量x(千 单位成本 月份 件) y(元) 1 2 3 4 5329 146 2 72 9 5184 216 3 之 6 5041 284 4 73 9 5329 219 5 4 69 16 476】 276 6 4624 340 合计 21 426 79 302681481 要求:说明产品产量与单位成本之间的关系。 解:计算相关系数来表明产量与单位成本之间的关系 n∑w-∑x∑y r=- x2-∑∑2-②] 6×1481-21×426 6×79-2P6×3028-426 =-0.909 r=一0.9091说明产量和单位成本之间存在高度负相关。 例题2:根据某部门8个企业产品销售额和销售利润的资料如下 计算结果:单位(元) ∑xy=189127∑x2=2969700∑x=4290∑y2=12189.11 ∑y=260.1 试求:产品销售额与利润额的相关关系。 7
7 例题 1:某企业上半年产品产量与单位成本资料如下: 月份 产量 x(千 件) 单位成本 y(元) 2 x 2 y xy 1 2 3 4 5 6 2 3 4 3 4 5 73 72 71 73 69 68 4 9 16 9 16 25 5329 5184 5041 5329 4761 4624 146 216 284 219 276 340 合计 21 426 79 30268 1481 要求:说明产品产量与单位成本之间的关系。 解:计算相关系数来表明产量与单位成本之间的关系 ( ) ( ) − − − = 2 2 2 2 n x x n y y n x y x y r ( ) ( ) 2 2 6 79 21 6 3028 426 6 1481 21 426 − − − = = —0.9091 r = —0.9091 说明产量和单位成本之间存在高度负相关。 例题 2:根据某部门 8 个企业产品销售额和销售利润的资料如下 计算结果: 单位(元) xy =189127 2 x =2969700 x =4290 2 y =12189.11 y =260.1 试求:产品销售额与利润额的相关关系
解:r=一 n∑xy-∑x∑y ∑2-∑Σy-②月 8×189127-4290×260.1 7®x2%9700-42906x121391l-260可0.6934 存在高度正相关。 8
8 解: ( ) ( ) − − − = 2 2 2 2 n x x n y y n x y x y r ( ) ( ) 2 2 8 2969700 4290 8 12189.11 260.1 8 189127 4290 260.1 − − − = =0.9934 存在高度正相关
二回归分析(4课时) (一)回归分析的含义及与相关分析的联系 1.回归分析:对具有相关关系的两个或两个以上变量之间的 数量变化的一般关系进行测定,确立一个相应的数学 表达式,以便从一个已知量来推测另一个未知量,为 估算预测值提供一个重要的方法。(一元,多元,.) 2.相关分析与回归分析的联系: 广义的相关分析实际上包括了相关、回归分析两个范畴, 具体而言,相关分析是回归分析的基础,而回归分析则是认识变 量之间相关程度的具体形式。 (二)简单回归方程(线性) 1.作为考纲要求,我们分析的是两变量(x,y)的变化规律 呈一条直线, 也就是在画相关图时,将变量实数点(x,y)放在直角坐标系上, 图形形状是: 为了达到用已知量去估计未知的因变量数值,我们必须将两 变量的数学关系式建立起来,用一个近似方程式表示: y。=a+bx推导原理:最小平方法,(最小二乘法)确定 待定系数a,b
9 二. 回归分析(4 课时) (一)回归分析的含义及与相关分析的联系 1.回归分析:对具有相关关系的两个或两个以上变量之间的 数量变化的一般关系进行测定,确立一个相应的数学 表达式,以便从一个已知量来推测另一个未知量,为 估算预测值提供一个重要的方法。(一元,多元,.) 2.相关分析与回归分析的联系: 广义的相关分析实际上包括了相关、回归分析两个范畴, 具体而言,相关分析是回归分析的基础,而回归分析则是认识变 量之间相关程度的具体形式。 (二)简单回归方程(线性) 1. 作为考纲要求,我们分析的是两变量(x,y)的变化规律 呈一条直线, 也就是在画相关图时,将变量实数点(x,y)放在直角坐标系上, 图形形状是: 为了达到用已知量去估计未知的因变量数值,我们必须将两 变量的数学关系式建立起来,用一个近似方程式表示: y a bx c = + 推导原理:最小平方法,(最小二乘法)确定 待定系数 a,b
6-3w-y-亚-2 n∑x2-∑(x)2x2-(}262x a=-标6这 n 2.方程参数 a→表示当自变量数值为0时,因变量的取值 b→又称回归系数。表示当x每变动一个单位,因变 量平均来说变动多少。b>0表示增加平均数, b<0表示减少平均数。 3.b(回归系数)与(相关系数)》 b=w-不万 y=-×万 682x dx-y 运用数学等量关系式,故有b=r. r=b. y x 通过上式可以看出: 1因为x、均是正值,所以b与r的符号是一致的, 所以我们可以通过回归系数b来确定r的符号, 从而来判断相关的方向。 2°b与r的大小成正比例,所以还可以利用b来说明相 关程度。 4.例题:根据某企业产品销售额(万元)和销售利润率(%) 资料计算出如下数据:n=7∑x=1890∑y=31.1
10 ( ) − − = 2 2 n x x n xy x y b = ( ) x xy x y x x xy x y 2 2 2 − = − − n x b n y a y bx = − = − 2.方程参数 a → 表示当自变量数值为 0 时,因变量的取值。 b → 又称回归系数。表示当 x 每变动一个单位,因变 量平均来说变动多少。 b 0 表示增加平均数, b 0 表示减少平均数。 3. b (回归系数)与(相关系数) b x xy x y 2 − = r = x y xy x y − − 运用数学等量关系式,故有 y x b r = x y r b = 通过上式可以看出: 1 因为 x、y 均是正值,所以 b与r 的符号是一致的, 所以我们可以通过回归系数 b 来确定 r 的符号, 从而来判断相关的方向。 2 b与r 的大小成正比例,所以还可以利用 b 来说明相 关程度。 4.例题:根据某企业产品销售额(万元)和销售利润率(%) 资料计算出如下数据:n=7 x =1890 y =31.1