《统计学》实验指导/实验六:相关、回归性分析 《统计学》实验指导 实验六相关、回归性分析 、实验目的 1.掌握直线回归的原理和推导过程。 2.掌握实现相关的基本概念方差检验的适用条件(样本特性)。 3.熟悉相关性的判定方法及评定标准。 二、实验学时 2学时 三、实验类型 验证性实验 四、实验环境 1.硬件 每位学生配备计算机一台,满足下列软件安装需求 2.软件 Windows7操作系统,安装 OFFICE办公软件及 IBM SPSS Statistics统计软件。 3.网络 需要互联网支持 4.工具 五、实验理论与预备知识 1.回归方程的概念:直线回归方程的一般形式是Y(音yhat)=a+bx,其中x为自变量,一般 为资料中能精确测定和控制的量,Y为因变量,指在ⅹ规定范围内随机变化的量。a为截距 是回归直线与纵轴的交点,b为斜率,意为x每改变一个单位时,Y的变化量。回归:反映 两变量数量依存的关系,即指由一个变量推算另一个变量的数量关系。直线回归是回归分 析中最基本最简单的一种,故又称简单回归( simple regression) 2.直线回归方程的应用 )描述两变量之间的依存关系; 利用直线回归方程即可定量描述两个变量间依存的数量关系 2)利用回归方程进行预测 把预报因子(即自变量x)代入回归方程对预报量(即因变量Y)进行估计,即可得到个体 Y值的容许区间。 统计学/共4页第1页
《统计学》实验指导 / 实验六:相关、回归性分析 1 统计学 / 共4页,第1页 《统计学》实验指导 实验六 相关、回归性分析 一、实验目的 1. 掌握直线回归的原理和推导过程。 2. 掌握实现相关的基本概念方差检验的适用条件(样本特性)。 3. 熟悉相关性的判定方法及评定标准。 二、实验学时 2 学时 三、实验类型 验证性实验 四、实验环境 1. 硬件 每位学生配备计算机一台,满足下列软件安装需求。 2. 软件 Windows 7 操作系统,安装 OFFICE 办公软件及 IBM SPSS Statistics 统计软件。 3. 网络 需要互联网支持 4. 工具 无 五、实验理论与预备知识 1. 回归方程的概念:直线回归方程的一般形式是 Ý(音 y hat)=a+bx,其中 x 为自变量,一般 为资料中能精确测定和控制的量,Y 为因变量,指在 x 规定范围内随机变化的量。a 为截距, 是回归直线与纵轴的交点,b 为斜率,意为 x 每改变一个单位时,Ý 的变化量。回归:反映 两变量数量依存的关系,即指由一个变量推算另一个变量的数量关系。直线回归是回归分 析中最基本最简单的一种,故又称简单回归(simple regression)。 2. 直线回归方程的应用 1) 描述两变量之间的依存关系; 利用直线回归方程即可定量描述两个变量间依存的数量关系. 2) 利用回归方程进行预测 把预报因子(即自变量 x)代入回归方程对预报量(即因变量 Y)进行估计,即可得到个体 Y 值的容许区间
《统计学》实验指导/实验六:相关、回归性分析 2 3)利用回归方程进行统计控制 规定Y值的变化,通过控制x的范围来实现统计控制的目标 3.直线相关分析是描述两变量间是否有直线关系以及直线关系的方向和密切程度的分析方 法。用以描述两变量间相关关系的指标是相关系数(r),r的取值在-1和+1之间,相关关系 的种类有正相关(0<r(1)、负相关(-1<r<0)、零相关(r=0)、完全相关(|r|=1)。相关 分析对资料的要求:X变量和Y变量均要求是符合正态分布的随机变量。 4.相关系数( correlation coefficient)又称积差相关系数,用符号r表示。它描述两变量间 相关关系的密切程度和相关方向。其数值1≥r≥-1,当r为正值时,表示一变量随另一变 量的增加而增加称为正相关;当r为负值时,表示一变量随另一变量的增加而减少,称为 负相关。当|r|愈接近1,表示两变量的相关愈密切:当|r|愈接近0时,表示两变量相 关程度愈低:当|r|=0时,称为零相关,表示两变量无直线相关关系 六、实验任务 1.一元线性回归模型 2.简单相关系数和等级相关系数 七、实验内容与步骤 根据讲义和课件内容,练习一部分课堂实例。并针对以下实验安排的习题进行实验设计、演示 并做出相关结果分析,最后根据分析结果给出定性结论。 1.一元线性回归模型 实验内容:国家财政收入来源于国民总收入。分析财政收入如何受国民总收入变化的影响 可以预测国家财政收入的规模,为国家的经济发展做规划。现搜集到我国1990年到2010年 的财政收入和国民总收入数据,如表1所示。试通过建立财政收入对国民总收入的一元线性 回归模型来分析财政收入和国民总收入之间的关系 )对模型进行检验分析,判断模型的拟合程度如何以及模型整体的显著性; 2)通过分析给出财政收入对国民总收入的一元线性回归模型 3)假如2011年国民总收入为54125436亿元,请预测2011年的财政收入为多少 表1我国1990年到2010年的财政收入和国民总收入数据表(单位:亿元) 「年份「国民总收入财政收入年份国民总收入财政收入 1990 18718.32 937.102001108068.22 16386.04 199121826.203149.482002119095.69 18903.64 1992 26937.28 2003 135173.98 21715.25 1993 5260.02 4348.95 2004 159586.77 26396.47 1994 18108.46 5218.102005183618.51 31649.29 1995 59810.53 6242.20 2006 215883.95 38760.20 统计学/共4页第
《统计学》实验指导 / 实验六:相关、回归性分析 2 统计学 / 共4页,第2页 3) 利用回归方程进行统计控制 规定 Y 值的变化,通过控制 x 的范围来实现统计控制的目标。 3. 直线相关分析是描述两变量间是否有直线关系以及直线关系的方向和密切程度的分析方 法。用以描述两变量间相关关系的指标是相关系数(r),r 的取值在-1 和+1 之间,相关关系 的种类有正相关(0<r<1)、负相关(-1<r<0)、零相关(r=0)、完全相关(|r|=1) 。 相关 分析对资料的要求:X 变量和 Y 变量均要求是符合正态分布的随机变量。 4. 相关系数(correlation coefficient)又称积差相关系数,用符号 r 表示。它描述两变量间 相关关系的密切程度和相关方向。其数值 1≥r≥-1,当 r 为正值时,表示一变量随另一变 量的增加而增加称为正相关;当 r 为负值时,表示一变量随另一变量的增加而减少,称为 负相关。当│r│愈接近 1,表示两变量的相关愈密切;当│r│愈接近 0 时,表示两变量相 关程度愈低;当│r│=0 时,称为零相关,表示两变量无直线相关关系。 六、实验任务 1. 一元线性回归模型; 2. 简单相关系数和等级相关系数。 七、实验内容与步骤 根据讲义和课件内容,练习一部分课堂实例。并针对以下实验安排的习题进行实验设计、演示 并做出相关结果分析,最后根据分析结果给出定性结论。 1. 一元线性回归模型 实验内容:国家财政收入来源于国民总收入。分析财政收入如何受国民总收入变化的影响, 可以预测国家财政收入的规模,为国家的经济发展做规划。现搜集到我国 1990 年到 2010 年 的财政收入和国民总收入数据,如表 1 所示。试通过建立财政收入对国民总收入的一元线性 回归模型来分析财政收入和国民总收入之间的关系。 1) 对模型进行检验分析,判断模型的拟合程度如何以及模型整体的显著性; 2) 通过分析给出财政收入对国民总收入的一元线性回归模型; 3) 假如 2011 年国民总收入为 541254.36 亿元,请预测 2011 年的财政收入为多少。 表 1 我国 1990 年到 2010 年的财政收入和国民总收入数据表(单位:亿元) 年份 国民总收入 财政收入 年份 国民总收入 财政收入 1990 18718.32 2937.10 2001 108068.22 16386.04 1991 21826.20 3149.48 2002 119095.69 18903.64 1992 26937.28 3483.37 2003 135173.98 21715.25 1993 35260.02 4348.95 2004 159586.77 26396.47 1994 48108.46 5218.10 2005 183618.51 31649.29 1995 59810.53 6242.20 2006 215883.95 38760.20
《统计学》实验指导/实验六:相关、回归性分析 3 1996 70142.49 7407.99 2007 266411.02 51321.78 1997 78060.85 8651.14 2008 315274.71 61330.35 1998 83024.28 9875.95 2009341401.48 68518.30 199988479.151144.082010403259.96 83101.51 2000 98000.45 13395.23 实验要求:将实验步骤、主要的检验结果表及分析结果写到实验报告册上。 关键步骤提示 ①利用数据绘制散点图进行观察是否存在直线趋势,如有继续以下步 骤:一元线性回归分析 ②通过回归分析,判断两者之间是否有依存关系(建立检验假设、输 入数据进行回归分析) ③根据分析结果求出一元线性回归模型,并判断拟合程度以及模型整 体的显著性; ④利用求出的模型,预测2011年的财政收入值 2.简单相关系数和等级相关系数 实验内容:某高校对学生某专业课程的复习时间和考试成绩进行调查。抽查的10位学生的 有关原始数据如表2所示,要求 1)计算复习时间和考试成绩的简单相关系数和等级相关系数 2)根据计算结果,分析能否得出复习时间越长考试成绩越高的结论。 表2某高校学生某专业课程复习时间和考试成绩调查表 复习时间 复习时间 考试成绩 考试成绩 匚原始数据时间等级原始数据成绩等级 341258 87 4 341256879 4 85 2 8.5 9 94 11 8.5 13 10 96 10 统计学/共4页第3页
《统计学》实验指导 / 实验六:相关、回归性分析 3 统计学 / 共4页,第3页 1996 70142.49 7407.99 2007 266411.02 51321.78 1997 78060.85 8651.14 2008 315274.71 61330.35 1998 83024.28 9875.95 2009 341401.48 68518.30 1999 88479.15 11444.08 2010 403259.96 83101.51 2000 98000.45 13395.23 —— —— —— 实验要求:将实验步骤、主要的检验结果表及分析结果写到实验报告册上。 关键步骤提示: ① 利用数据绘制散点图进行观察是否存在直线趋势,如有继续以下步 骤:一元线性回归分析; ② 通过回归分析,判断两者之间是否有依存关系(建立检验假设、输 入数据进行回归分析); ③ 根据分析结果求出一元线性回归模型,并判断拟合程度以及模型整 体的显著性; ④ 利用求出的模型,预测 2011 年的财政收入值。 2. 简单相关系数和等级相关系数 实验内容:某高校对学生某专业课程的复习时间和考试成绩进行调查。抽查的 10 位学生的 有关原始数据如表 2 所示,要求: 1) 计算复习时间和考试成绩的简单相关系数和等级相关系数; 2) 根据计算结果,分析能否得出复习时间越长考试成绩越高的结论。 表 2 某高校学生某专业课程复习时间和考试成绩调查表 复习时间 复习时间 考试成绩 考试成绩 原始数据 时间等级 原始数据 成绩等级 3 3 86 3 4 4 87 4 1 1 4 1 2 2 85 2 5 5 93 6 8 6 91 5 10 8 95 8.5 9 7 94 7 11 9 95 8.5 13 10 96 10
《统计学》实验指导/实验六:相关、回归性分析 4 实验要求 1.将实验步骤、主要的检验结果表及分析结果写到实验报告册上。 2.将实验的数据文件和输出的结果文件分别命名为:数据1.sav数据2saV output1spo、 output.2spo,所有的输出文件整理到一个文件夹中,文件 夹命名为“学号+姓名+实验6作业”并提交。 八、实验分析 无 九、课外自主实验 无 十、实验扩展资源 1.图书 (1)贾俊平统计学(第7版)[M].北京:中国人民大学出版社,2018. (2)刘春英应用统计学[M].北京:中国金融出版社,2007 2.在线学习平台 (1)http://xg.hactcm.edu.cn (2)http://wljx.hactcm.educn/meol/homepage/common/index.jsp 统计学/共4页第4页
《统计学》实验指导 / 实验六:相关、回归性分析 4 统计学 / 共4页,第4页 实验要求: 1. 将实验步骤、主要的检验结果表及分析结果写到实验报告册上。 2. 将实验的数据文件和输出的结果文件分别命名为:数据 1.sav、数据 2.sav, output1.spo、output2.spo,所有的输出文件整理到一个文件夹中,文件 夹命名为“学号+姓名+实验 6 作业”并提交。 八、实验分析 无 九、课外自主实验 无 十、实验扩展资源 1. 图书 (1)贾俊平.统计学(第 7 版)[M].北京:中国人民大学出版社,2018. (2)刘春英.应用统计学[M].北京:中国金融出版社,2007. 2. 在线学习平台 (1)http://xg.hactcm.edu.cn/ (2)http://wljx.hactcm.edu.cn/meol/homepage/common/index.jsp