第七章 相关与回归分析答案索 一、判断题 1-5√√X√X,6-10√◇◇◇X,11-15◇×√X√ 16-20√X√X√ 二、单项选择题 1-5DBDCB 6-10CACAC 11-15ACCDD 16-20DABCB 21-25CCBBD 三、多项选择题 1.ABCD 2.ABCE 3.ABD 4.ACE 5.BDE 6.ABC 7.AC 8.AD 9.BCD 10.BDE 11.ABCDE 12.ABE 13.BD 14.AB 15.C 16.AB 17.BCE 18.BD 19.ADE 20.AB 四、填空题 1.在相关分析中,要求两个变量都是随机变量 2.在回归分析中,要求自变量是 随机变量 ,因变量是确定型变 量一。 3.相关关系按相关形式不同分为线性相关和非线性相关。 4.当变量x倚y之间存在正相关关系时,随着变量x值的增加,变量y的值会相 应增加一:随着x值的 减少一,而y值会相应减少 5.对劳动生产率(千元/人)和工资的相关关系进行分析,得到下面的回归方程: y=10+70x,式中x代表劳动生产率。这个方程意味着劳动生产率为1000元,工
1 第七章 相关与回归分析答案 一、判断题 1-5√√╳√╳,6-10√╳╳╳╳,11-15╳╳√╳√ 16-20√╳√╳√ 二、单项选择题 1-5DBDCB 6-10CACAC 11-15ACCDD 16-20DABCB 21-25CCBBD 三、多项选择题 1.ABCD 2.ABCE 3.ABD 4.ACE 5.BDE 6.ABC 7.AC 8.AD 9.BCD 10.BDE 11.ABCDE 12.ABE 13.BD 14.AB 15.C 16.AB 17.BCE 18.BD 19.ADE 20.AB 四、填空题 1.在相关分析中,要求两个变量都是 随机变量 。 2.在回归分析中,要求自变量是 随机变量 ,因变量是 确定型变 量 。 3.相关关系按相关形式不同分为 线性相关 和 非线性相关 。 4.当变量 x 倚 y 之间存在正相关关系时,随着变量 x 值的增加,变量 y 的值会相 应 增加 ;随着 x 值的 减少 ,而 y 值会相应减少。 5.对劳动生产率(千元/人)和工资的相关关系进行分析,得到下面的回归方程: y=10+70x,式中 x 代表劳动生产率。这个方程意味着劳动生产率为 1000 元,工
资为70010元,劳动生产率每增加1000元时,工资平均增加 70元。 6.已知Σ6-=14900;Σx-x=1400;(-}=16300:那么,x和y 的相关系数r是0.9725 7.已知σ=150,0,=18,0,=15,那么变量x和y的相关系数= 0.5556 8.若商品销售额和零售价格的相关系数为-0.93,商品销售额和居民人均收入的 相关系数为0.85,据此可以认为,销售额对零售价格具有 关关系,销售额与人均收入具有 正 相关关系,且前者的相关 积度 工 后者的相关程度。 9.简单直线回归方程的基本形式是:y倚x的回归方程:_x=a+by x倚y的回归方程: v=c+dx 和 两条直线的截距, h 和d是两条直线的回归系数,都是 待定参数。 10.在线性相关中,如果两个变量的变动方向相同则称为正相关 ;如果 两个变量的变动方向相反则称为负相关一。x=a+y 11.用于描述变量之间关系形态的图形称为散点图(相关图) ;用于度 量变量之间关系密切程度的量称为相关系数 12.根据资料是否分组,相关表可分为单变量分组相关表和双变量分 组相关表。 13.相关系数r的取值范围是-1≤r≤1。 14.若变量x与y之间完全正相关,则相关系数=L;若x与y之间完 全负相关,则= 15.相关关系根据相关的程度不同划分为 完全相送、不完全相送和不 相关 五、名词解释 1.相关关系 答:变量之间所保持的、确实存在的、但在数量表现上不严格对应的 依存关系。 2.线性相关 答:当支量之问的依存关集大数呈现为线性形式,即当一个变量变动 2
2 资为 70010 元,劳动生产率每增加 1000 元时,工资平均增加 70 元。 6.已知 (x − x)(y − y)=14900 ; ( − ) =14400 2 x x ; ( ) 16300 2 y− y = ;那么,x 和 y 的相关系数 r 是 0.9725 。 7. 已 知 150 2 = xy , = 18 x , =15 y , 那 么 变 量 x 和 y 的 相 关 系 数 r= 0.5556 。 8.若商品销售额和零售价格的相关系数为-0.93,商品销售额和居民人均收入的 相关系数为 0.85,据此可以认为,销售额对零售价格具有 负 相 关关系,销售额与人均收入具有 正 相关关系,且前者的相关 程度 大于 后者的相关程度。 9.简单直线回归方程的基本形式是:y 倚 x 的回归方程: x=a+by ; x 倚 y 的回归方程: y=c+dx 。 a 和 c 是 两条直线的截距, b 和 d 是两条直线的回归系数,都是 待定参数。 10.在线性相关中,如果两个变量的变动方向相同则称为_正相关_;如果 两个变量的变动方向相反则称为_负相关_。 x a by = + 11.用于描述变量之间关系形态的图形称为_散点图(相关图)_;用于度 量变量之间关系密切程度的量称为_相关系数_。 12.根据资料是否分组,相关表可分为_单变量分组相关表_和_双变量分 组相关表_。 13.相关系数 r 的取值范围是 − 1 1 r 。 14. 若变量 x 与 y 之间完全正相关,则相关系数 r=_1_;若 x 与 y 之间完 全负相关,则 r=_-1_。 15.相关关系根据相关的程度不同划分为_完全相关、不完全相关和_不 相关_。 五、名词解释 1. 相关关系 答:变量之间所保持的、确实存在的、但在数量表现上不严格对应的 依存关系。 2. 线性相关 答:当变量之间的依存关系大致呈现为线性形式,即当一个变量变动
一个单位时,另一个变量也接一个大致围定的增(减)量变动,就称 为线性相关。 3.正相关 答:声一个变量随着另一个变量的增如加(减少)而增如(减少),即 两者同向变化时,称为正相关 4.相关系数 答:相关条数“,它是街量两个变量之间线性相关关条的重要指标, 由于这个条教是由英国统计学家皮尔逶(Pearson)设计的,故又称为 Pearson相关集数。 5.估计标准误差 卷:在直线回归分折中制余回归平方不的自由度为-2,∑0-少是 n-2 误差总体方差。?的无偏估计量,其平方根叫估计标准误差,记为S。 6.回归分析 答:指根据相关关象的戴量表达式(回归方程式)与给定的重文量名 揭示图支量y在戴量上的平均变化和求得因变量的预测值的统计分 析方法。 六、简答题 1.相关分析有什么特点? 答:相关分斯的特点有 (1)现象之问确实存在款量上的依存关条。 (2)现象之问数量上的依存关集不是确定的。 (3)相关关集与西数关集在一定的条件下是可以相互转换的。 2.相关关系的种类有哪些? 答:1.按相关的程度可分为完全相美、不完全相关和不相关 2按相关的方向可分为正相关和负相关
3 一个单位时,另一个变量也按一个大致固定的增(减)量变动,就称 为线性相关。 3. 正相关 答:当一个变量随着另一个变量的增加(减少)而增加(减少),即 两者同向变化时,称为正相关 4. 相关系数 答:相关系数 r,它是衡量两个变量之间线性相关关系的重要指标, 由于这个系数是由英国统计学家皮尔逊(Pearson)设计的,故又称为 Pearson 相关系数。 5. 估计标准误差 答:在直线回归分析中剩余回归平方和的自由度为 n-2, 2 ( ) 2 ^ − − n y y i i 是 误差总体方差 2 的无偏估计量,其平方根叫估计标准误差,记为 yx S 。 6. 回归分析 答:指根据相关关系的数量表达式(回归方程式)与给定的自变量 x, 揭示因变量 y 在数量上的平均变化和求得因变量的预测值的统计分 析方法。 六、简答题 1.相关分析有什么特点? 答:相关分析的特点有 (1)现象之间确实存在数量上的依存关系。 (2)现象之间数量上的依存关系不是确定的。 (3)相关关系与函数关系在一定的条件下是可以相互转换的。 2.相关关系的种类有哪些? 答:1. 按相关的程度可分为完全相关、不完全相关和不相关 2.按相关的方向可分为正相关和负相关
3。接相关的形式可分为线性相关和非线性相关 4.按研究变量的多少可分为单相关、偏相关和复相关 5,按相关的性质分为真是相关和座假相关 3.相关关系的判断方法是什么? 答:相关表、相关图(散点图小、相关朵教。 5.在直线回归方程y=a+bx中,参数a和b的几何意义和经济意义是什么? 答:a表示经验回归直线在纵轴上的栽距,b表示经脸直线回归方程 的斜平。如暴=0,则a是X=0时y机率分布的均值;b在实际应 用中表示X每增加一个单位财y概率分布的均值变化,即当X每增加 一个单位时,y平均变化b个单位。 6.因变量y的总变差、回归变差和剩余变差分别反映什么问题? 答:固变量y的慈变差反映样本现察值慈体离差的大小;回归变差反 映由棋型中解释支量所解释的那部分高差的大小;剩余变差反映由棋 型中解释变量来解释的那部分离差的大小 7.相关关系和函数关系的差别是什么? 答:相关关亲是麦量之间所保特的、确实存在的、但在散量表现上不 严格对应的依存关集;函敷关条是变量之问所保持的、确实存在的、 而且教量表现上是严格的确定性的依存美集。函数美集与相美关集的 最根本的区别:散量表现上是不是严格的对应的,关象是不是确定的。 8相关分析的作用是什么? 答:可以确定 (1)变量之间是否存在关年;(2)如票存在关集,是什么样的关 条;(3)变量之间关朵的强度如何;(4)枰本所反映的麦量之间的关 条能否代替总体变量之问的关票。 9.配合最佳直线模型应遵循的条件是什么? 答:相关集散、回归条款、回归方程全部通过相应的检验
4 3. 按相关的形式可分为线性相关和非线性相关 4.按研究变量的多少可分为单相关、偏相关和复相关 5.按相关的性质分为真是相关和虚假相关 3.相关关系的判断方法是什么? 答: 相关表、相关图(散点图)、相关系数。 5.在直线回归方程 y a bx c = + 中,参数 a 和 b 的几何意义和经济意义是什么? 答:a 表示经验回归直线在纵轴上的截距, b 表示经验直线回归方程 的斜率。如果 x=0,则 a 是 x=0 时 y 概率分布的均值;b 在实际应 用中表示 x 每增加一个单位时 y 概率分布的均值变化,即当 x 每增加 一个单位时,y 平均变化 b 个单位。 6.因变量 y 的总变差、回归变差和剩余变差分别反映什么问题? 答:因变量 y 的总变差反映样本观察值总体离差的大小;回归变差反 映由模型中解释变量所解释的那部分离差的大小;剩余变差反映由模 型中解释变量未解释的那部分离差的大小。 7.相关关系和函数关系的差别是什么? 答:相关关系是变量之间所保持的、确实存在的、但在数量表现上不 严格对应的依存关系;函数关系是变量之间所保持的、确实存在的、 而且数量表现上是严格的确定性的依存关系。函数关系与相关关系的 最根本的区别:数量表现上是不是严格的对应的,关系是不是确定的。 8.相关分析的作用是什么? 答:可以确定 (1)变量之间是否存在关系;(2)如果存在关系,是什么样的关 系;(3)变量之间关系的强度如何;(4)样本所反映的变量之间的关 系能否代替总体变量之间的关系。 9.配合最佳直线模型应遵循的条件是什么? 答:相关系数、回归系数、回归方程全部通过相应的检验
10.应用回归分析应注意哪些问题? 答:经过检脸(相关条教、回归朵散、回归方程的检脸)的回归方 程才可以应用,而且在外推应用是要道慎。 七.计算题 1. (1)=5.422+0.943x (2)提出假设:H。:p=0:H,:p≠0 然后,计算检验的1统计量:1=n-2=47376,而临界值L416-2)=2145, 1- 显然由于川>12,所以否定原假设,表明总体相关系数不为零。 提出假设:H。:B=0:H,:B≠0,然后,计算检验的t统计量:t=4.737564, 而临界值116-2)=2.145,显然由于>12,所以否定原假设,即总体回归系 数显著不为零。 (3)数学考试成绩为80分时统计学考试成绩为=80.862。其95%的置信区间 为: ±lan(n-2)sn r-2 n ∑(-x切 =80.362±2.145x1.41+i6 +1+80-74.9375) 42.7661 =(76.99,84.74 2. (1)
5 10.应用回归分析应注意哪些问题? 答:经过检验(相关系数、回归系数、回归方程的检验)的回归方 程才可以应用,而且在外推应用是要谨慎。 七.计算题 1. (1) y x ˆ = + 5.422 0.943 ; (2)提出假设: H0 : = 0 ; H1 : 0 然后,计算检验的 t 统计量: 2 1 2 r r n t − − = =4.7376,而临界值 /2 t (16 2) 2.145 − = , 显然由于 / 2 t t ,所以否定原假设,表明总体相关系数不为零。 提出假设: H0 : 1 = 0 ; H1 : 1 0,然后,计算检验的 t 统计量:t=4.737564, 而临界值 /2 t (16 2) 2.145 − = ,显然由于 / 2 t t ,所以否定原假设,即总体回归系 数显著不为零。 (3)数学考试成绩为 80 分时统计学考试成绩为 y ˆ = 80.862 。其 95%的置信区间 为: 2 / 2 2 2 1 ( ) ˆ ( 2) 1 ( ) 1 (80 74.9375) 80.862 2.145 1.4 1 16 42.7661 (76.99,84.74) yx i x x y t n s n x x − − + + − − = + + = 2. (1)
客房使用率与平均房价统计图 平均房价 ◆ 10 60 102030 4050 60708090 客房使用韦 (2)=49.63+2.455x (3)69.3% 3.(1)SST=335000,SSR=250003.7和SSE=85257.72。(2)r=0.7459,解释变 量x可以解释被解释变量总变差的74.59%。(3)样本相关系数的数值为0.8636: 4.(①t=3.43>2.776拒绝原假设,总评分和月薪之间存在显著关系 代,=20设。色评分和月之同存在起者关系 (2)F=11.747.71 6.(1) 空闲率与平均租金统计图 平均租金 40 ◆ ◆ 0 ◆ 10 0 0 2 空闲率
6 客房使用率与平均房价统计图 0 20 40 60 80 100 120 0 10 20 30 40 50 60 70 80 90 客房使用率 平均房价 (2) y ˆ = 49.63 + 2.455x (3)69.3% 3.(1)SST=335000,SSR=250003.7 和 SSE=85257.72。(2)r 2 =0.7459,解释变 量 x 可以解释被解释变量总变差的 74.59%。(3)样本相关系数的数值为 0.8636。 4. (1) t=3.43>2.776 拒绝原假设,总评分和月薪之间存在显著关系 (2)F=11.74>7.71 拒绝原假设,总评分和月薪之间存在显著关系 5.(1)9;(2) y x ˆ = + 20 7.21 6.(1) 空闲率与平均租金统计图 0 5 10 15 20 25 30 35 40 0 5 10 15 20 25 空闲率 平均租金
(2)线性负相关 (3)=37.075-0.77916x (5)r2=0.4341,估计的回归方程对数据的拟合不好。空闲率这个解释变 量只能解释被解释变量平均租金的总变差的43.41%。 (6)期组会为36.888 (7)劳德代尔堡的期望租金为36.99。 7.相关系数为0.8995:说明二者高度线性相关:估计生产性周定资产为1000 万元时的总产值为1200.418。 8.(1)以劳动生产率为因变量的回归方程为少=2.8989+1.5261x:(2)回归方程 中b待定系数的经济意义为:年设备能力每增加1千瓦/人,则劳动生产率平均 增加1.5261千元/人:(3)若新建一企业,其年设备能力为6.5千瓦/人,估计 劳动生产率将为12.8188。 9.(1)二者的关系为高度线性正相关: (2)建立直线回归方程为=4.5878+0.7927x (3)计算估计标准误差为0.9034: (4)若个人收入为213亿元,估计个人消费支出额173.44亿元。 10.(1)=1.7575+0.757341x (2)相关系数为0.671984 >
7 (2)线性负相关 (3) y x ˆ = − 37.075 0.77916 (5) 2 r = 0.4341,估计的回归方程对数据的拟合不好。空闲率这个解释变 量只能解释被解释变量平均租金的总变差的 43.41%。 (6)期望租金为 36.88$。 (7)劳德代尔堡的期望租金为 36.99$。 7. 相关系数为 0.8995;说明二者高度线性相关;估计生产性固定资产为 1000 万元时的总产值为 1200.418。 8.(1)以劳动生产率为因变量的回归方程为 y x ˆ = + 2.8989 1.5261 ;(2)回归方程 中 b 待定系数的经济意义为:年设备能力每增加 1 千瓦/人,则劳动生产率平均 增加 1.5261 千元/人;(3)若新建一企业,其年设备能力为 6.5 千瓦/人,估计 劳动生产率将为 12.8188。 9.(1)二者的关系为高度线性正相关; (2)建立直线回归方程为 y x ˆ = + 4.5878 0.7927 ; (3)计算估计标准误差为 0.9034; (4)若个人收入为 213 亿元,估计个人消费支出额 173.44 亿元。 10.(1) y x ˆ = + 1.7575 0.757341 (2)相关系数为 0.671984