第十一章相关与回归分析 慎空氨 1.社会经济现象间的关系分为两种类型:一种是 ,另一种是 2.在相关关系中,当给定一个X值时,Y值不是唯一确定的,而可能同时出现几个不同的 数值并在一定范围内围绕其上下波动。 3.按相关的程度可分为 4.相关系数的取值在之间,其绝对值在之间属于中度相关 5.回归分析就是根据变量X与Y之间的关系,建立两个变量之间的直线关系近似表达式进 的 6.直线回归中总变差等 7.回归系数b与相关系数r的符号应,当b大于0时,表明两变量是 8.在相关分析中,要求两个变量都是随机的,而在回归分析中,要求自变量是 变量是 9.设变量x与y之间的相关系数r=-0.92,这说明这两个变量之间存在着相关。 10.在线性回归分析中,只涉及一个自变量的回归称为 涉及多个自变量的回归称 二、判断氩 1.如果变量x与y之间的相关系数r=0,表明这两个变量之间不存在任何相关关系。() 2.设两个变量的一元线性回归方程为=-10+0.5x,由此可以判定这两个变量之间存在 着负相关关系。() 3.在其他条件不变的情况下,可决系数R2越大,估计标准误差S;x也越大,回归直线的 拟合程度就越低。() 4.如果回归系数为零,则相关系数必为零。()
第十一章 相关与回归分析 一、填空题 1. 社会经济现象间的关系分为两种类型:一种是 ,另一种是 。 2. 在相关关系中,当给定一个 X 值时,Y 值不是唯一确定的,而可能同时出现几个不同的 数值并在一定范围内围绕其 上下波动。 3. 按相关的程度可分为 、 和 。 4. 相关系数的取值在 之间,其绝对值在 之间属于中度相关。 5. 回归分析就是根据变量 X 与 Y 之间的关系,建立两个变量之间的直线关系近似表达式进 行 和 的。 6. 直线回归中总变差等于 和 之和。 7. 回归系数 b 与相关系数 r 的符号应 ,当 b 大于 0 时,表明两变量是 。 8. 在相关分析中,要求两个变量都是随机的,而在回归分析中,要求自变量是 ,因 变量是 。 9. 设变量 x 与 y 之间的相关系数 r = - 0.92, 这说明这两个变量之间存在着 相关。 10. 在线性回归分析中,只涉及一个自变量的回归称为 ;涉及多个自变量的回归称 为 。 二、 判断题 1. 如果变量 x 与 y 之间的相关系数 r = 0,表明这两个变量之间不存在任何相关关系。( ) 2. 设两个变量的一元线性回归方程为 Yc = -10 + 0.5x,由此可以判定这两个变量之间存在 着负相关关系。( ) 3. 在其他条件不变的情况下,可决系数 2 R 越大,估计标准误差 Y X S . 也越大,回归直线的 拟合程度就越低。( ) 4. 如果回归系数为零,则相关系数必为零。( )
5.对相关系数进行显著性检验,即检验总体相关系数ρ是否为零。若ρ=0表示变量X与Y 间存在线性相关关系。() 回归变差反映的是由于x与y之间的线性关系而引起的y的变差。() 7.相关系数r与可决系数R2的取值范围是一致的。() 8.相关关系侧重于考察变量之间的关系密切程度,回归分析则侧重于考察变量之间的数量 变化规律。() 我国的GDP与印度的人口之间的相关系数大于0.8,因此两者具有高度正相关关系。() 10.拟合回归直线的目的在于用直线上的点来代表所有的相关点。() 三、单項选擀题 1.变量x与y之间的负相关是指() A.x数值增大时y也随之增大 B.x数值减少时y也随之减少 C.x数值增大(或减少)时y随之减少(或增大) D.y的取值几乎不受x取值的影响 2.下列各直线回归方程中,哪一个是不正确的() F =15+7X,r=0.92 Y。=20-5x,r=0.85 C 10+2X,r=0.78 D.Y=5-3x,r=0.69 3.在回归直线c=a+bx中,回归系数b表示() A.A.当x=0时y的期望值 B.B.x变动一个单位时y的变动总额 C.C.y变动一个单位时x的平均变动量 D.x变动一个单位时y的平均变动量 4.说明回归直线拟合程度的统计量主要是() A.相关系数B.回归系数C.可决系数D.估计标准误差 5.若已知X(x-x)2是X(y-y)2的两倍,X(x-xy-y)是2(y-y)2的1.2倍,则相关 系数r=() A.V2/12B.12/2c.0.92D.0.65
5. 对相关系数进行显著性检验,即检验总体相关系数ρ是否为零。若ρ=0 表示变量 X 与 Y 间存在线性相关关系。( ) 6. 回归变差反映的是由于 x 与 y 之间的线性关系而引起的 y 的变差。( ) 7. 相关系数 r 与可决系数 2 R 的取值范围是一致的。( ) 8. 相关关系侧重于考察变量之间的关系密切程度,回归分析则侧重于考察变量之间的数量 变化规律。( ) 9. 我国的 GDP 与印度的人口之间的相关系数大于 0.8,因此两者具有高度正相关关系。( ) 10. 拟合回归直线的目的在于用直线上的点来代表所有的相关点。( ) 三、 单项选择题 1. 变量 x 与 y 之间的负相关是指( ) A. x 数值增大时 y 也随之增大 B. x 数值减少时 y 也随之减少 C. x 数值增大(或减少)时 y 随之减少(或增大) D. y 的取值几乎不受 x 取值的影响 2. 下列各直线回归方程中,哪一个是不正确的( ) A. A. Yc = 15+7X, r=0.92 B. Yc = 20-5X, r=0.85 C. Yc = -10+2X, r=0.78 D. Yc = 5-3X, r=-0.69 3. 在回归直线 Yc = a+bx 中,回归系数 b 表示( ) A. A. 当 x=0 时 y 的期望值 B. B. x 变动一个单位时 y 的变动总额 C. C. y 变动一个单位时 x 的平均变动量 D. D. x 变动一个单位时 y 的平均变动量 4. 说明回归直线拟合程度的统计量主要是( ) A.相关系数 B.回归系数 C.可决系数 D.估计标准误差 5. 若已知 2 (x − x) 是 2 ( y − y) 的两倍, (x − x)( y − y) 是 2 ( y − y) 的 1.2 倍,则相关 系数 r = ( ) A. 2 /1.2 B. 1.2/ 2 C. 0.92 D. 0.65
6.计算估计标准误差的依据是因变量的() A.数列B.总变差C.回归变差D.剩余变差 7.如果变量x与y之间的相关系数为1,则说明两个变量之间是() A.完全不相关 B.高度相关关系 C.完全相关关系 D.中度相关关系 8.各实际观测值y与回归值yc的离差平方和称为() A.总变差B剩余变差C回归变差D.可决系数R2 9.设某种产品产量为1000件时,其生产成本为30000元,其中固定成本为6000元。则总 生产成本对产量的一元线性回归方程为() A.Y=6+0.24xB.Y=6000+24xC.Y=24000+6xD.Y=24+6000x 10.在直线回归方程c=a+bx中,若回归系数b=0,则表示() A.y对x的影响是显著的 B.y对x的影响是不显著的 C.x对y的影响是显著的 D.x对y的影响是不显著的 四、乡顶选并題 1.设单位产品成本(元)对产量(千件)的一元线性回归方程为Y=85-5.6x,这意味着() A.单位成本与产量之间存在着负相关B.单位成本与产量之间是正相关 C.产量为1000件时单位成本为79.4元D.产量每增加1千件单位成本平均增加5.6元 E.产量每增加1千件单位成本平均减少5.6元 2.如果两个变量之间的线性相关程度很高,则其相关系数应接近于() A.0.5B.-0.5C.0D.1E.-1 3.变量分析中的回归变差是指() A.实际值与平均值的离差平方和B.估计值与平均值的离差平方和 C.受自变量变动影响所引起的变差D.受随机变量变动影响所产生的误差 E.总变差与残差之差 4.估计标准误差主要用于() A.A.区间估计 B.说明回归直线的代表性 C.说明回归方程拟合优度 D.测定变量间关系的密切程度 E.说明估计值对回归直线的离散程度 5.如果变量x与y之间没有线性相关关系,则() A.相关系数为0 回归系数为0 C.可决系数为0 D.估计标准误差为0 估计标准误差为1
6. 计算估计标准误差的依据是因变量的( ) A.数列 B.总变差 C.回归变差 D.剩余变差 7. 如果变量 x 与 y 之间的相关系数为 1,则说明两个变量之间是( ) A.完全不相关 B.高度相关关系 C.完全相关关系 D.中度相关关系 8. 各实际观测值 i y 与回归值 c y 的离差平方和称为( ) A.总变差 B.剩余变差 C.回归变差 D.可决系数 2 R 9. 设某种产品产量为 1000 件时,其生产成本为 30000 元,其中固定成本为 6000 元。则总 生产成本对产量的一元线性回归方程为( ) A. Y=6+0.24x B. Y=6000+24x C. Y=24000+6x D. Y=24+6000x 10. 在直线回归方程 Yc =a+bx 中,若回归系数 b=0,则表示( ) A. y 对 x 的影响是显著的 B. y 对 x 的影响是不显著的 C. x 对 y 的影响是显著的 D. x 对 y 的影响是不显著的 四、多项选择题 1. 设单位产品成本(元)对产量(千件)的一元线性回归方程为 Y=85-5.6x,这意味着( ) A. 单位成本与产量之间存在着负相关 B.单位成本与产量之间是正相关 C. 产量为 1000 件时单位成本为 79.4 元 D.产量每增加 1 千件单位成本平均增加 5.6 元 E.产量每增加 1 千件单位成本平均减少 5.6 元 2. 如果两个变量之间的线性相关程度很高,则其相关系数应接近于( ) A. 0.5 B. -0.5 C. 0 D.1 E.-1 3. 变量分析中的回归变差是指( ) A. 实际值与平均值的离差平方和 B. 估计值与平均值的离差平方和 C. 受自变量变动影响所引起的变差 D. 受随机变量变动影响所产生的误差 E.总变差与残差之差 4. 估计标准误差主要用于( ) A. A. 区间估计 B.说明回归直线的代表性 C.说明回归方程拟合优度 D. 测定变量间关系的密切程度 E.说明估计值对回归直线的离散程度 5. 如果变量 x 与 y 之间没有线性相关关系,则( ) A. 相关系数为 0 B. 回归系数为 0 C.可决系数为 0 D. 估计标准误差为 0 E. 估计标准误差为 1
五、名惘解斡 1.相关关系与相关系数 2.回归系数与回归分析 3.估计标准误差 4.剩余变差 可决系数 六、计算题 1.1.对10户居民家庭的月可支配收入和消费支出进行调查,得到资料如下:(单位:百 编号 消费支出 15 可支配收入 18 62 75 98 要求:(1)画出相关图并判断消费支出与可支配收入之间的相关方向。 (2)计算消费支出与可支配收入的相关系数并说明其相关程度。 2.2.某公司8个所属企业的产品销售资料如下 企业编号 产品销售额(万元) 消售利润(万元) 170 8.1 220 6 10.0 1000 69.0 要求:(1)计算相关系数,测定产品销售额和利润之间的相关方向和相关程度 (2)确定自变量和因变量,并求出直线回归方程 (3)计算估计标准误差: (4)根据回归方程,指出当销售额每增加1万元,利润额平均增加多少? (5)在95%的概率保证下,当销售额为1200万元时利润额的置信区间 3.对某一资料进行一元线性回归,已知样本容量为20,因变量的估计值与其平均数的离差 平方和为585,因变量的方差为35,试求: (1)(1)变量间的相关指数R:
五、名词解释 1. 相关关系与相关系数 2. 回归系数与回归分析 3. 估计标准误差 4. 剩余变差 5. 可决系数 六、 计算题 1. 1. 对 10 户居民家庭的月可支配收入和消费支出进行调查,得到资料如下:(单位:百 元) 编 号 1 2 3 4 5 6 7 8 9 10 消费支出 20 15 40 30 42 60 65 70 53 78 可支配收入 25 18 60 45 62 88 92 99 75 98 要求:(1)画出相关图并判断消费支出与可支配收入之间的相关方向。 (2)计算消费支出与可支配收入的相关系数并说明其相关程度。 2. 2. 某公司 8 个所属企业的产品销售资料如下: 企业编号 产品销售额(万元) 销售利润(万元) 1 2 3 4 5 6 7 8 170 220 390 430 480 650 850 1000 8.1 12.5 18.0 22.0 26.5 40.0 64.0 69.0 要求:(1)计算相关系数,测定产品销售额和利润之间的相关方向和相关程度; (2)确定自变量和因变量,并求出直线回归方程; (3)计算估计标准误差; (4)根据回归方程,指出当销售额每增加 1 万元,利润额平均增加多少? (5)在 95%的概率保证下,当销售额为 1200 万元时利润额的置信区间。 3.对某一资料进行一元线性回归,已知样本容量为 20,因变量的估计值与其平均数的离差 平方和为 585,因变量的方差为 35,试求: (1) (1) 变量间的相关指数 R;
(2)(2)该方程的估计标准误差 4.已知√(x-x)3=222(y-y)2=252(-y)2=43.02n=297=18 试求:(1)相关系数r (2)回归系数b:(3)估计标准误差Sx。 5.设有资料如下表所示: 两位评酒员对10种品牌白酒的主观排序 白酒种类 6 9 甲的排序 乙的排序 。。 试问两位评酒员的评审顺序是否具有一定的相关?(按5%的显著水平检验)
(2) (2) 该方程的估计标准误差。 4.已知 ( ) 22, ( ) 25, ( ) 435, 29, 18. 2 2 2 2 x − x = y − y = yc − y = xy = n = 试求:(1)相关系数 r; (2)回归系数 b; (3)估计标准误差 Y x S . 。 5.设有资料如下表所示: 两位评酒员对 10 种品牌白酒的主观排序 白酒种类 1 2 3 4 5 6 7 8 9 10 甲的排序 7 1 5 6 8 9 4 3 10 2 乙的排序 6 3 2 4 9 10 8 5 7 1 试问两位评酒员的评审顺序是否具有一定的相关?(按 5%的显著水平检验)