
14.32期中考试:2001春季 在答卷前,请仔细阅读全部试题。你有90分钟的答卷时间。祝你好运! A.判断正误(每题5分,共25分) 请指出以下表述正确、可能正确或错误,并给出简要解释。 1.如果X与Y之间的相关系数为0,那么Y对X的回归方程的斜率系数也为0 2.号+c对x+C的回归方程与,对x的回归方程的斜率系数是相同的。 假设在模型L]=@+B,中,,不再是固定常数,而是被视为随机变量, 在所有其他古典假设都存在的前提下,请判断35题: ∑(属-m,以 3。最小二乘估计量B= ∑x-网, 是无偏的。 4.基于大样本条件下,我门可以对 B-B作出符合正态分布的推断。(Se为标准 sdB) 差) 5.《在大样本条件下,)是户抽样方差的一个较好近似。 B.简答题(每题10分,共40分) 1.假设条件期望函数为L男x]=B+阝+Bx,然而,在并不知道该函数, 并且只对x进行回归的情况下,我们得到的斜率系数是否是B,的无偏估计? 2.假设,独立的随机变量X和Y的方差分别为9和25,我们希望对它们平均 值差的估计尽量精确,但我们最多可以利用的观测值为200个。那么,我们需要 多少个对X的观测值?多少个对Y的观测值?
14.32 期中考试:2001 春季 在答卷前,请仔细阅读全部试题。你有 90 分钟的答卷时间。祝你好运! A.判断正误(每题 5 分,共 25 分) 请指出以下表述正确、可能正确或错误,并给出简要解释。 1.如果 X 与 Y 之间的相关系数为 0,那么 Y 对 X 的回归方程的斜率系数也为 0。 2. y c i + 对 x c i + 的回归方程与 y i对 x i的回归方程的斜率系数是相同的。 假设在模型 中, 不再是固定常数,而是被视为随机变量 。 [ | ] E y x x i i i = + α β i x 在所有其他古典假设都存在的前提下,请判断 3-5 题: 3.最小二乘估计量 2 是无偏的。 ( ) = ( ) i x i i x x m y x m β ∧ − − ∑ ∑ 4.基于大样本条件下,我们可以对 作出符合正态分布的推断。(Se 为标准 se( ) β β β ∧ ∧ − 差) 5.( 在大样本条件下,) 是 抽样方差的一个较好近似。 2 2 Sx N σ ε β ∧ B.简答题(每题 10 分,共 40 分) 1.假设条件期望函数为 E y x x x [ | ] i i i i = + + β β β 0 1 2 2 ,然而,在并不知道该函 数 , 并且只对 x i进行回归的情况下,我们得到的斜率系数是否是 β1的无偏估计? 2.假设,独立的随机变量 X 和 Y 的方差分别为 9 和 25,我们希望对它们平均 值差的估计尽量精确,但我们最多可以利用的观测值为 200 个。那么,我们需要 多少个对 X 的观测值?多少个对 Y 的观测值?

3.证明:样本残差与预测值是不相关的,即∑g龙=0,其中龙=G+序x, %=片-月 4。假设我们对学生的考试分数与他们的父母是否接受过高等教育进行回归研 究,样本选择2000名学生,我们得到一个非常显著的系数(口10.3)。然而这个 回归的叔合优度?仅为0.08。这可能发生吗? C.较长的问题(共5分) 1.以下是利用SAS软件,对肯尼亚农村地区2384名学生的英语测试成绩做出 的国归结果,国归元是两个虚拟变量,一个是学校在当年是否获得了额外资金(现 金捐赠)的虚拟变量GRANTS,另一个是学生母亲是否识字的虚拟变量 MOM_LIT。给予学校的额外资金是用于修缮教室,购买教科书、课桌、黑板以 及其它设备进而改进办学质量的。英语测试分数介于0到100之间。 The RE0 Procedure Model:MOOL Dependent varlable:TEST_SCO English test score Aaalyais ot varlance Sun ot Hean Source D SGATOE Square 里a1uw 7>I 装odal 5151-14475 2574.93345 9.87 .0001 Error 2381 621655 261.08994 Cozreeted雪otal 2383 424809 Root MSE 16.15828 B-Square 0.0032 Dependent Mean 50.42072 Mdd R-8g 0.0074 Coeff var 32.04690 Paraneter Eatinates Varlable Label bP gotinate grrox t value Fr>t Intercept Intercept 48.38441 0.58345 82.93 .0001 GRANTS Schcol got granta 1,19441 0,46210 1.81 0.0708 装a以LIT other11t得Ta5得 2,67004 0.66436 4.02 ≤,0001 回答以下问题(每题5分) ()就得到捐赠对测试分数的影响构建95%的置信区间。得到朝赠学校的学生
3.证明:样本残差与预测值是不相关的,即 e y i i 0 ,其中 , ∧ ∑ = i i y x α β ∧ ∧ ∧ = + e y y i i i 。 ∧ = − 4. 假设我们对学生的考试分数与他们的父母是否接受过高等教育进行回归研 究,样本选择 2000 名学生,我们得到一个非常显著的系数(t=10.3)。然而这个 回归的拟合优度 R2 仅为 0.08。这可能发生吗? C.较长的问题(共 45 分) 1.以下是利用 SAS 软件,对肯尼亚农村地区 2384 名学生的英语测试成绩做出 的回归结果。回归元是两个虚拟变量,一个是学校在当年是否获得了额外资金(现 金捐赠)的虚拟变量 GRANTS,另一个是学生母亲是否识字的虚拟变量 MOM_LIT。给予学校的额外资金是用于修缮教室、购买教科书、课桌、黑板以 及其它设备进而改进办学质量的。英语测试分数介于 0 到 100 之间。 回答以下问题(每题 5 分) (a)就得到捐赠对测试分数的影响构建 95%的置信区间。得到捐赠学校的学生

是否显著地比没有得到捐赠学校的学生表现良好? (b)当年捐赠的额度约为每位学生2.50美元。那么如果每位学生的受赠水平上 升到0美元,请你预测其对测试分数的影响。 (©)在母亲识字的学生和母亲不能读或写的学生之间,估计测试分数的差距有 多大?假设我们选择用10美元向那些不识字的母亲提供教育,这种投资有0% 成功的可能让这些母亲具备读写能力。请你预测这一政策对学生测试分数的影 响 ()这两个回归元解释了测试分数方差的多大比例?这个比例是大还是小? 2.Alan Krueger在“计算机是如何改变工资结构”一文中检验了算型电脑技术 会导致工资增长这一假设,他采用工作中是否使用电脑这一虚拟变量作为对电脑 技术的替代,数据来源于1984年和1989年的当年人口调查。 我们从该论文中复制了两张表,表1是对工人这些年来每年在工作中电脑使 用情况的描述性统计报告,表2反映的是口%(小时工资)对关于电脑使用情况 的虚拟变量和其他变量的回归。表上的每一栏都是对一个特定回归的结果的报 告。标准差反应在系数下面的括号里。 ()(本题5分)第(1)栏表示不放入任何协变量,用工资单釉对关于电麻使用情 况的虚拟变量进行回归的结果,那么在1984年,电脑使用者的收入优势是什么? 这种优势在1989年改变了多少(请参侧第(4)栏的内容)? (b)(本题5分)这个简单的回归是否意味着电脑使用与收入之间具有一种因果 关系?作者为什么在第(2)栏和第(3)栏加入了新的回归元? (©)(本题10分)表1中的信息对解释各栏中电脑使用系数的改变有桥助么? 当我们加入了额外的回归元后,该系数反而减少,这是不是很奇怪? (d)(本题5分)第(4)栏和第(6)栏的数据表明,即使在增加了许多控制变量后 电脑的使用仍燃带来了显著的收入优势,你认为这可以成为电脑使用的因果效应 存在的证据吗?还是仍然值得质疑?
是否显著地比没有得到捐赠学校的学生表现良好? (b)当年捐赠的额度约为每位学生 2.50 美元。那么如果每位学生的受赠水平上 升到 10 美元,请你预测其对测试分数的影响。 (c)在母亲识字的学生和母亲不能读或写的学生之间,估计测试分数的差距有 多大?假设我们选择用 10 美元向那些不识字的母亲提供教育,这种投资有 70% 成功的可能让这些母亲具备读写能力。请你预测这一政策对学生测试分数的影 响。 (d)这两个回归元解释了测试分数方差的多大比例?这个比例是大还是小? 2.Alan Krueger 在“计算机是如何改变工资结构”一文中检验了掌握电脑技术 会导致工资增长这一假设。他采用工作中是否使用电脑这一虚拟变量作为对电脑 技术的替代。数据来源于 1984 年和 1989 年的当年人口调查。 我们从该论文中复制了两张表。表 1 是对工人这些年来每年在工作中电脑使 用情况的描述性统计报告,表 2 反映的是 log(小时工资)对关于电脑使用情况 的虚拟变量和其他变量的回归。表上的每一栏都是对一个特定回归的结果的报 告。标准差反应在系数下面的括号里。 (a)(本题 5 分)第(1)栏表示不放入任何协变量,用工资单独对关于电脑使用情 况的虚拟变量进行回归的结果。那么在 1984 年,电脑使用者的收入优势是什么? 这种优势在 1989 年改变了多少(请参阅第(4)栏的内容)? (b)(本题 5 分)这个简单的回归是否意味着电脑使用与收入之间具有一种因果 关系?作者为什么在第(2)栏和第(3)栏加入了新的回归元? (c)(本题 10 分)表 1 中的信息对解释各栏中电脑使用系数的改变有帮助么? 当我们加入了额外的回归元后,该系数反而减少,这是不是很奇怪? (d)(本题 5 分)第(4)栏和第(6)栏的数据表明,即使在增加了许多控制变量后, 电脑的使用仍然带来了显著的收入优势。你认为这可以成为电脑使用的因果效应 存在的证据吗?还是仍然值得质疑?