第二章经典单方程计量经济学模型:一元线性回归模型 、内容提要 本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归 函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回 归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是 建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总 体回归函数做出统计推断。 本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS 的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。 本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所 谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”, 第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次:第一,检 验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的t检验完成:第-ˉ 检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成 本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以 及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。 其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性 与一致性构成了对样本估计量优劣的最主要的衡量准则 Goss-markov定理表明OLS估计量 是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个 值的预测,以及预测置信区间的计算及其变化特征。 典型例题分析 例1、令kds表示一名妇女生育孩子的数目,educ表示该妇女接受过教育的年数。生 育率对教育年数的简单回归模型为 kids=Po+B,educ+A
1 第二章 经典单方程计量经济学模型:一元线性回归模型 一、内容提要 本章介绍了回归分析的基本思想与基本方法。首先,本章从总体回归模型与总体回归 函数、样本回归模型与样本回归函数这两组概念开始,建立了回归分析的基本思想。总体回 归函数是对总体变量间关系的定量表述,由总体回归模型在若干基本假设下得到,但它只是 建立在理论之上,在现实中只能先从总体中抽取一个样本,获得样本回归函数,并用它对总 体回归函数做出统计推断。 本章的一个重点是如何获取线性的样本回归函数,主要涉及到普通最小二乘法(OLS) 的学习与掌握。同时,也介绍了极大似然估计法(ML)以及矩估计法(MM)。 本章的另一个重点是对样本回归函数能否代表总体回归函数进行统计推断,即进行所 谓的统计检验。统计检验包括两个方面,一是先检验样本回归函数与样本点的“拟合优度”, 第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次:第一,检 验解释变量对被解释变量是否存在着显著的线性影响关系,通过变量的 t 检验完成;第二, 检验回归函数与总体回归函数的“接近”程度,通过参数估计值的“区间检验”完成。 本章还有三方面的内容不容忽视。其一,若干基本假设。样本回归函数参数的估计以 及对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。 其二,参数估计量统计性质的分析,包括小样本性质与大样本性质,尤其是无偏性、有效性 与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov 定理表明 OLS 估计量 是最佳线性无偏估计量。其三,运用样本回归函数进行预测,包括被解释变量条件均值与个 值的预测,以及预测置信区间的计算及其变化特征。 二、典型例题分析 例 1、令 kids 表示一名妇女生育孩子的数目,educ 表示该妇女接受过教育的年数。生 育率对教育年数的简单回归模型为 kids = 0 + 1 educ +
(1)随机扰动项包含什么样的因素?它们可能与教育水平相关吗? (2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。 解答 (1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上 述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如 收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。 (2)当归结在随机扰动项中的重要影响因素与模型中的教育水平educ相关时,上述回 归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰 动项相关的情形,基本假设4不满足。 例2.已知回归模型E=a+N+,式中E为某类公司一名新员工的起始薪金(元), N为所受教育水平(年)。随机扰动项μ的分布未知,其他所有假设都满足。 (1)从直观及经济角度解释a和B。 (2)OLS估计量a和B满足线性性、无偏性及有效性吗?简单陈述理由。 (3)对参数的假设检验还能进行吗?简单陈述理由 解答 (1)α+BN为接受过N年教育的员工的总体平均起始薪金。当N为零时,平均薪金 为α,因此α表示没有接受过教育员工的平均起始薪金。B是每单位N变化所引起的E的 变化,即表示每多接受一年学校教育所对应的薪金增加值 (2)OLS估计量a和仍β满足线性性、无偏性及有效性,因为这些性质的的成立无需 随机扰动项的正态分布假设。 (3)如果1的分布未知,则所有的假设检验都是无效的。因为t检验与F检验是建立 在的正态分布假设之上的。 例3、在例2中,如果被解释变量新员工起始薪金的计量单位由元改为100元,估计的 截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距 项与斜率项有无变化? 解答 首先考察被解释变量度量单位变化的情形。以E*表示以百元为度量单位的薪金,则
2 (1)随机扰动项 包含什么样的因素?它们可能与教育水平相关吗? (2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗?请解释。 解答: (1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素,在上 述简单回归模型中,它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关,如 收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。 (2)当归结在随机扰动项中的重要影响因素与模型中的教育水平 educ 相关时,上述回 归模型不能够揭示教育对生育率在其他条件不变下的影响,因为这时出现解释变量与随机扰 动项相关的情形,基本假设 4 不满足。 例 2.已知回归模型 E = + N + ,式中 E 为某类公司一名新员工的起始薪金(元), N 为所受教育水平(年)。随机扰动项 的分布未知,其他所有假设都满足。 (1)从直观及经济角度解释 和 。 (2)OLS 估计量 ˆ 和 ˆ 满足线性性、无偏性及有效性吗?简单陈述理由。 (3)对参数的假设检验还能进行吗?简单陈述理由。 解答: (1) + N 为接受过 N 年教育的员工的总体平均起始薪金。当 N 为零时,平均薪金 为 ,因此 表示没有接受过教育员工的平均起始薪金。 是每单位 N 变化所引起的 E 的 变化,即表示每多接受一年学校教育所对应的薪金增加值。 (2)OLS 估计量 ˆ 和仍 ˆ 满足线性性、无偏性及有效性,因为这些性质的的成立无需 随机扰动项 的正态分布假设。 (3)如果 t 的分布未知,则所有的假设检验都是无效的。因为 t 检验与 F 检验是建立 在 的正态分布假设之上的。 例 3、在例 2 中,如果被解释变量新员工起始薪金的计量单位由元改为 100 元,估计的 截距项与斜率项有无变化?如果解释变量所受教育水平的度量单位由年改为月,估计的截距 项与斜率项有无变化? 解答: 首先考察被解释变量度量单位变化的情形。以 E*表示以百元为度量单位的薪金,则
E=E*×100=a+BN+ 由此有如下新模型 E*=(a/100)+(B/100)N+(4/100) 或 E*=a*+B*N+* 这里a*=a/100,β=B/100。所以新的回归系数将为原始模型回归系数的1/100 再考虑解释变量度量单位变化的情形。设N*为用月份表示的新员工受教育的时间长度, 则N*=12N,于是 E=a+BN+4=a+B(N*/12)+ 或 E=a+(B/12)N*+ 可见,估计的截距项不变,而斜率项将为原回归系数的1/12 例4、对没有截距项的一元回归模型 =B1X1+H1 称之为过原点回归( regrission through the origin)。试证明 (1)如果通过相应的样本回归模型可得到通常的的正规方程组 ∑e 则可以得到B1的两个不同的估计值:B=F/,A=C∑X)C∑x (2)在基本假设E()=0下,B1与B1均为无偏估计量。 (3)拟合线Y=B1X通常不会经过均值点(X,Y),但拟合线Y=B1X则相反。 (4)只有B1是B1的OLS估计量。 解答 (1)由第一个正规方程∑e=0得 ∑(-1X) 或 ∑=B∑X 求解得 B=Y/X
3 E = E *100 = + N + 由此有如下新模型 E* = ( /100) + ( /100)N + ( /100) 或 E* = *+ * N + * 这里 * = /100, * = /100 。所以新的回归系数将为原始模型回归系数的 1/100。 再考虑解释变量度量单位变化的情形。设 N*为用月份表示的新员工受教育的时间长度, 则 N*=12N,于是 E = + N + = + (N * /12) + 或 E = + ( /12)N *+ 可见,估计的截距项不变,而斜率项将为原回归系数的 1/12。 例 4、对没有截距项的一元回归模型 Yi = 1Xi + i 称之为过原点回归(regrission through the origin)。试证明 (1)如果通过相应的样本回归模型可得到通常的的正规方程组 = = 0 0 i i i e X e 则可以得到 1 的两个不同的估计值: 1 = Y X ~ , = ( ) ( ) 2 1 ˆ XiYi Xi 。 (2)在基本假设 E(i ) = 0 下, 1 ~ 与 1 ˆ 均为无偏估计量。 (3)拟合线 Y ˆ = ˆ 1X 通常不会经过均值点 (X,Y ) ,但拟合线 Y 1X ~ ~ = 则相反。 (4)只有 1 ˆ 是 1 的 OLS 估计量。 解答: (1)由第一个正规方程 et = 0 得 ) 0 ~ ( Yt − 1Xt = 或 Yt = 1Xt ~ 求解得 Y / X ~ 1 =
由第2个下规方程∑X(-Bx,)=0得 ∑X,H,=B∑X2 求解得 月=C∑x,H)∑X) (2)对于B1=Y/X,求期望 (B)=EY X)n E[-(B1X1+1) [E{ B, XL)+E(W, ) X X B1=B1 这里用到了X的非随机性。 对于B=C∑XH)∑H),求期望 E(A)=E∑X∑X2) (vE(X, Y,)(vELX, (B,X,+u) ∑∑(x)+(2X,E(A)=B (3)要想拟合值=X通过点(x,),BR必须等于F。但Bx=∑xy,x 通常不等于Y。这就意味着点(X,)不太可能位于直线Y=BX上。 相反地,由于BX=Y,所以直线Y=BX经过点(X,)。 (4)OLS方法要求残差平方和最小 Min rss=∑2=∑(-B1X1) 关于B1求偏导得 aS=2>(1-BH-X)=0 aB ∑X(x,-B1X)=0 A=CX)∑x2)
4 由第 2 个下规方程 ) 0 ˆ ( Xt Yt − 1Xt = 得 = 2 1 ˆ t t XtY X 求解得 ( )/( ) ˆ 2 1 = XtYt Xt (2)对于 Y / X ~ 1 = ,求期望 1 1 1 1 1 [ { ) ( )] 1 ( )] 1 [ 1 ) ( ) ~ ( = = = + = = + X X E n X E X X n E X E E Y X t t t t 这里用到了 Xt 的非随机性。 对于 ( )/( ) ˆ 2 1 = XtYt Xt ,求期望 ) ( / ) ˆ ( 2 E 1 = E XtYt Xt 2 1 2 2 1 2 2 1 ) ( ) 1 ) ( ) ( 1 ( ) [ ( )] 1 ) ( ) ( 1 ( = + = = = + t t t t t t t t t t t t X E X X X E X X X E X Y X (3)要想拟合值 Y ˆ = ˆ 1X 通过点 (X,Y ) , ˆ 1X 必须等于 Y 。但 X X X Y X t t t = 1 2 ˆ , 通常不等于 Y 。这就意味着点 (X,Y ) 不太可能位于直线 Y ˆ = ˆ 1X 上。 相反地,由于 1X = Y ~ ,所以直线 Y 1X ~ ˆ = 经过点 (X,Y ) 。 (4)OLS 方法要求残差平方和最小 Min = = − 2 1 2 ) ˆ ( t Yt Xt RSS e 关于 1 ˆ 求偏导得 )( ) 0 ˆ 2 ( ˆ 1 1 = − − = Yt Xt Xt RSS 即 ) 0 ˆ ( Xt Yt − 1Xt = = ( ) ( ) 2 1 ˆ XiYi Xi
可见B1是OLS估计量。 例5.假设模型为H=a+BX,+1。给定n个观察值(X1,Y1),(X2,H2),…… (xnn),按如下步骤建立β的一个估计量:在散点图上把第1个点和第2个点连接起来 并计算该直线的斜率;同理继续,最终将第1个点和最后一个点连接起来并计算该条线的斜 最后对这些斜率取平均值,称之为β,即β的估计值 (1)画出散点图,给出B的几何表示并推出代数表达式 (2)计算β的期望值并对所做假设进行陈述。这个估计值是有偏的还是无偏的?解 释理由。 3)证明为什么该估计值不如我们以前用OLS方法所获得的估计值,并做具体解释。 解答: (1)散点图如下图所示。 (Xn.Y) (X1,Y1) 首先计算每条直线的斜率并求平均斜率。连接(X1,H1)和(X)的直线斜率为 (X-H1)A(x,-X1)。由于共有n-1条这样的直线,因此 B= (2)因为X非随机且E(P1)=0,因此 (a+B,+)-(+B+A1=B+E[A-A]=B XI 这意味着求和中的每一项都有期望值β,所以平均值也会有同样的期望值,则表明是无偏 (3)根据高斯一马尔可夫定理,只有β的OLS估计量是最付佳线性无偏估计量,因此, 这里得到的B的有效性不如B的OLS估计量,所以较差
5 可见 1 ˆ 是 OLS 估计量。 例 5.假设模型为 Yt = + Xt + t 。给定 n 个观察值 ( , ) X1 Y1 , ( , ) X2 Y2 ,…, ( , ) Xn Yn ,按如下步骤建立 的一个估计量:在散点图上把第 1 个点和第 2 个点连接起来 并计算该直线的斜率;同理继续,最终将第 1 个点和最后一个点连接起来并计算该条线的斜 率;最后对这些斜率取平均值,称之为 ˆ ,即 的估计值。 (1)画出散点图,给出 ˆ 的几何表示并推出代数表达式。 (2)计算 ˆ 的期望值并对所做假设进行陈述。这个估计值是有偏的还是无偏的?解 释理由。 (3)证明为什么该估计值不如我们以前用 OLS 方法所获得的估计值,并做具体解释。 解答: (1)散点图如下图所示。 (X2,Y2) (Xn,Yn) (X1,Y1) 首先计算每条直线的斜率并求平均斜率。连接 ( , ) X1 Y1 和 ( , ) Xt Yt 的直线斜率为 ( )/( ) Yt −Y1 Xt − X1 。由于共有 n -1 条这样的直线,因此 [ ] 1 1 ˆ 2 1 1 = = − − − = t n t t t X X Y Y n (2)因为 X 非随机且 E(t ) = 0 ,因此 = − − = + − + + − + + = − − ] [ ] ( ) ( ) [ ] [ 1 1 1 1 1 1 1 X X E X X X X E X X Y Y E t t t t t t t 这意味着求和中的每一项都有期望值 ,所以平均值也会有同样的期望值,则表明是无偏 的。 (3)根据高斯-马尔可夫定理,只有 的 OLS 估计量是最付佳线性无偏估计量,因此, 这里得到的 ˆ 的有效性不如 的 OLS 估计量,所以较差
例6.对于人均存款与人均收入之间的关系式S1=a+P2+1使用美国36年的年度数 据得如下估计模型,括号内为标准差: S,=384.105+0.067Y (151.105)(0011) R 0.538G=199023 (1)B的经济解释是什么? (2)a和B的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话 你可以给出可能的原因吗? (3)对于拟合优度你有什么看法吗? (4)检验是否每一个回归系数都与零显著不同(在1%水平下)。同时对零假设和备择假 设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么? 解答: (1)β为收入的边际储蓄倾向,表示人均收入每增加1美元时人均储蓄的预期平均变 化量 (2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此a符 号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期B的符号为正 实际的回归式中,β的符号为正,与预期的一致。但截距项为负,与预期不符。这可能与 由于模型的错误设定形造成的。如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对 截距项的估计产生影响:另一种可能就是线性设定可能不正确 (3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中538%的拟合优度, 表明收入的变化可以解释储蓄中53.8%的变动。 (4)检验单个参数采用t检验,零假设为参数为零,备择假设为参数不为零。双变量 情形下在零假设下t分布的自由度为n-2=36-2=34。由t分布表知,双侧1%下的临界值位于 2.750与2704之间。斜率项计算的t值为0.067/0·011=6.09,截距项计算的t值为 384.105/151.105=254。可见斜率项计算的t值大于临界值,截距项小于临界值,因此拒绝 斜率项为零的假设,但不拒绝截距项为零的假设 习题 6
6 例 6.对于人均存款与人均收入之间的关系式 St = + Yt + t 使用美国 36 年的年度数 据得如下估计模型,括号内为标准差: (151.105) (0.011) 384.105 0.067 ˆSt = + Yt 2 R =0.538 ˆ =199.023 (1) 的经济解释是什么? (2) 和 的符号是什么?为什么?实际的符号与你的直觉一致吗?如果有冲突的话, 你可以给出可能的原因吗? (3)对于拟合优度你有什么看法吗? (4)检验是否每一个回归系数都与零显著不同(在 1%水平下)。同时对零假设和备择假 设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么? 解答: (1) 为收入的边际储蓄倾向,表示人均收入每增加 1 美元时人均储蓄的预期平均变 化量。 (2)由于收入为零时,家庭仍会有支出,可预期零收入时的平均储蓄为负,因此 符 号应为负。储蓄是收入的一部分,且会随着收入的增加而增加,因此预期 的符号为正。 实际的回归式中, 的符号为正,与预期的一致。但截距项为负,与预期不符。这可能与 由于模型的错误设定形造成的。如家庭的人口数可能影响家庭的储蓄形为,省略该变量将对 截距项的估计产生影响;另一种可能就是线性设定可能不正确。 (3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中 53.8%的拟合优度, 表明收入的变化可以解释储蓄中 53.8 %的变动。 (4)检验单个参数采用 t 检验,零假设为参数为零,备择假设为参数不为零。双变量 情形下在零假设下 t 分布的自由度为 n-2=36-2=34。由 t 分布表知,双侧 1%下的临界值位于 2.750 与 2.704 之间。斜率项计算的 t 值为 0.067/0.011=6.09,截距项计算的 t 值为 384.105/151.105=2.54。可见斜率项计算的 t 值大于临界值,截距项小于临界值,因此拒绝 斜率项为零的假设,但不拒绝截距项为零的假设。 三、习题
(一)基本知识类题型 2-1.解释下列概念: 1)总体回归函数 11)最大似然法 2)样本回归函数 12)估计量的标准差 3)随机的总体回归函数 13)总离差平方和 4)线性回归模型 14)回归平方和 5)随机误差项(u)和残差项(c) 15)残差平方和 条件期望 16)协方差 7)非条件期望 17)拟合优度检验 8)回归系数或回归参数 18)t检验 9)回归系数的估计量 19)F检验 10)最小平方法 2-2.判断正误并说明理由: 1)随机误差项山和残差项c是一回事 2)总体回归函数给出了对应于每一个自变量的因变量的值 3)线性回归模型意味着变量是线性的 4)在线性回归模型中,解释变量是原因,被解释变量是结果 5)随机变量的条件均值与非条件均值是一回事 2-3.回答下列问题: 1)线性回归模型有哪些基本假设?违背基本假设的计量经济学模型是否就不可估计? 2)总体方差与参数估计误差的区别与联系 3)随机误差项u和残差项ε的区别与联系。 4)根据最小二乘原理,所估计的模型已经使得拟合误差达到最小,为什么还要讨论模型的 拟合优度问题? 5)为什么用决定系数R2评价拟合优度,而不用残差平方和作为评价标准? 6)R2检验与F检验的区别与联系 7)回归分析与相关分析的区别与联系
7 (一)基本知识类题型 2-1.解释下列概念: 1) 总体回归函数 2) 样本回归函数 3) 随机的总体回归函数 4) 线性回归模型 5) 随机误差项(ui)和残差项(ei) 6) 条件期望 7) 非条件期望 8) 回归系数或回归参数 9) 回归系数的估计量 10) 最小平方法 11) 最大似然法 12) 估计量的标准差 13) 总离差平方和 14) 回归平方和 15) 残差平方和 16) 协方差 17) 拟合优度检验 18) t 检验 19) F 检验 2-2.判断正误并说明理由: 1) 随机误差项 ui 和残差项 ei 是一回事 2) 总体回归函数给出了对应于每一个自变量的因变量的值 3) 线性回归模型意味着变量是线性的 4) 在线性回归模型中,解释变量是原因,被解释变量是结果 5) 随机变量的条件均值与非条件均值是一回事 2-3.回答下列问题: 1) 线性回归模型有哪些基本假设?违背基本假设的计量经济学模型是否就不可估计? 2) 总体方差与参数估计误差的区别与联系。 3) 随机误差项 ui 和残差项 ei 的区别与联系。 4) 根据最小二乘原理,所估计的模型已经使得拟合误差达到最小,为什么还要讨论模型的 拟合优度问题? 5) 为什么用决定系数 R 2 评价拟合优度,而不用残差平方和作为评价标准? 6) R2 检验与 F 检验的区别与联系。 7) 回归分析与相关分析的区别与联系
8)最小二乘法和最大似然法的基本原理各是什么?说明它们有何区别? 9)为什么要进行解释变量的显著性检验? 10)是否任何两个变量之间的关系,都可以用两变量线性回归模型进行分析? 2-2.下列方程哪些是正确的?哪些是错误的?为什么? (1)y2=a+Bx1 t=12…,n Bx,+A t=12,…,n (3)y2=a+Bx1+1 (4)y1=a+Bx1+p V,=a+Bx, t=12,…,n =1 (8)j1=a+Bx1+1 其中带“”者表示“估计值 2-3.下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正 的、负的、还是无法确定?并说明理由。 自变量 利率 个人储蓄 利率 小麦产出 降雨量 美国国防开支 前苏联国防开支 棒球明星本垒打的次数 其年薪 统声誉 任职时间 学生计量经济学成绩 其统计学成绩 日本汽车的进口量 美国人均国民收入 (二)基本证明与问答类题型 2-4.对于一元线性回归模型,试证明: (1)E(y)=a+众x (2)D(y1)=a
8 8) 最小二乘法和最大似然法的基本原理各是什么?说明它们有何区别? 9) 为什么要进行解释变量的显著性检验? 10) 是否任何两个变量之间的关系,都可以用两变量线性回归模型进行分析? 2-2.下列方程哪些是正确的?哪些是错误的?为什么? ⑴ yt = + xt t = 1,2, ,n ⑵ yt = + xt + t t = 1,2, ,n ⑶ yt = + xt + t t = n 1,2, , ⑷ yt = + xt + t t = 1,2, ,n ⑸ yt = + xt t = n 1,2, , ⑹ yt = + xt t = 1,2, ,n ⑺ yt = + xt + t t = n 1,2, , ⑻ yt = + xt + t t = 1,2, ,n 其中带“^”者表示“估计值”。 2-3.下表列出若干对自变量与因变量。对每一对变量,你认为它们之间的关系如何?是正 的、负的、还是无法确定?并说明理由。 因变量 自变量 GNP 利率 个人储蓄 利率 小麦产出 降雨量 美国国防开支 前苏联国防开支 棒球明星本垒打的次数 其年薪 总统声誉 任职时间 学生计量经济学成绩 其统计学成绩 日本汽车的进口量 美国人均国民收入 (二)基本证明与问答类题型 2-4.对于一元线性回归模型,试证明: (1) i i E(y ) = + x (2) 2 D( yi ) =
(3)Cov(y2,y1)=0i 2-5.参数估计量的无偏性和有效性的含义是什么?从参数估计量的无偏性和有效性证明过 程说明,为什么说满足基本假设的计量经济学模型的普通最小二乘参数估计量才具有无偏性 和有效性? 2-6.对于过原点回归模型Y=BX1+1,试证明 Var(Bi) ∑X2 2-7.试证明 (1)∑e1=0,从而:e=0 (2)∑ex=0 (3)∑e,Y=0:即残差e与Y的估计值之积的和为零。 2-8.为什么在一元线性方程中,最小二乘估计量与极大似然估计量的表达式是一致的?证 明:02的ML估计量为a2=1 并且是有偏的。 2-9.熟悉t统计量的计算方法和查表判断 2-10.证明:R2=(rx)2;其中R2是一元线性回归模型的判定系数,rm是y与x的相关 系数 2-11.试根据置信区间的概念解释t检验的概率意义,即证明:对于显著性水平α, >1时,b的10(1a)%的置信区间不包含0 2-12.线性回归模型 y=a+Bx,+u t=1,2,…,n 的0均值假设是否可以表示为∑1=0?为什么? 2-13.现代投资分析的特征线涉及如下回归方程:r1=B+Brm+l2;其中:r表示股票 或债券的收益率;rm表示有价证券的收益率(用市场指数表示,如标准普尔500指数):t 表示时间。在投资分析中,β1被称为债券的安全系数β,是用来度量市场的风险程度的 即市场的发展对公司的财产有何影响。依据1956-1976年间240个月的数据, Fogler和 Apathy得到IBM股票的回归方程;市场指数是在芝加哥大学建立的市场有价证券指数
9 (3) Cov( yi , y j ) = 0 i j 2-5.参数估计量的无偏性和有效性的含义是什么?从参数估计量的无偏性和有效性证明过 程说明,为什么说满足基本假设的计量经济学模型的普通最小二乘参数估计量才具有无偏性 和有效性? 2-6.对于过原点回归模型 Yi = 1Xi + ui ,试证明 = 2 2 1 ( ) i u X Var 2-7. 试证明: (1) ei = 0 ,从而: e = 0 (2) ei xi = 0 (3) = 0 i Yi e ;即残差 i e 与 Yi 的估计值之积的和为零。 2-8.为什么在一元线性方程中,最小二乘估计量与极大似然估计量的表达式是一致的?证 明:σ2 的 ML 估计量为 = = n i i n 1 2 ~ 2 1 ,并且是有偏的。 2-9.熟悉 t 统计量的计算方法和查表判断。 2-10.证明: 2 2 ( ) yx R = r ;其中 R 2 是一元线性回归模型的判定系数, yx r 是 y 与 x 的相关 系数。 2-11. 试根据置信区间的概念解释 t 检验的概率意义,即证明:对于显著性水平α,当 2 t t i 时,bi 的 100(1-α)%的置信区间不包含 0。 2-12.线性回归模型 yt = + xt + t t = 1,2, ,n 的 0 均值假设是否可以表示为 1 0 1 n t t n = = ?为什么? 2-13.现代投资分析的特征线涉及如下回归方程: t mt ut r = 0 + 1 r + ;其中:r 表示股票 或债券的收益率;rm 表示有价证券的收益率(用市场指数表示,如标准普尔 500 指数);t 表示时间。在投资分析中,β1 被称为债券的安全系数β,是用来度量市场的风险程度的, 即市场的发展对公司的财产有何影响。依据 1956~1976 年间 240 个月的数据,Fogler 和 Ganpathy 得到 IBM 股票的回归方程;市场指数是在芝加哥大学建立的市场有价证券指数:
rt=0.7264+1.0598rm =04710 (0.3001)(00728 要求:(1)解释回归参数的意义;(2)如何解释r2?(3)安全系数B>1的证券称为不稳定 证券,建立适当的零假设及备选假设,并用t检验进行检验(a=5%)。 214.已知模型x=a+R+b,证明:估计量a可以表示为:a=∑(-),这 里W, ∑ 2-15.已知两个量X和Y的一组观察值(x,y),i=1,2,…,n 证明:Y的真实值和拟合值有共同的均值 2-16.一个消费分析者论证了消费函数C,=a+b是无用的,因为散点图上的点(C,,E,) 不在直线C1=a+b}上。他还注意到,有时Y上升但C下降。因此他下结论:C1不是Y 的函数。请你评价他的论据(这里C1是消费,Y1是收入) 2-17.证明:仅当R2=1时,y对x的线性回归的斜率估计量等于x对y的线性回归的斜率 估计量的倒数。 2-18.证明:相关系数的另一个表达式是:r=B。x其中β为一元线性回归模型一次项 系数的估计值,Sx、Sy分别为样本标准差。 2-19.对于经济计量模型:Y=b+bX1+l1,其OLS估计参数b1的特性在下列情况下 会受到什么影响:(1)观测值数目n增加;(2)Ⅺi各观测值差额增加:;(3)Xi各观测值近 似相等;(4)E(u2)=0。 220.假定有如下的回归结果:=26911-04795X,其中,Y表示美国的咖啡的消费 量(每天每人消费的杯数),Ⅹ表示咖啡的零售价格(美元/杯),t表示时间。 要求 (1)这是一个时间序列回归还是横截面序列回归?做出回归线 (2)如何解释截距的意义,它有经济含义吗?如何解释斜率? (3)能否求出真实的总体回归函数?
10 mt rt = 0.7264 +1.0598r 0.4710 2 r = (0.3001) (0.0728) 要求:(1)解释回归参数的意义;(2)如何解释 r 2?(3)安全系数β>1 的证券称为不稳定 证券,建立适当的零假设及备选假设,并用 t 检验进行检验(α=5%)。 2-14. 已知模型 i i ui Y = + x + ,证明:估计量 α 可以表示为: i i n i xW y n ) 1 ( 1 = − = 这 里 • • = 2 i i i x x W 2-15.已知两个量 X 和 Y 的一组观察值(xi,yi),i=1,2,…,n。 证明:Y 的真实值和拟合值有共同的均值。 2-16.一个消费分析者论证了消费函数 Ci = a + bYi 是无用的,因为散点图上的点( Ci ,Yi ) 不在直线 Ci = a + bYi 上。他还注意到,有时 Yi 上升但 Ci 下降。因此他下结论:Ci 不是 Yi 的函数。请你评价他的论据(这里 Ci 是消费,Yi 是收入)。 2-17.证明:仅当 R 2=1 时,y 对 x 的线性回归的斜率估计量等于 x 对 y 的线性回归的斜率 估计量的倒数。 2-18.证明:相关系数的另一个表达式是: y x S S r = 其中 为一元线性回归模型一次项 系数的估计值,Sx、Sy 分别为样本标准差。 2-19.对于经济计量模型: Yi = b0 + b1Xi + ui ,其 OLS 估计参数 1 b 的特性在下列情况下 会受到什么影响:(1)观测值数目 n 增加;(2)Xi 各观测值差额增加;(3)Xi 各观测值近 似相等;(4)E(u 2)=0 。 2-20.假定有如下的回归结果: Yt 4795Xt = 2.6911− 0. ,其中,Y 表示美国的咖啡的消费 量(每天每人消费的杯数),X 表示咖啡的零售价格(美元/杯),t 表示时间。 要求: (1)这是一个时间序列回归还是横截面序列回归?做出回归线; (2)如何解释截距的意义,它有经济含义吗?如何解释斜率? (3)能否求出真实的总体回归函数?