第四章经典单方程计量经济学模型:放宽基本假定的模型 、内容提要 本章主要介绍计量经济模型的二级检检验问题,即计量经济检验。主要讨论对回归模 型的若干基本经典假定是否成立进行检验、当检验发现不成立时继续采用OLS估计模型所 带来的不良后果以及如何修正等问题。具体包括异方差性问题、序列相关性问题、多重共线 性问题以及随机解释变量这四大类问题。 异方差是模型随机扰动项的方差不同时产生的一类现象。在异方差存在的情况下,OLS 估计尽管是无偏、一致的,但通常的假设检验却不再可靠,这时仍采用通常的t检验和F检 验,则有可能导致出现错误的结论。同样地,由于随机项异方差的存在而导致的参数估计值 的标准差的偏误,也会使采用模型的预测变得无效。对模型的异方差性有若干种检测方法, 如图示法、Park与 Gleiser检验法、 Goldfeld-uand检验法以及 White检验法等。而当检测 出模型确实存在异方差性时,通过采用加权最小二乘法进行修正的估计 序列相关性也是模型随机扰动项出现序列相关时产生的一类现象。与异方差的情形相类 似,在序列相关存在的情况下,OLS估计量仍具无偏性与一致性,但通常的假设检验不再 可靠,预测也变得无效。序列相关性的检测方法也有若干种,如图示法、回归检验法 Durbin- Watson检验法以及 Lagrange乘子检验法等。存在序列相关性时,修正的估计方法有 广义最小二乘法(GLS)以及广义差分法。 多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模 型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性, 这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的 参数的标准差往往较大,从而使得t-统计值减小,参数的显著性下降,导致某些本应存在于 模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模 型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检 验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共 线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。 当模型中的解释变量是随机解释变量时,需要区分三种类型:随机解释变量与随机扰 动项独立,随机解释变量与随机扰动项同期无关、但异期相关,随机解释变量与随机扰动项
第四章 经典单方程计量经济学模型:放宽基本假定的模型 一、内容提要 本章主要介绍计量经济模型的二级检检验问题,即计量经济检验。主要讨论对回归模 型的若干基本经典假定是否成立进行检验、当检验发现不成立时继续采用 OLS 估计模型所 带来的不良后果以及如何修正等问题。具体包括异方差性问题、序列相关性问题、多重共线 性问题以及随机解释变量这四大类问题。 异方差是模型随机扰动项的方差不同时产生的一类现象。在异方差存在的情况下,OLS 估计尽管是无偏、一致的,但通常的假设检验却不再可靠,这时仍采用通常的 t 检验和 F 检 验,则有可能导致出现错误的结论。同样地,由于随机项异方差的存在而导致的参数估计值 的标准差的偏误,也会使采用模型的预测变得无效。对模型的异方差性有若干种检测方法, 如图示法、Park 与 Gleiser 检验法、Goldfeld-Quandt 检验法以及 White 检验法等。而当检测 出模型确实存在异方差性时,通过采用加权最小二乘法进行修正的估计。 序列相关性也是模型随机扰动项出现序列相关时产生的一类现象。与异方差的情形相类 似,在序列相关存在的情况下,OLS 估计量仍具无偏性与一致性,但通常的假设检验不再 可靠,预测也变得无效。序列相关性的检测方法也有若干种,如图示法、回归检验法、 Durbin-Watson 检验法以及 Lagrange 乘子检验法等。存在序列相关性时,修正的估计方法有 广义最小二乘法(GLS)以及广义差分法。 多重共线性是多元回归模型可能存在的一类现象,分为完全共线与近似共线两类。模 型的多个解释变量间出现完全共线性时,模型的参数无法估计。更多的情况则是近似共线性, 这时,由于并不违背所有的基本假定,模型参数的估计仍是无偏、一致且有效的,但估计的 参数的标准差往往较大,从而使得 t-统计值减小,参数的显著性下降,导致某些本应存在于 模型中的变量被排除,甚至出现参数正负号方面的一些混乱。显然,近似多重共线性使得模 型偏回归系数的特征不再明显,从而很难对单个系数的经济含义进行解释。多重共线性的检 验包括检验多重共线性是否存在以及估计多重共线性的范围两层递进的检验。而解决多重共 线性的办法通常有逐步回归法、差分法以及使用额外信息、增大样本容量等方法。 当模型中的解释变量是随机解释变量时,需要区分三种类型:随机解释变量与随机扰 动项独立,随机解释变量与随机扰动项同期无关、但异期相关,随机解释变量与随机扰动项
同期相关。第一种类型不会对OLS估计带来任何问题。第二种类型则往往导致模型估计的 有偏性,但随着样本容量的增大,偏误会逐渐减小,因而具有一致性。所以,扩大样本容量 是克服偏误的有效途径。第三种类型的OLS估计则既是有偏、也是非一致的,需要采用工 具变量法来加以克服 二、典型例题分析 1、下列哪种情况是异方差性造成的结果? (1)OLS估计量是有偏的 (2)通常的t检验不再服从t分布 (3)OLS估计量不再具有最佳线性无偏性。 解答 第(2)与(3)种情况可能由于异方差性造成。异方差性并不会引起ωLS估计量出现偏误 2、已知模型 Y=Bo+BX+B2x 式中,Y、X1、X2和Z的数据已知。假设给定权数w,,加权最小二乘法就是求下式中的各 B,以使的该式最小 ∑(wx,)2=∑-R,-Bw,X1-B2w,X2) (1)求RSS对β1、阝2和β2的偏微分并写出正规方程 (2)用Z去除原模型,写出所得新模型的正规方程组。 (3)把w1=1/Z,带入(1)中的正规方程,并证明它们和在(2)中推导的结果一样。 解答 (1)由RSS=∑1)2=∑(-Bw,-B,X1-B,k2)2对各B求偏导得如 下正规方程组: ∑(0n,y-Bv,-B,X1-B2X2)n,=0 >Ow, Y,-Bow, -, w, X-B,w, X2 )w, X,=0 >(w, Y,-Bow, -B,w, X1-B2w, x2 )w, X=0 (2)用Z去除原模型,得如下新模型
同期相关。第一种类型不会对 OLS 估计带来任何问题。第二种类型则往往导致模型估计的 有偏性,但随着样本容量的增大,偏误会逐渐减小,因而具有一致性。所以,扩大样本容量 是克服偏误的有效途径。第三种类型的 OLS 估计则既是有偏、也是非一致的,需要采用工 具变量法来加以克服。 二、典型例题分析 1、下列哪种情况是异方差性造成的结果? (1)OLS 估计量是有偏的 (2)通常的 t 检验不再服从 t 分布。 (3)OLS 估计量不再具有最佳线性无偏性。 解答: 第(2)与(3)种情况可能由于异方差性造成。异方差性并不会引起 OLS 估计量出现偏误。 2、已知模型 Yt = 0 + 1X1t + 2X2t + ut 2 2 2 ( ) Var ut = t = Zt 式中,Y、X1、X2 和 Z 的数据已知。假设给定权数 wt ,加权最小二乘法就是求下式中的各 β,以使的该式最小 2 0 1 1 2 2 2 ( ) ( ) RSS = wtut = wtYt − wt − wt X t − wt X t (1)求 RSS 对1、2 和2 的偏微分并写出正规方程。 (2)用 Z 去除原模型,写出所得新模型的正规方程组。 (3)把 wt Zt = 1/ 带入(1)中的正规方程,并证明它们和在(2)中推导的结果一样。 解答: (1)由 2 0 1 1 2 2 2 ( ) ( ) RSS = wtut = wtYt − wt − wt X t − wt X t 对各β求偏导得如 下正规方程组: (wtYt − 0wt − 1wt X1t − 2wt X2t )wt = 0 (wtYt − 0wt − 1wt X1t − 2wt X2t )wt X1t = 0 (wtYt − 0wt − 1wt X1t − 2wt X2t )wt X1t = 0 (2)用 Z 去除原模型,得如下新模型
Y-Bo+B7+B2z,z, 对应的正规方程组如下所示: B1-B2 Y B X X. X B1--B2-)2=0 B1--B2-) (3)如果用一代替(1)中的,则容易看到与(2)中的正规方程组是一样的 3、已知模型 =B+B1X1+B2X2+l1 式中,为某公司在第i个地区的销售额:x1为该地区的总收入:X21为该公司在该地区 投入的广告费用(i=0,1,2 (1)由于不同地区人口规模P可能影响着该公司在该地区的销售,因此有理由怀疑随 机误差项山是异方差的。假设σ,依赖于总体P的容量,请逐步描述你如何对此进行检验 需说明:1)零假设和备择假设;2)要进行的回归;3)要计算的检验统计值及它的分布(包 括自由度):4)接受或拒绝零假设的标准。 (2)假设σ=σP。逐步描述如何求得BLUE并给出理论依据 解答: (1)如果σ依赖于总体P的容量,则随机扰动项的方差σ2依赖于P2。因此,要进 行的回归的一种形式为a2=a+a1P2+E;。于是,要检验的零假设H:ax1=0,备择 假设Hl:a1≠0。检验步骤如下: 第一步:使用OLS方法估计模型,并保存残差平方项2 第二步:做e2对常数项C和P2的回归 第三步:考察估计的参数a1的t统计量,它在零假设下服从自由度为2的t分布。 第四步:给定显著性水平面0.05(或其他),查相应的自由度为2的t分布的临界值, 如果估计的参数a1的t统计值大于该临界值,则拒绝同方差的零假设
t t t t t t t t t Z u Z X Z X Z Z Y = + + + 2 2 1 1 0 对应的正规方程组如下所示: 0 1 ( ) 2 2 1 1 0 − − − = t t t t t t t t Z Z X Z X Z Z Y ( ) 0 2 1 2 1 1 0 − − − = t t t t t t t t t Z X Z X Z X Z Z Y ( ) 0 2 2 2 1 1 0 − − − = t t t t t t t t t Z X Z X Z X Z Z Y (3)如果用 1 Zt 代替(1)中的 wt ,则容易看到与(2)中的正规方程组是一样的。 3、已知模型 Yi = 0 + 1X1i + 2X2i + ui 式中, Yi 为某公司在第 i 个地区的销售额; X1i 为该地区的总收入; X 2i 为该公司在该地区 投入的广告费用(i=0,1,2……,50)。 (1)由于不同地区人口规模 Pi 可能影响着该公司在该地区的销售,因此有理由怀疑随 机误差项 ui 是异方差的。假设 i 依赖于总体 Pi 的容量,请逐步描述你如何对此进行检验。 需说明:1)零假设和备择假设;2)要进行的回归;3)要计算的检验统计值及它的分布(包 括自由度);4)接受或拒绝零假设的标准。 (2)假设 i = Pi 。逐步描述如何求得 BLUE 并给出理论依据。 解答: (1)如果 i 依赖于总体 Pi 的容量,则随机扰动项的方差 2 i 依赖于 2 Pi 。因此,要进 行的回归的一种形式为 i Pi i = + + 2 0 1 2 。于是,要检验的零假设 H0: 1 = 0 ,备择 假设 H1:1 0 。检验步骤如下: 第一步:使用 OLS 方法估计模型,并保存残差平方项 ~2 i e ; 第二步:做 ~2 i e 对常数项 C 和 2 Pi 的回归 第三步:考察估计的参数 1 的 t 统计量,它在零假设下服从自由度为 2 的 t 分布。 第四步:给定显著性水平面 0.05(或其他),查相应的自由度为 2 的 t 分布的临界值, 如果估计的参数 1 ˆ 的 t 统计值大于该临界值,则拒绝同方差的零假设
(2)假设σ.=OP时,模型除以P有: u Bo+B,+B, P PP 由于Wam(u1/P)=a2/P2=a2,所以在该变换模型中可以使用OLS方法,得出BLUE估 计值。方法是对Y/P关于1/P、X1/P、X21P做回归,不包括常数项。 4、以某地区22年的年度数据估计了如下工业就业回归方程 Y=-389+0.5hx1-0.25hX2+0.62nX3 (-0.56)(2.3) (-1.7) R=0.996 DW=1.147 式中,Y为总就业量:X1为总收入:X2为平均月工资率;X3为地方政府的总支出 (1)试证明:一阶自相关的DW检验是无定论的 2)逐步描述如何使用LM检验 解答: )由于样本容量n=22,解释变量个数为k=3,在5%在显著性水平下,相应的上下临 界值为d=1.664、d1=1.503。由于DW=1.147位于这两个值之间,所以DW检验是无 定论的 (2)进行LM检验 第一步,做Y关于常数项、lnX1、lnX2和lnX3的回归并保存残差e,; 第二步,做E关于常数项、lnX1、lX2和lnX3和E的回归并计算R2; 第三步,计算检验统计值(n-l)R=21×0.996=20.916; 第四步,由于在不存在一阶序列相关的零假设下(n-1)R2呈自由度为1的x2分布。在5% 的显著性水平下,该分布的相应临界值为3.841。由于20.916>3.841,因此拒绝零假设,意 味着原模型随机扰动项存在一阶序列相关 5、某地区供水部门利用最近15年的用水年度数据得出如下估计模型: water=-3269+0.305/ouse+0.363pop-0.005pcy-1787prce-1.123uin (-1.7)(0.9) (1.4) R2=0.93 F=38.9 式中, water—一用水总量(百万立方米), house—一住户总数(千户),pop-总人口(千 人),pcy-一人均收入(元), price-一价格(元/100立方米),rain-一降雨量(毫米)
(2)假设 i = Pi 时,模型除以 Pi 有: i i i i i i i i i P u P X P X P P Y = + + + 2 2 1 0 1 1 由于 2 2 2 Var(ui / Pi ) = i / Pi = ,所以在该变换模型中可以使用 OLS 方法,得出 BLUE 估 计值。方法是对 Yi Pi / 关于 Pi 1/ 、 X i Pi / 1 、 X i Pi / 2 做回归,不包括常数项。 4、以某地区 22 年的年度数据估计了如下工业就业回归方程 1 2 3 Y = −3.89 + 0.51ln X − 0.25ln X + 0.62ln X (-0.56)(2.3) (-1.7) (5.8) 2 R = 0.996 DW =1.147 式中,Y 为总就业量;X1 为总收入;X2 为平均月工资率;X3 为地方政府的总支出。 (1)试证明:一阶自相关的 DW 检验是无定论的。 (2)逐步描述如何使用 LM 检验 解答: (1)由于样本容量 n=22,解释变量个数为 k=3,在 5%在显著性水平下,相应的上下临 界值为 dU = 1.664、dL =1.503 。由于 DW=1.147 位于这两个值之间,所以 DW 检验是无 定论的。 (2)进行 LM 检验: 第一步,做 Y 关于常数项、lnX1、lnX2 和 lnX3 的回归并保存残差 t e ~ ; 第二步,做 t e ~ 关于常数项、lnX1、lnX2 和 lnX3 和 1 ~ t− e 的回归并计算 2 R ; 第三步,计算检验统计值(n-1) 2 R =210.996=20.916; 第四步,由于在不存在一阶序列相关的零假设下(n-1) 2 R 呈自由度为 1 的 2 分布。在 5% 的显著性水平下,该分布的相应临界值为 3.841。由于 20.916>3.841,因此拒绝零假设,意 味着原模型随机扰动项存在一阶序列相关。 5、某地区供水部门利用最近 15 年的用水年度数据得出如下估计模型: water = −326.9 + 0.305house + 0.363pop − 0.005pcy −17.87 price −1.123rain (-1.7) (0.9) (1.4) (-0.6) (-1.2) (-0.8) 0.93 2 R = F=38.9 式中,water——用水总量(百万立方米),house——住户总数(千户),pop——总人口(千 人),pcy——人均收入(元),price——价格(元/100 立方米),rain——降雨量(毫米)
(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量),为什么?观察符 号与你的直觉相符吗? (2)在10%的显著性水平下,请进行变量的t-检验与方程的F-检验。T检验与F检验结 果有相矛盾的现象吗? 3)你认为估计值是(1)有偏的:(2)无效的或(3)不一致的吗?详细阐述理由 解答: (1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越 高。所以可期望 house和pop的符号为正;收入较高的个人可能用水较多,因此pcy的预期 符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期 price 的系数为负。显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可 以期望rain的系数符号为负。从估计的模型看,除了pcy之外,所有符号都与预期相符 (2)t-统计量检验单个变量的显著性,F-统计值检验变量是否是联合显著的 这里t-检验的自由度为15-5-1=9,在10%的显著性水平下的临界值为1.833。可见,所 有参数估计值的t值的绝对值都小于该值,所以即使在10%的水平下这些变量也不是显著的。 这里,F-统计值的分子自由度为5,分母自由度为9。10%显著性水平下F分布的临界值 为2.61。可见计算的F值大于该临界值,表明回归系数是联合显著的 T检验与F检验结果的矛盾可能是由于多重共线性造成的。 house、pop、pey都是高度 相关的,这将使它们的t-值降低且表现为不显著。 prIce和rain不显著另有原因。根据经 验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能够很好 地被度量。可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影响很难度 (3)多重共线性往往表现的是解释变量间的样本观察现象,在不存在完全共线性的情况 下,近似共线并不意味着基本假定的任何改变,所以0LS估计量的无偏性、一致性和有效性 仍然成立,即仍是BLUE估计量。但共线性往往导致参数估计值的方差大于不存在多重共线 性的情况。 6、一个对某地区大学生就业增长影响的简单模型可描述如下 gEMP=Po+BigMN+B2gPOP+B,gGDP+ B4gGDP+A 式中,为新就业的大学生人数,MN1为该地区最低限度工资,POP为新毕业的大学生人数 GDPl为该地区国内生产总值,GDP为该国国内生产总值;g表示年增长率。 (1)如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为 基础来选择最低限度工资,则OLS估计将会存在什么问题? (2)令MN为该国的最低限度工资,它与随机扰动项相关吗? (3)按照法律,各地区最低限度工资不得低于国家最低工资,哪么gMN能成为 gMINI 的工具变量吗? 解答: (1)由于地方政府往往是根据过去的经验、当前的经济状况以及期望的经济发展前景 来定制地区最低限度工资水平的,而这些因素没有反映在上述模型中,而是被归结到了模型
(1)根据经济理论和直觉,请计回归系数的符号是什么(不包括常量),为什么?观察符 号与你的直觉相符吗? (2)在 10%的显著性水平下,请进行变量的 t-检验与方程的 F-检验。T 检验与 F 检验结 果有相矛盾的现象吗? (3)你认为估计值是(1)有偏的;(2)无效的或(3)不一致的吗?详细阐述理由。 解答: (1)在其他变量不变的情况下,一城市的人口越多或房屋数量越多,则对用水的需求越 高。所以可期望 house 和 pop 的符号为正;收入较高的个人可能用水较多,因此 pcy 的预期 符号为正,但它可能是不显著的。如果水价上涨,则用户会节约用水,所以可预期 price 的系数为负。显然如果降雨量较大,则草地和其他花园或耕地的用水需求就会下降,所以可 以期望 rain 的系数符号为负。从估计的模型看,除了 pcy 之外,所有符号都与预期相符。 (2)t-统计量检验单个变量的显著性,F-统计值检验变量是否是联合显著的。 这里 t-检验的自由度为 15-5-1=9,在 10%的显著性水平下的临界值为 1.833。可见,所 有参数估计值的 t 值的绝对值都小于该值,所以即使在 10%的水平下这些变量也不是显著的。 这里,F-统计值的分子自由度为 5,分母自由度为 9。10%显著性水平下 F 分布的临界值 为 2.61。可见计算的 F 值大于该临界值,表明回归系数是联合显著的。 T 检验与 F 检验结果的矛盾可能是由于多重共线性造成的。house、pop、pcy 都是高度 相关的,这将使它们的 t-值降低且表现为不显著。price 和 rain 不显著另有原因。根据经 验,如果一个变量的值在样本期间没有很大的变化,则它对被解释变量的影响就不能够很好 地被度量。可以预期水价与年降雨量在各年中一般没有太大的变化,所以它们的影响很难度 量。 (3)多重共线性往往表现的是解释变量间的样本观察现象,在不存在完全共线性的情况 下,近似共线并不意味着基本假定的任何改变,所以 OLS 估计量的无偏性、一致性和有效性 仍然成立,即仍是 BLUE 估计量。但共线性往往导致参数估计值的方差大于不存在多重共线 性的情况。 6、一个对某地区大学生就业增长影响的简单模型可描述如下 gEMPt = 0 + 1gMIN1t + 2 gPOP + 3 gGDP1t + 4 gGDPt + t 式中,为新就业的大学生人数,MIN1 为该地区最低限度工资,POP 为新毕业的大学生人数, GDP1 为该地区国内生产总值,GDP 为该国国内生产总值;g 表示年增长率。 (1)如果该地区政府以多多少少不易观测的却对新毕业大学生就业有影响的因素作为 基础来选择最低限度工资,则 OLS 估计将会存在什么问题? (2)令 MIN 为该国的最低限度工资,它与随机扰动项相关吗? (3)按照法律,各地区最低限度工资不得低于国家最低工资,哪么 gMIN 能成为 gMIN1 的工具变量吗? 解答: (1)由于地方政府往往是根据过去的经验、当前的经济状况以及期望的经济发展前景 来定制地区最低限度工资水平的,而这些因素没有反映在上述模型中,而是被归结到了模型
的随机扰动项中,因此gMNI与μ不仅异期相关,而且往往是同期相关的,这将引起OLS 估计量的偏误,甚至当样本容量增大时也不具有一致性。 (2)全国最低限度的制定主要根据全国国整体的情况而定,因此gMN基本与上述模 型的随机扰动项无关。 (3)由于地方政府在制定本地区最低工资水平时往往考虑全国的最低工资水平的要求, 因此gMIN1与gMN具有较强的相关性。结合(2)知gMIN可以作为gMNl的工具变量 使用 、习题 (一)基本知识类题型 4-1.解释下列概念: (1)异方差性 (6)不完全多重共线性 (2)序列相关性 (7)随机解释变量 (3)多重共线性 (8)差分法 (4)偏回归系数 (9)广义最小二乘法 (5)完全多重共线性 (10)DW检验 4-2.判断下列各题对错,并简单说明理由 1)在存在异方差情况下,普通最小二乘法(OLS)估计量是有偏的和无效的 2)如果存在异方差,通常使用的t检验和F检验是无效的 3)在存在异方差情况下,常用的OLS法总是高估了估计量的标准差; 4)如果从OLS回归中估计的残差呈现系统模式,则意味着数据中存在着异方差; 5)当存在序列相关时,OLS估计量是有偏的并且也是无效的 6)消除序列相关的一阶差分变换假定自相关系数尸必须等于1; ⑦)两个模型,一个是一阶差分形式,一个是水平形式,这两个模型的R2值是不可以直接 比较的 8)回归模型中误差项u,存在异方差时,OLS估计不再是有效的 9)回归模型中误差项u,存在序列相关时,OLS估计不再是无偏的 4-3.简述异方差对下列各项有何影响:(1)OLS估计量及其方差;(2)置信区间:(3)显
的随机扰动项中,因此 gMIN1 与不仅异期相关,而且往往是同期相关的,这将引起 OLS 估计量的偏误,甚至当样本容量增大时也不具有一致性。 (2)全国最低限度的制定主要根据全国国整体的情况而定,因此 gMIN 基本与上述模 型的随机扰动项无关。 (3)由于地方政府在制定本地区最低工资水平时往往考虑全国的最低工资水平的要求, 因此 gMIN1 与 gMIN 具有较强的相关性。结合(2)知 gMIN 可以作为 gMIN1 的工具变量 使用。 三、习题 (一)基本知识类题型 4-1.解释下列概念: (1)异方差性 (2)序列相关性 (3)多重共线性 (4)偏回归系数 (5)完全多重共线性 (6)不完全多重共线性 (7)随机解释变量 (8)差分法 (9)广义最小二乘法 (10)D.W.检验 4-2.判断下列各题对错,并简单说明理由: 1) 在存在异方差情况下,普通最小二乘法(OLS)估计量是有偏的和无效的; 2) 如果存在异方差,通常使用的 t 检验和 F 检验是无效的; 3) 在存在异方差情况下,常用的 OLS 法总是高估了估计量的标准差; 4) 如果从 OLS 回归中估计的残差呈现系统模式,则意味着数据中存在着异方差; 5) 当存在序列相关时,OLS 估计量是有偏的并且也是无效的; 6) 消除序列相关的一阶差分变换假定自相关系数 必须等于 1; 7) 两个模型,一个是一阶差分形式,一个是水平形式,这两个模型的 R 2 值是不可以直接 比较的。 8) 回归模型中误差项 t u 存在异方差时,OLS 估计不再是有效的; 9) 回归模型中误差项 t u 存在序列相关时,OLS 估计不再是无偏的; 4-3.简述异方差对下列各项有何影响:(1)OLS 估计量及其方差;(2)置信区间;(3)显
著性t检验和F检验的使用 4-4.在存在AR(1)自相关的情形下,什么估计方法能够产生BLUE估计量?简述这个方 法的具体步骤 (二)基本证明与问答类题型 4-5.在存在AR(1)的情形下,估计自相关参数p有哪些不同的方法? 46.在如下回归中,你是否预期存在着异方差? 样本 a)公司利润 净财富 《财富》500强 b)公司利润 《财富》500强 c)道琼斯工业平均指数 时间 1960~1990年(年平均) d)婴儿死亡率 人均收入 100个发达国家和发展中国家 e)通货膨胀率 「货币增长率 「美国、加拿大和15个拉美国家 4-7.已知消费模型:y2=a0+a1x1n+a2x2+l1 其中:y1-—消费支出 个人可支配收入 一消费者的流动资产 E(u2)=0 r(u1)=a2x2(其中2为常数) 要求: (1)进行适当变换消除异方差,并证明之: (2)写出消除异方差后,模型的参数估计量的表达式。 4-8.什么是异方差性?举例说明经济现象中的异方差性。检验异方差性的方法思路是什么? 4-9.什么是序列相关性?举例说明经济现象中序列相关性的存在。检验序列相关性的方法 思路是什么?熟悉DW统计量的计算方法和查表判断。 4-10.什么是多重共线性?产生多重共线性的经济背景是什么?多重共线性的危害是什么? 为什么会造成这些危害?检验多重共线性的方法思路是什么?有哪些克服方法? 4-1].随杋解释变量的来源有哪些?随机解释变量可以造成哪些结果? 4-12.当模型中出现随机解释变量时,最小二乘估计量具有什么特征 4-13.试比较说明普通最小二乘法与加权最小二乘法的区别与联系
著性 t 检验和 F 检验的使用。 4-4.在存在 AR(1)自相关的情形下,什么估计方法能够产生 BLUE 估计量?简述这个方 法的具体步骤。 (二)基本证明与问答类题型 4-5.在存在 AR(1)的情形下,估计自相关参数 有哪些不同的方法? 4-6.在如下回归中,你是否预期存在着异方差? Y X 样本 a) 公司利润 净财富 《财富》500 强 b) 公司利润的对数 净财富的对数 《财富》500 强 c) 道琼斯工业平均指数 时间 1960~1990 年(年平均) d) 婴儿死亡率 人均收入 100 个发达国家和发展中国家 e) 通货膨胀率 货币增长率 美国、加拿大和 15 个拉美国家 4-7.已知消费模型: t t t ut y = 0 +1 x1 + 2 x2 + 其中: t y ——消费支出 t x1 ——个人可支配收入 t x2 ——消费者的流动资产 E(ut ) = 0 Var (ut ) = 2 x1 2 t (其中 2为常数) 要求: (1)进行适当变换消除异方差,并证明之; (2)写出消除异方差后,模型的参数估计量的表达式。 4-8.什么是异方差性?举例说明经济现象中的异方差性。检验异方差性的方法思路是什么? 4-9.什么是序列相关性?举例说明经济现象中序列相关性的存在。检验序列相关性的方法 思路是什么?熟悉 D.W.统计量的计算方法和查表判断。 4-10.什么是多重共线性?产生多重共线性的经济背景是什么?多重共线性的危害是什么? 为什么会造成这些危害?检验多重共线性的方法思路是什么?有哪些克服方法? 4-11.随机解释变量的来源有哪些?随机解释变量可以造成哪些结果? 4-12.当模型中出现随机解释变量时,最小二乘估计量具有什么特征? 4-13.试比较说明普通最小二乘法与加权最小二乘法的区别与联系
4-14.估计量的渐近统计性质的含义是什么?什么是渐近无偏性? 4-15.什么是估计的一致性?证明对于工具变量法的估计量B是B的一致估计 4-16.为什么回归残差序列可以作为检验线性回归模型误差项的各种问题的基础? 4-17.对于线性回归模型:y=+月x1+u1,已知l为一阶自回归形式:1=pm1-1+E1, e,e 要求:证明p的估计值为:p≈ 4-18.证明下面方程中的误差项v是同方差的。 月()+B2()=B1()+B2+v,其中:v=u41/X1 (三)基本计算类题型 4-19.某上市公司的子公司的年销售额Y1与其总公司年销售额X1的观测数据如下表: 序号 序号 130.021.40 1464 132.721.96 1502|25.00 1294 22.76 27.5 142823.66 165.6 24.10 16872824 145.32401 717 要求 (1)用最小二乘法估计Y关于X的回归方程; (2)用DW检验分析随机项的一阶自相关性 (3)用 Durbin两步法估计回归模型的参数 (4)直接用差分法估计回归模型的参数 4-20.下表是被解释变量Y及解释变量X1、X2、X3、X4的时间序列观测值: 8.0 347.549252.358061.362.564.766.8 5.54.75.26.8738.710.214.117.121.3
4-14.估计量的渐近统计性质的含义是什么?什么是渐近无偏性? 4-15.什么是估计的一致性?证明对于工具变量法的估计量 是 的一致估计。 4-16.为什么回归残差序列可以作为检验线性回归模型误差项的各种问题的基础? 4-17.对于线性回归模型: Yt = 0 + 1Xt +ut ,已知 u 为一阶自回归形式: ut ut t = + −1 , 要求:证明 的估计值为: = − = − n t t n t t t e e e 2 2 1 2 1 4-18.证明下面方程中的误差项 i 是同方差的。 i i i i i i i X X u X X Y = 1 + 2 = 1 ) + 2 + 1 ) ( ) ( 1 ( , 其中: i = ui Xi (三)基本计算类题型 4-19.某上市公司的子公司的年销售额 Yt 与其总公司年销售额 Xt 的观测数据如下表: 序号 X Y 序号 X Y 1 127.3 20.96 11 148.3 24.54 2 130.0 21.40 12 146.4 24.30 3 132.7 21.96 13 150.2 25.00 4 129.4 21.52 14 153.1 25.64 5 135.0 22.39 15 157.3 26.36 6 137.1 22.76 16 160.7 26.98 7 141.2 23.48 17 164.2 27.52 8 142.8 23.66 18 165.6 27.78 9 145.5 24.10 19 168.7 28.24 19 145.3 24.01 20 171.7 28.78 要求: (1)用最小二乘法估计 Yt 关于 Xt 的回归方程; (2)用 D.W.检验分析随机项的一阶自相关性; (3)用 Durbin 两步法估计回归模型的参数; (4)直接用差分法估计回归模型的参数. 4-20.下表是被解释变量 Y 及解释变量 X1、X2、X3、X4 的时间序列观测值: Y 6.0 6.0 6.5 7.1 7.2 7.6 8.0 9.0 9.0 9.3 X1 40.1 40.3 47.5 49.2 52.3 58.0 61.3 62.5 64.7 66.8 X2 5.5 4.7 5.2 6.8 7.3 8.7 10.2 14.1 17.1 21.3
94108100 991019793102 X4637286100107111114116119121 要求 (1)采用适当的方法检验多重共线性 (2)多重共线性对参数估计值有何影响? (3)用修正 Frisch法确定一个较好的回归模型 4-21.下表是某种商品的需求量、价格以及消费者收入的统计资料: 2345678。10 需求量Y3.54350607.09080 价格X 要求: (1)检验X1和Ⅹ2是否存在严重的多重共线性? (2)如何解决或减轻多重共线性的影响,并给出这一问题的回归方程。 422.对于模型:Y=B1+B2X1+t1 要求 (1)如果用变量的一次差分估计该模型,采用何种自相关形式? (2)用差分估计时,并不删除截距,其含义是什么? (3)假设模型存在一阶自相关,如果用OLS法估计,试证明其估计式:B2=2仍然 是无偏的,式中的x1=X1-X,y=Y1-Y。 (4)试证明ar(B2)=a 不是有效的 4-23.某国的政府税收T(单位:百万美元)、国内生产总值GDP(单位:10亿美元)和汽 车数量Z(单位:百万辆)的观测数据如下表所示: 序号 GDP 6
X3 108 94 108 100 99 99 101 97 93 102 X4 63 72 86 100 107 111 114 116 119 121 要求: (1)采用适当的方法检验多重共线性; (2)多重共线性对参数估计值有何影响? (3)用修正 Frisch 法确定一个较好的回归模型。 4-21.下表是某种商品的需求量、价格以及消费者收入的统计资料: 年份 1 2 3 4 5 6 7 8 9 10 需求量 Y 3.5 4.3 5.0 6.0 7.0 9.0 8.0 10 12 14 价格 X1 16 13 10 7 7 5 4 3 3.5 2 收入 X2 15 20 30 42 50 54 65 72 85 90 要求: (1)检验 X1 和 X2 是否存在严重的多重共线性? (2)如何解决或减轻多重共线性的影响,并给出这一问题的回归方程。 4-22.对于模型: Yt = 1 + 2Xt + u1t 要求: (1)如果用变量的一次差分估计该模型,采用何种自相关形式? (2)用差分估计时,并不删除截距,其含义是什么? (3)假设模型存在一阶自相关,如果用 OLS 法估计,试证明其估计式: = 2 2 i i i x x y 仍然 是无偏的,式中的 xi = Xi − X , yi = Yi −Y 。 (4)试证明 = 2 2 2 1 ( ) i x Var 不是有效的。 4-23.某国的政府税收 T(单位:百万美元)、国内生产总值 GDP(单位:10 亿美元)和汽 车数量 Z(单位:百万辆)的观测数据如下表所示: 序号 T GDP Z 1 3 4 5 2 2 1 2 3 5 7 6 4 6 8 7 5 4 5 5 6 5 7 6
10 要求:试以汽车数量Z作为国内生产总值GDP的工具变量,估计税收函数: T=Po+B, GDP,+Er 4-24.继续习题3-21的讨论。问题如下 (1)假定做GMAT分数对GPA的回归分析,并且发现两变量之间显著正相关。那么,你 对多重共线性问题有何看法? (2)对习题3-21的(1)建立方差( ANOVA)分析表并检验假设:所有偏回归系数均为零。 (3)用R2值,对本题(2)建立ANOV表进行分析。 4-25.如果解释变量之间的相关系数为0,则称它们是正交的。对于模型 Y=Bo+B,X+B,x2+u 若X1与X2是正交的,证明下列结论 (1)多元线性回归的最小二乘估计量β1、B2分别等于Y对X1、Y对X2的一元线性回归 的最小二乘估计量; (2)多元回归的回归平方和为两个一元回归的回归平方和的和 4-26.假设Y为内生变量,X为外生变量,以下各组方程中哪些方程可以用 Durbin- Watson 方法检验一阶自相关: (DY=a,X+u Y2=a2x2+Br (2)Y1=B1Y,-1+utr B2 +a. (3)Y=a,X,+u X.+ 4-27.有5个解释变量的多元线性回归模型,用容量为93的样本数据进行回归分析。若根 据回归残差序列计算的DW值为1.1,应得出什么结论?若DW值为235呢? 4-28.若已知线性回归模型Y=B0+B1X1+B2X2+E的误差项的方差为a2=2X1-3
7 7 8 6 8 9 11 7 9 8 10 7 要求:试以汽车数量 Z 作为国内生产总值 GDP 的工具变量,估计税收函数: Tt GDPt t = + + 0 1 4-24.继续习题 3-21 的讨论。问题如下: (1)假定做 GMAT 分数对 GPA 的回归分析,并且发现两变量之间显著正相关。那么,你 对多重共线性问题有何看法? (2)对习题 3-21 的(1)建立方差(ANOVA)分析表并检验假设:所有偏回归系数均为零。 (3)用 R 2 值,对本题(2)建立 ANOVA 表进行分析。 4-25.如果解释变量之间的相关系数为 0,则称它们是正交的。对于模型: Yt = 0 + 1X1t + 2X2t + ut 若 X1 与 X2 是正交的,证明下列结论: (1)多元线性回归的最小二乘估计量 1 、 2 分别等于 Y 对 X1、Y 对 X2 的一元线性回归 的最小二乘估计量; (2)多元回归的回归平方和为两个一元回归的回归平方和的和。 4-26.假设 Y 为内生变量,X 为外生变量,以下各组方程中哪些方程可以用 Durbin—Watson 方法检验一阶自相关: (1) Y1t = 1X1t + u1t Y2t = 2X2t + Y1t + u2t (2) Y1t = 1Yt−1 + u1t t t t Y t Y 2X2( 1) u2 1) 2 = 2 ( + − + − (3) Y1t = 1X1t + u1t Y1t = 2X2t + u2t 4-27.有 5 个解释变量的多元线性回归模型,用容量为 93 的样本数据进行回归分析。若根 据回归残差序列计算的 D.W.值为 1.1,应得出什么结论?若 D.W.值为 2.35 呢? 4-28.若已知线性回归模型 = + + + Y 0 1X1 2X2 的误差项的方差为 2 1 3 2 i = X i −