北京外国语大学：《计量经济学》课程教学资源（典型例题分析）第二章经典单方程计量经济学模型（多元线性回归模型）.pdf_大学文库

第二章、经典单方程计量经济学模型：多元线性回归模型一、内容提要本章将一元回归模型拓展到了多元回归模型，其基本的建模思想与建模方法与一元的情形相同。主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。只不过为了多元建模的需要，在基本假设方面以及检验方面有所扩充。本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。与一元回归分析相比，多元回归分析的基本假设中引入了多个解释变量间不存在（完全）多重共线性这一假设：在检验部分，一方面引入了修正的可决系数，另一方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性F检验，并讨论了F检验与拟合优度检验的内在联系。本章的另一个重点是将线性回归模型拓展到非线性回归模型，主要学习非线性模型如何转化为线性回归模型的常见类型与方法。这里需要注意各回归参数的具体经济含义。本章第三个学习重点是关于模型的约束性检验问题，包括参数的线性约束与非线性约束检验。参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容，其中参数稳定性检验又包括邹氏参数稳定性检验与邹氏预测检验两种类型的检验。检验都是以F检验为主要检验工具，以受约束模型与无约束模型是否有显著差异为检验基点。参数的非线性约束检验主要包括最大似然比检验、沃尔德检验与拉格朗日乘数检验。它们仍以估计无约束模型与受约束模型为基础，但以最大似然原理进行估计，且都适用于大样本情形，都以约束条件个数为自由度的X分布为检验统计量的分布特征。非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。二、典型例题分析例1.某地区通过一个样本容量为722的调查数据得到劳动力受教育的一个回归方程为 Y=10.36-0.094X1+0.131X2+0.210X3 R2=0.214 式中，Y为劳动力受教育年数，X为该劳动力家庭中兄弟姐妹的个数，X,与X,分别为母

第二章、经典单方程计量经济学模型：多元线性回归模型一、内容提要本章将一元回归模型拓展到了多元回归模型，其基本的建模思想与建模方法与一元的情形相同。主要内容仍然包括模型的基本假定、模型的估计、模型的检验以及模型在预测方面的应用等方面。只不过为了多元建模的需要，在基本假设方面以及检验方面有所扩充。本章仍重点介绍了多元线性回归模型的基本假设、估计方法以及检验程序。与一元回归分析相比，多元回归分析的基本假设中引入了多个解释变量间不存在（完全）多重共线性这一假设；在检验部分，一方面引入了修正的可决系数，另一方面引入了对多个解释变量是否对被解释变量有显著线性影响关系的联合性 F 检验，并讨论了 F 检验与拟合优度检验的内在联系。本章的另一个重点是将线性回归模型拓展到非线性回归模型，主要学习非线性模型如何转化为线性回归模型的常见类型与方法。这里需要注意各回归参数的具体经济含义。本章第三个学习重点是关于模型的约束性检验问题，包括参数的线性约束与非线性约束检验。参数的线性约束检验包括对参数线性约束的检验、对模型增加或减少解释变量的检验以及参数的稳定性检验三方面的内容，其中参数稳定性检验又包括邹氏参数稳定性检验与邹氏预测检验两种类型的检验。检验都是以 F 检验为主要检验工具，以受约束模型与无约束模型是否有显著差异为检验基点。参数的非线性约束检验主要包括最大似然比检验、沃尔德检验与拉格朗日乘数检验。它们仍以估计无约束模型与受约束模型为基础，但以最大似然原理进行估计，且都适用于大样本情形，都以约束条件个数为自由度的 2 χ 分布为检验统计量的分布特征。非线性约束检验中的拉格朗日乘数检验在后面的章节中多次使用。二、典型例题分析例 1．某地区通过一个样本容量为 722 的调查数据得到劳动力受教育的一个回归方程为 1 2 210 3 Y = 10.36 − 0.094X + 0.131X + 0. X R2 =0.214 式中，Y 为劳动力受教育年数，X1为该劳动力家庭中兄弟姐妹的个数，X 2 与 X3分别为母

亲与父亲受到教育的年数。问 (1)X,是否具有预期的影响？为什么？若X,与X,保持不变，为了使预测的受教育水平减少一年，需要X,增加多少？ (2)请对X2的系数给予适当的解释。 (3)如果两个劳动力都没有兄弟姐妹，但其中一个的父母受教育的年数为12年，另一个的父母受教育的年数为16年，则两人受教育的年数预期相差多少？解答： (1)预期X,对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下，子女越多的家庭，每个孩子接受教育的时间会越短。根据多元回归模型偏回归系数的含义，X,前的参数估计值-0.094表明，在其他条件不变的情况下，每增加1个兄弟姐妹，受教育年数会减少0.094年，因此，要减少1年受教育的时间，兄弟姐妹需增加1/0.094=10.6个。 (2)X,的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时，母亲每增加1年受教育的机会，其子女作为劳动者就会预期增加0.131年的受教育机会。 (3)首先计算两人受教育的年数分别为 10.36+0.131×12+0.210×12=14.452 10.36+0.131×16+0.210×16=15.816 因此，两人的受教育年限的差别为15.816-14.452=1.364 例2.以企业研发支出(R&D)占销售额的比重为被解释变量(Y),以企业销售额(X,) 与利润占销售额的比重(X,)为解释变量，一个有32容量的样本企业的估计结果如下： Y=0.472+0.321og(X,)+0.05X2 (1.37)(0.22) (0.046) R2=0.099 其中括号中为系数估计值的标准差。 (1)解释log(X)的系数。如果X,增加10%，估计Y会变化多少个百分点？这在经济上是一个很大的影响吗？ (2)针对R&D强度随销售额的增加而提高这一备择假设，检验它不随X,而变化的假设。分别在5%和10%的显著性水平上进行这个检验。 (3)利润占销售额的比重X,对R&D强度Y是否在统计上有显著的影响？解答： (1)log(X,)的系数表明在其他条件不变时，1og(X)变化1个单位，Y变化的单位数

亲与父亲受到教育的年数。问（1）X1是否具有预期的影响？为什么？若 X 2 与 X3保持不变，为了使预测的受教育水平减少一年，需要 X1增加多少？（2）请对 X 2 的系数给予适当的解释。（3）如果两个劳动力都没有兄弟姐妹，但其中一个的父母受教育的年数为 12 年，另一个的父母受教育的年数为 16 年，则两人受教育的年数预期相差多少？解答：（1）预期 X1对劳动者受教育的年数有影响。因此在收入及支出预算约束一定的条件下，子女越多的家庭，每个孩子接受教育的时间会越短。根据多元回归模型偏回归系数的含义， X1前的参数估计值-0.094 表明，在其他条件不变的情况下，每增加 1 个兄弟姐妹，受教育年数会减少 0.094 年，因此，要减少 1 年受教育的时间，兄弟姐妹需增加 1/0.094=10.6 个。（2） X 2 的系数表示当兄弟姐妹数与父亲受教育的年数保持不变时，母亲每增加 1 年受教育的机会，其子女作为劳动者就会预期增加 0.131 年的受教育机会。（3）首先计算两人受教育的年数分别为 10.36+0.131×12+0.210×12=14.452 10.36+0.131×16+0.210×16=15.816 因此，两人的受教育年限的差别为 15.816-14.452=1.364 例 2．以企业研发支出（R&D）占销售额的比重为被解释变量（Y ），以企业销售额（ X1）与利润占销售额的比重（ X 2 ）为解释变量，一个有 32 容量的样本企业的估计结果如下： 0.099 (1.37) (0.22) (0.046) 0.472 0.32log( ) 0.05 2 1 2 = = + + R Y X X 其中括号中为系数估计值的标准差。（1）解释 log( X1 )的系数。如果 X1增加 10%，估计Y 会变化多少个百分点？这在经济上是一个很大的影响吗？（2）针对 R&D 强度随销售额的增加而提高这一备择假设，检验它不随 X1而变化的假设。分别在 5%和 10%的显著性水平上进行这个检验。（3）利润占销售额的比重 X 2 对 R&D 强度Y 是否在统计上有显著的影响？解答：（1）log( X1 )的系数表明在其他条件不变时，log( X1 )变化 1 个单位，Y 变化的单位数

即△Y=0.32△l0g(X,)0.32(△X,/X,)=0.32×100%,换言之，当企业销售X,增长100%时，企业研发支出占销售额的比重Y会增加0.32个百分点。由此，如果X,增加10%，Y会增加 0.032个百分点。这在经济上不是一个较大的影响。 (2)针对备择假设H:B,>0,检验原假设Ho:B,=0。易知计算的t统计量的值为=0.32/0.22=1.468。在5%的显著性水平下，自由度为32-3=29的t分布的临界值为1.699 (单侧)，计算的t值小于该临界值，所以不拒绝原假设。意味着R&D强度不随销售额的增加而变化。在10%的显著性水平下，t分布的临界值为1.311，计算的t值小于该值，拒绝原假设，意味着R&D强度随销售额的增加而增加。 (3)对X2,参数估计值的t统计值为0.05/0.46=1.087，它比在10%的显著性水平下的临界值还小，因此可以认为它对Y在统计上没有显著的影响。例3.表3-1为有关经批准的私人住房单位及其决定因素的4个模型的估计量和相关统计值（括号内为p-值）（如果某项为空，则意味着模型中没有此变量）。数据为美国40个城市的数据。模型如下： Y=Bo+Bx+Bx2+Bx3+BX +BX5+B6X6+B,X,+4 式中，Y为实际颁发的建筑许可证数量，X,每平方英里的人口密度，X,自有房屋的均值 (单位：百美元)，X,平均家庭的收入（单位：千美元)，X4为1980-1992年的人口增长百分比，X,失业率，X。人均交纳的地方税，X,人均缴纳的州税。表3-1 变量模型A 模型B 模型C 模型D C 813(0.74) -392(0.81) -1279(0.34) -973(0.44) X 0.075(0.43) 0.062(0.32) 0.042(0.47 X2 -0.855(0.13) -0.873(0.11) -0.994(0.06) -0.778(0.07 X3 110.41(0.14) 133.03(0.04) 125.71(0.05) 116.60(0.06) X 26.77(0.11) 29.19(0.06) 29.41(0.001) 24.86(0.08) X -76.55(0.48) Xo -0.061(0.95) X -1.006(0.40) -1.004(0.37 RSS 4.763E+7 4.843E+7 4.962E+7 5.038E+7 R2 0.349 0.338 0.322 0.312 62 1.488E+6 1.424E+6 1.418E+6 1.399E+6 AIC 1.776E+6 1.634E+6 1.593E+6 1.538E+6 (1)检验模型A中的每一个回归系数在10%水平下是否为零（括号中的值为p-值）。根据检验结果，你认为应该把变量保留在模型中还是去掉？

即∆Y =0.32∆log( X1 )≈0.32(∆ X1 / X1 )=0.32×100%，换言之，当企业销售 X1增长 100%时，企业研发支出占销售额的比重Y 会增加 0.32 个百分点。由此，如果 X1增加 10%，Y 会增加 0.032 个百分点。这在经济上不是一个较大的影响。（2）针对备择假设 H1： β1 > 0 ，检验原假设 H0： β1 = 0。易知计算的 t 统计量的值为 t=0.32/0.22=1.468。在 5%的显著性水平下，自由度为 32-3=29 的 t 分布的临界值为 1.699 （单侧），计算的 t 值小于该临界值，所以不拒绝原假设。意味着 R&D 强度不随销售额的增加而变化。在 10%的显著性水平下，t 分布的临界值为 1.311，计算的 t 值小于该值，拒绝原假设，意味着 R&D 强度随销售额的增加而增加。（3）对 X 2 ，参数估计值的 t 统计值为 0.05/0.46=1.087，它比在 10%的显著性水平下的临界值还小，因此可以认为它对Y 在统计上没有显著的影响。例 3．表 3-1 为有关经批准的私人住房单位及其决定因素的 4 个模型的估计量和相关统计值（括号内为 p-值）（如果某项为空，则意味着模型中没有此变量）。数据为美国 40 个城市的数据。模型如下： β β β µ β β β β β + + + + = + + + + 5 5 6 6 7 7 0 1 1 2 2 3 3 4 4 X X X Y X X X X 式中，Y 为实际颁发的建筑许可证数量， X1每平方英里的人口密度， X 2 自有房屋的均值（单位：百美元）， X3平均家庭的收入（单位：千美元）， X 4 为 1980~1992 年的人口增长百分比， X5失业率， X6人均交纳的地方税， X7 人均缴纳的州税。表 3-1 变量模型 A 模型 B 模型 C 模型 D C 813 (0.74) -392 (0.81) -1279 (0.34) -973 (0.44) X1 0.075 (0.43) 0.062 (0.32) 0.042 (0.47) X 2 -0.855 (0.13) -0.873 (0.11) -0.994 (0.06) -0.778 (0.07) X3 110.41 (0.14) 133.03 (0.04) 125.71 (0.05) 116.60 (0.06) X 4 26.77 (0.11) 29.19 (0.06) 29.41 (0.001) 24.86 (0.08) X5 -76.55 (0.48) X6 -0.061 (0.95) X7 -1.006 (0.40) -1.004 (0.37) RSS 4.763E+7 4.843E+7 4.962E+7 5.038E+7 R2 0.349 0.338 0.322 0.312 2 σˆ 1.488E+6 1.424E+6 1.418E+6 1.399E+6 AIC 1.776E+6 1.634E+6 1.593E+6 1.538E+6 （1）检验模型 A 中的每一个回归系数在 10%水平下是否为零（括号中的值为 p-值）。根据检验结果，你认为应该把变量保留在模型中还是去掉？

检验则被用作检验整个回归关系的显著性：各解释变量联合起来对被解释变量有显著的线性关系，并不意味着每一个解释变量分别对被解释变量有显著的线性关系。在一元线性回归分析中，二者具有等价作用，因为二者都是对共同的假设一一解释变量的参数等于零一一进行检验。 3、为什么说对模型参数施加约束条件后，其回归的残差平方和一定不比未施加约束的残差平方和小？在什么样的条件下，受约束回归与无约束回归的结果相同？答：对模型参数施加约束条件后，就限制了参数的取值范围，寻找到的参数估计值也是在此给条件下使残差平方和达到最小，它不可能比未施加约束条件时找到的参数估计值使得残差平方达到的最小值还要小。但当约束条件为真时，受约束回归与无约束回归的结果就相同了。 4、在一项调查大学生一学期平均成绩(Y)与每周在学习(X,)、睡觉(X,)、娱乐 (X,)与其他(X,)等各种活动所用时间的关系的研究中，建立如下回归模型： Y=Bo+BX+Bx2+Bx3+Bx+u 如果这些活动所用时间的总和为一周的总小时数168。问：保持其他变量不变，而改变其中一个变量的说法是否有意义？该模型是否有违背基本假设的情况？如何修改此模型以使其更加合理。解答：由于X,+X,+X3+X4=168,当其中一个变量变化时，至少有一个其他变量也得变化，因此，保持其他变量不变，而改变其中一个变量的说法是无意义的。显然，由于四类活动的总和为一周的总小时数168，表明四个X间存在完全的线性关系，因此违背了解释变量间不存在（完全）多重共线性的假设。可以去掉其中的一个变量，如去掉代表“其他”活动的变量X,则新构成的三变量模型更加合理。如这时B就测度了当其他两变量不变时，每周增加1小时的学习时间所带来的学习成绩的平均变化。这时，即使睡觉和娱乐的时间保持不变，也可以通过减少其他活动的时间来增加学习的时间。而这时三个变量间也不存在明显的共线性问题。 5、考虑下列两个模型： I Y=ao+aXu+a2X2i+u Yi-Xi=Bo+BX+B2x2+v

检验则被用作检验整个回归关系的显著性；各解释变量联合起来对被解释变量有显著的线性关系，并不意味着每一个解释变量分别对被解释变量有显著的线性关系。在一元线性回归分析中，二者具有等价作用，因为二者都是对共同的假设——解释变量的参数等于零——进行检验。 3、为什么说对模型参数施加约束条件后，其回归的残差平方和一定不比未施加约束的残差平方和小？在什么样的条件下，受约束回归与无约束回归的结果相同？答：对模型参数施加约束条件后，就限制了参数的取值范围，寻找到的参数估计值也是在此给条件下使残差平方和达到最小，它不可能比未施加约束条件时找到的参数估计值使得残差平方达到的最小值还要小。但当约束条件为真时，受约束回归与无约束回归的结果就相同了。 4、在一项调查大学生一学期平均成绩（Y ）与每周在学习（ X1）、睡觉（ X 2 ）、娱乐（ X3）与其他（ X 4 ）等各种活动所用时间的关系的研究中，建立如下回归模型： Y = β 0 + β1X1 + β 2 X 2 + β 3X3 + β 4 X 4 + µ 如果这些活动所用时间的总和为一周的总小时数 168。问：保持其他变量不变，而改变其中一个变量的说法是否有意义？该模型是否有违背基本假设的情况？如何修改此模型以使其更加合理。解答：由于 X1 + X 2 + X3 + X 4 = 168 ，当其中一个变量变化时，至少有一个其他变量也得变化，因此，保持其他变量不变，而改变其中一个变量的说法是无意义的。显然，由于四类活动的总和为一周的总小时数 168，表明四个 X 间存在完全的线性关系，因此违背了解释变量间不存在（完全）多重共线性的假设。可以去掉其中的一个变量，如去掉代表“其他”活动的变量 X 4 ，则新构成的三变量模型更加合理。如这时 β1就测度了当其他两变量不变时，每周增加 1 小时的学习时间所带来的学习成绩的平均变化。这时，即使睡觉和娱乐的时间保持不变，也可以通过减少其他活动的时间来增加学习的时间。而这时三个变量间也不存在明显的共线性问题。 5、考虑下列两个模型： I Yi = α 0 +α1X1i +α 2 X 2i + ui II i i i i i Y − X = + X + X + v 1 β 0 β1 1 β 2 2

北京外国语大学：《计量经济学》课程教学资源（典型例题分析）第二章 经典单方程计量经济学模型（多元线性回归模型）

北京外国语大学：《计量经济学》课程教学资源（典型例题分析）第二章经典单方程计量经济学模型（多元线性回归模型）