北京外国语大学：《计量经济学》课程教学资源（典型例题分析）第二章经典单方程计量经济学模型（一元线性回归模型）.pdf_大学文库

第二章经典单方程计量经济学模型：一元线性回归模型一、内容提要本章介绍了回归分析的基本思想与基本方法。首先，本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始，建立了回归分析的基本思想。总体回归函数是对总体变量间关系的定量表述，由总体回归模型在若干基本假设下得到，但它只是建立在理论之上，在现实中只能先从总体中抽取一个样本，获得样本回归函数，并用它对总体回归函数做出统计推断。本章学习的一个重点是如何获取线性的样本回归函数，主要涉及到普通最小二乘法 (OLS)的学习与掌握。同时，也介绍了极大似然估计法(ML)以及矩估计法(MM)。本章的另一个学习的重点是对样本回归函数能否代表总体回归函数进行统计推断，即进行所谓的统计检验。统计检验包括两个方面，一是先检验样本回归函数与样本点的“拟合优度”，第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次：第一，检验解释变量对被解释变量是否存在着显著的线性影响关系，通过变量的t检验完成：第二，检验回归函数与总体回归函数的“接近”程度，通过参数估计值的“区间检验”完成。本章还有三方面的内容不容忽视。其一，若干基本假设。样本回归函数参数的估计、对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。其二，参数估计量统计性质的分析，包括小样本性质与大样本性质，尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则.Goss-markov定理表明OLS估计量是最佳线性无偏估计量。其三，运用样本回归函数进行预测，包括被解释变量条件均值与个值的预测、预测置信区间的计算及其变化特征等。二、典型例题分析例1、令Y表示一名妇女生育孩子的数目，X表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为 Y=B。+BX+4

1 第二章经典单方程计量经济学模型：一元线性回归模型一、内容提要本章介绍了回归分析的基本思想与基本方法。首先，本章从总体回归模型与总体回归函数、样本回归模型与样本回归函数这两组概念开始，建立了回归分析的基本思想。总体回归函数是对总体变量间关系的定量表述，由总体回归模型在若干基本假设下得到，但它只是建立在理论之上，在现实中只能先从总体中抽取一个样本，获得样本回归函数，并用它对总体回归函数做出统计推断。本章学习的一个重点是如何获取线性的样本回归函数，主要涉及到普通最小二乘法（OLS）的学习与掌握。同时，也介绍了极大似然估计法（ML）以及矩估计法（MM）。本章的另一个学习的重点是对样本回归函数能否代表总体回归函数进行统计推断，即进行所谓的统计检验。统计检验包括两个方面，一是先检验样本回归函数与样本点的“拟合优度”，第二是检验样本回归函数与总体回归函数的“接近”程度。后者又包括两个层次：第一，检验解释变量对被解释变量是否存在着显著的线性影响关系，通过变量的 t 检验完成；第二，检验回归函数与总体回归函数的“接近”程度，通过参数估计值的“区间检验”完成。本章还有三方面的内容不容忽视。其一，若干基本假设。样本回归函数参数的估计、对参数估计量的统计性质的分析以及所进行的统计推断都是建立在这些基本假设之上的。其二，参数估计量统计性质的分析，包括小样本性质与大样本性质，尤其是无偏性、有效性与一致性构成了对样本估计量优劣的最主要的衡量准则。Goss-markov 定理表明 OLS 估计量是最佳线性无偏估计量。其三，运用样本回归函数进行预测，包括被解释变量条件均值与个值的预测、预测置信区间的计算及其变化特征等。二、典型例题分析例 1、令Y 表示一名妇女生育孩子的数目， X 表示该妇女接受过教育的年数。生育率对教育年数的简单回归模型为 Y = β 0 + β1X + µ

(1)随机扰动项山包含什么样的因素？它们可能与教育水平相关吗？ (2)上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗？请解释。解答： (1)收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素，在上述简单回归模型中，它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关，如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。 (2)当归结在随机扰动项中的重要影响因素与模型中的教育水平X相关时，上述回归模型不能够揭示教育对生育率在其他条件不变下的影响，因为这时出现解释变量与随机扰动项相关的情形，违背了基本假设。例2.已知回归模型E=+N+4,式中E为某类公司一名新员工的起始薪金（元）， N为所受教育水平（年）。随机扰动项4的分布未知，其他所有假设都满足。 (1)从直观及经济角度解释α和B。 (2)OLS估计量（和B满足线性性、无偏性及有效性吗？简单陈述理由。 (3)对参数的假设检验还能进行吗？简单陈述理由。解答： (1)+BN为接受过N年教育的员工的总体平均起始薪金。当N为零时，平均薪金为α，因此a表示没有接受过教育员工的平均起始薪金。B是每单位N变化所引起的E的变化，即表示每多接受一年学校教育所对应的薪金增加值。 (2)OLS估计量α和仍B满足线性性、无偏性及有效性，因为这些性质的成立无需随机扰动项山的正态分布假设。 (3)如果的分布未知，则所有的假设检验都是无效的。因为t检验与F检验是建立在 4的正态分布假设之上的。例3、在例2中，如果被解释变量新员工起始薪金的计量单位由元改为100元，估计的截距项与斜率项有无变化？如果解释变量所受教育水平的度量单位由年改为月，估计的截距项与斜率项有无变化？解答：首先考察被解释变量度量单位变化的情形。以E*表示以百元为度量单位的薪金，则 E=E*×100=a+βN+4 由此有如下新模型 E*=(a/100)+(B/100)N+(4/100) 2

2 （1）随机扰动项 µ 包含什么样的因素？它们可能与教育水平相关吗？（2）上述简单回归分析能够揭示教育对生育率在其他条件不变下的影响吗？请解释。解答：（1）收入、年龄、家庭状况、政府的相关政策等也是影响生育率的重要的因素，在上述简单回归模型中，它们被包含在了随机扰动项之中。有些因素可能与增长率水平相关，如收入水平与教育水平往往呈正相关、年龄大小与教育水平呈负相关等。（2）当归结在随机扰动项中的重要影响因素与模型中的教育水平 X 相关时，上述回归模型不能够揭示教育对生育率在其他条件不变下的影响，因为这时出现解释变量与随机扰动项相关的情形，违背了基本假设。例 2．已知回归模型 E = α + βN + µ ，式中 E 为某类公司一名新员工的起始薪金（元）， N 为所受教育水平（年）。随机扰动项 µ 的分布未知，其他所有假设都满足。（1）从直观及经济角度解释α 和 β 。（2）OLS 估计量αˆ 和 β ˆ 满足线性性、无偏性及有效性吗？简单陈述理由。（3）对参数的假设检验还能进行吗？简单陈述理由。解答：（1）α + βN 为接受过 N 年教育的员工的总体平均起始薪金。当 N 为零时，平均薪金为α ，因此α 表示没有接受过教育员工的平均起始薪金。β 是每单位 N 变化所引起的 E 的变化，即表示每多接受一年学校教育所对应的薪金增加值。（2）OLS 估计量αˆ 和仍 β ˆ 满足线性性、无偏性及有效性，因为这些性质的成立无需随机扰动项 µ 的正态分布假设。（3）如果 µ 的分布未知，则所有的假设检验都是无效的。因为 t 检验与 F 检验是建立在 µ 的正态分布假设之上的。例 3、在例 2 中，如果被解释变量新员工起始薪金的计量单位由元改为 100 元，估计的截距项与斜率项有无变化？如果解释变量所受教育水平的度量单位由年改为月，估计的截距项与斜率项有无变化？解答：首先考察被解释变量度量单位变化的情形。以 E *表示以百元为度量单位的薪金，则 E = E *×100 = α + βN + µ 由此有如下新模型 E* = (α /100) + (β /100)N + (µ /100)

R2=0.538 (1)B的经济解释是什么？ (2)α和B的符号是什么？为什么？实际的符号与你的直觉一致吗？如果有冲突的话，你可以给出可能的原因吗？ (3)对于拟合优度你有什么看法吗？ (4)检验是否每一个回归系数都与零显著不同（在1%水平下）。同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么？解答： (1)阝为收入的边际储蓄倾向，表示人均收入每增加1美元时人均储蓄的预期平均变化量。 (2)由于收入为零时，家庭仍会有支出，可预期零收入时的平均储蓄为负，因此符号应为负。储蓄是收入的一部分，且会随着收入的增加而增加，因此预期阝的符号为正。实际的回归式中，B的符号为正，与预期的一致。但截距项为正，与预期不符。这可能是由于模型的错误设定造成的。如家庭的人口数可能影响家庭的储蓄形为，省略该变量将对截距项的估计产生影响：另一种可能就是线性设定可能不正确。 (3)拟合优度刻画解释变量对被解释变量变化的解释能力。模型中53.8%的拟合优度，表明收入的变化可以解释储蓄中53.8%的变动。 (4)检验单个参数采用t检验，零假设为参数为零，备择假设为参数不为零。双变量情形下，在零假设下t分布的自由度为n-2=36-2=34。由t分布表知，双侧1%下的临界值位于2.750与2.704之间。斜率项计算的t值为0.067/0.011=6.09：截距项计算的t值为 384.105/151.105=2.54。可见斜率项计算的t值大于临界值，截距项小于临界值，因此拒绝斜率项为零的假设，但不拒绝截距项为零的假设。附录：一些理论结果的证明 1、令B,x和B,分别为Y对X回归和X对Y回归中的斜率，证明 BxBx =r2 其中r为X与Y之相的线性相关系数。证明：容易知道，在上述两回归中斜率项分别为 6

6 2 R ＝0.538 （1） β 的经济解释是什么？（2）α 和 β 的符号是什么？为什么？实际的符号与你的直觉一致吗？如果有冲突的话，你可以给出可能的原因吗？（3）对于拟合优度你有什么看法吗？（4）检验是否每一个回归系数都与零显著不同（在 1%水平下）。同时对零假设和备择假设、检验统计值、其分布和自由度以及拒绝零假设的标准进行陈述。你的结论是什么？解答：（1） β 为收入的边际储蓄倾向，表示人均收入每增加 1 美元时人均储蓄的预期平均变化量。（2）由于收入为零时，家庭仍会有支出，可预期零收入时的平均储蓄为负，因此α 符号应为负。储蓄是收入的一部分，且会随着收入的增加而增加，因此预期 β 的符号为正。实际的回归式中， β 的符号为正，与预期的一致。但截距项为正，与预期不符。这可能是由于模型的错误设定造成的。如家庭的人口数可能影响家庭的储蓄形为，省略该变量将对截距项的估计产生影响；另一种可能就是线性设定可能不正确。（3）拟合优度刻画解释变量对被解释变量变化的解释能力。模型中 53.8%的拟合优度，表明收入的变化可以解释储蓄中 53.8 %的变动。（4）检验单个参数采用 t 检验，零假设为参数为零，备择假设为参数不为零。双变量情形下，在零假设下 t 分布的自由度为 n-2=36-2=34。由 t 分布表知，双侧 1%下的临界值位于 2.750 与 2.704 之间。斜率项计算的 t 值为 0.067/0.011=6.09；截距项计算的 t 值为 384.105/151.105=2.54。可见斜率项计算的 t 值大于临界值，截距项小于临界值，因此拒绝斜率项为零的假设，但不拒绝截距项为零的假设。附录：一些理论结果的证明 1、令 β YX ˆ 和 β XY ˆ 分别为Y 对 X 回归和 X 对Y 回归中的斜率，证明 ˆ ˆ 2 r β YX β XY = 其中r 为 X 与Y 之相的线性相关系数。证明：容易知道，在上述两回归中斜率项分别为

北京外国语大学：《计量经济学》课程教学资源（典型例题分析）第二章 经典单方程计量经济学模型（一元线性回归模型）

北京外国语大学：《计量经济学》课程教学资源（典型例题分析）第二章经典单方程计量经济学模型（一元线性回归模型）