goetz 计量经济学 第九章 没定误差与测量误差 1
1 第 九 章 设定误差与测量误差 计量经济学
goetz 6引子:简单一定胜于复杂吗? 西方国家盛行“ Occams razor”原则,意思是 “简单优于复杂”的节约性原则。经济模型永远 无法完全把握现实,在建立模型中一定的抽象和 简化是不可避免的 在研究进口与国内生产总值的关系时,考虑到时 间趋势,建立并估计了以下模型 IM=-172.42+0.271GDP-949.12T+160.7372-10.1873 t=(-0.177)(5.67)(-2.22)(2.20)(-2.74) R2=0.991F=272.95DW=1.97
2 引子:简单一定胜于复杂吗? 西方国家盛行“Occam ` s razor”原则,意思是 “简单优于复杂”的节约性原则。经济模型永远 无法完全把握现实,在建立模型中一定的抽象和 简化是不可避免的。 在研究进口与国内生产总值的关系时,考虑到时 间趋势,建立并估计了以下模型 IM GDP T T T 2 3 = -172.42 + 0.271 - 949.12 + 160.73 - 10.18 t (-0.177) (5.67) (-2.22) (2.20) (-2.74) R 0.991 F 272.95 DW 1.97 2
goetz 有人根据“简单优于复杂”原则,得到以下方程: ⅠM=-217.186+0.173GDP (-0.5)(16.94) (2) R2=0.960F=286.95DW=0.735 进行比较: 两个方程的检验结果都较理想; 方程(2)GDP的检验值似乎优于方程(1); 方程(2)函数形式也更为简单; 然而,能否根据“ Occan' s razor”原则,判断方程(2)比 方程(1)好?
3 有人根据“简单优于复杂”原则,得到以下方程: (2) 进行比较: 两个方程的检验结果都较理想; 方程(2)GDP的t检验值似乎优于方程(1); 方程(2)函数形式也更为简单; 然而,能否根据“Occam’s razor”原则,判断方程(2)比 方程(1)好? IM -217.186 0.173GDP t (-0.5) (16.94) R F DW 2 0.960 286.95 0.735
goetz 对模型的设定是计量经济研究的重要环节 前面各章除了对随机扰动项分布的基本假定以 外,还强调 假定设定的模型对变量和函数形式的设定是 正确地描述被解释变量与解释变量之间的真实关 系,假定模型中的变量没有测量误差。 但是在实际的建模实践中,对模型的设定不一定 能够完全满足这样的要求,从而会使模型出现设 定误差
4 对模型的设定是计量经济研究的重要环节。 前面各章除了对随机扰动项 分布的基本假定以 外,还强调: 假定设定的模型对变量和函数形式的设定是 正确地描述被解释变量与解释变量之间的真实关 系,假定模型中的变量没有测量误差。 但是在实际的建模实践中,对模型的设定不一定 能够完全满足这样的要求,从而会使模型出现设 定误差。 i u
goetz 第九章设定误差与测量误差 本章主要讨论: ●设定误差 ●设定误差的检验 ●测量误差 5
5 第九章 设定误差与测量误差 本章主要讨论: ●设定误差 ●设定误差的检验 ●测量误差
goetz 3第一节设定误差 本节基本内容: ●设定误差及类型 ●变量设定误差的后果 6
6 第一节 设定误差 本节基本内容: ●设定误差及类型 ●变量设定误差的后果
goetz 设定误差及类型 计量经济模型是对变量间经济关系因果性的设想, 若所设定的回归模型是“正确”的,主要任务是所 选模型参数的估计和假设检验。但是如果对计量模 型的各种诊断或检验总不能令人满意,这时应把注 意力集中到模型的设定方面: 考虑所建模型是否遗漏了重要的变量? 是否包含了多余的变量? 所选模型的函数形式是否正确? 随机扰动项的设定是否合理? 变量的数据收集是否有误差? 所有这些,计量经济学中被统称为设定误差。7
7 一 、设定误差及类型 计量经济模型是对变量间经济关系因果性的设想, 若所设定的回归模型是“正确”的,主要任务是所 选模型参数的估计和假设检验。但是如果对计量模 型的各种诊断或检验总不能令人满意,这时应把注 意力集中到模型的设定方面: 考虑所建模型是否遗漏了重要的变量? 是否包含了多余的变量? 所选模型的函数形式是否正确? 随机扰动项的设定是否合理? 变量的数据收集是否有误差? 所有这些,计量经济学中被统称为设定误差
goetz 3设定误差的类型 从误差来源看,设定误差主要包括: (1)变量的设定误差,包括相关变量的遗漏 (欠拟合)、无关变量的误选(过拟合); (2)变量数据的测量误差; (3)模型函数形式的设定误差; (4)随机扰动项设定误差。 本章主要讨论的两类变量设定误差 (1)相关变量的遗漏(欠拟合); (2)无关变量的误选(过拟合) 8
8 从误差来源看,设定误差主要包括: (1)变量的设定误差,包括相关变量的遗漏 (欠拟合)、无关变量的误选(过拟合); (2)变量数据的测量误差; (3)模型函数形式的设定误差; (4)随机扰动项设定误差。 本章主要讨论的两类变量设定误差: (1)相关变量的遗漏(欠拟合); (2)无关变量的误选(过拟合)。 设定误差的类型
"。1,相关变量的遗漏 (Omitting relevant Variables) 例如,如果“正确”的模型为 X=B+B2X2+B3X3+1 而我们将模型设定为 Y=C,+0X。+V 即设定模型时漏掉了一个相关的解释变量。 这类错误称为遗漏相关变量(“欠拟合”)
9 1. 相关变量的遗漏 (Omitting Relevant Variables) 例如,如果“正确”的模型为 而我们将模型设定为 即设定模型时漏掉了一个相关的解释变量。 这类错误称为遗漏相关变量(“欠拟合”)。 Yi 1 2X2i 3X3i i Yi 1 2 X 2 i i
2.无关变量的误选 (Including Irrevelant Variables) 例如,如果“真实模型”为: X=B1+B2X2+B3X32+ 但我们却将模型设定为 X2=c1+2Y2,+C2X2+AXA,+ 即设定模型时,多选了一个无关解释变量。这类 错误称为无关变量的误选(“过拟合”)。 10
10 2. 无关变量的误选 (Including Irrevelant Variables) 例如,如果“真实模型”为: 但我们却将模型设定为 即设定模型时,多选了一个无关解释变量。这类 错误称为无关变量的误选(“过拟合”)。 Yi 1 2X2i 3X3i i Yi 1 2X2i 3X3i 4X4i i