第三章模型设定与数据问题
第三章 模型设定与数据问题
主要内容 ◆3.1遗漏变量 ◆3.2无关变量 ◆3,3建模策略由小到大”or'由大到小” ◆3.4解释变量个数的选择 ◆35对函数形式的检验 ◆36多重共线性 ◆3.7极端数据 ◆38虚拟变量 ◆39经济结构变动的检验 ◆310缺失数据与线性插值 ◆3,11变量单位的选择
2 主要内容 3.1 遗漏变量 3.2 无关变量 3.3建模策略:“由小到大”or“由大到小” 3.4 解释变量个数的选择 3.5 对函数形式的检验 3.6 多重共线性 3.7 极端数据 3.8 虚拟变量 3.9 经济结构变动的检验 3.10 缺失数据与线性插值 3.11 变量单位的选择
3.1遗漏变量 ◆3.1.1遗漏变量与解释变量不相关 ◆3.1.2遗漏变量与解释变量相关
3.1 遗漏变量 3.1.1 遗漏变量与解释变量不相关 3.1.2遗漏变量与解释变量相关 3
由于某些数据难以获得,遗漏变量现象几乎难以避免 假设真实的模型( (true model)为 y=a+Bx,+rx2+e (3.1) 其中,解释变量与扰动项不相关 而实际估计的模型( estimated model)为 y=a+ Bx,+u (3.2 遗漏变量( omitted variable)被归入扰动项 遗漏变量是否一定导致不一致的估计?
4 由于某些数据难以获得,遗漏变量现象几乎难以避免。 假设真实的模型(true model)为 (3.1) 其中,解释变量 与扰动项 不相关。 而实际估计的模型(estimated model)为 (3.2) 遗漏变量(omitted variable) 被归入扰动项 。 遗漏变量是否一定导致不一致的估计?
3.1.1遗漏变量与解释变量不相关 扰动项=yx2+G与解释变量x不相关,因为下面公式 Cov(r, l=Cov(, yx2+a =yCov(x,, x,)+ Cov(x,, 8) =0+0=0 (33)虽然存在遗漏变量,但OLS依然可一致地估计回 归系数。 由于遗漏变量被归入扰动项中,可能增大扰动项的方差 ,影响OLS估计的精确度
3.1.1 遗漏变量与解释变量不相关 扰动项 与解释变量 不相关,因为下面公式 (3.3)虽然存在遗漏变量,但OLS依然可一致地估计回 归系数。 由于遗漏变量被归入扰动项中,可能增大扰动项的方差 ,影响OLS估计的精确度。 5
3.1.2遗漏变量与解释变量相关 根据大样本理论,OLS估计不一致,称为“遗漏变量 偏差”( omitted variablebias) 这种偏差在实践中较常见,成为某些实证研究的致命 伤 比如,研究教育投资回报时,个人能力因无法观测而 遗漏,但能力与教育年限正相关。 存在遗漏变量本身并不要紧;关键在于,遗漏变量不 能与方程的解释变量相关
3.1.2 遗漏变量与解释变量相关 根据大样本理论,OLS估计不一致,称为“遗漏变量 偏差”(omitted variablebias)。 这种偏差在实践中较常见,成为某些实证研究的致命 伤。 比如,研究教育投资回报时,个人能力因无法观测而 遗漏,但能力与教育年限正相关。 存在遗漏变量本身并不要紧;关键在于,遗漏变量不 能与方程的解释变量相关。 6
解决遗漏变量偏差的方法主要有: ()加入尽可能多的控制变量( control variable) (i)随机实验与自然实验 (ⅲ)工具变量法(第10章); (ⅳ)使用面板数据(第12章);
解决遗漏变量偏差的方法主要有: (i)加入尽可能多的控制变量(control variable); (ii)随机实验与自然实验; (iii)工具变量法(第10章); (iv)使用面板数据(第12章); 7
3.2无关变量 与遗漏变量相反的情形是,在回归方程中加入了与被 解释变量无关的变量。假设真实的模型为 a+ x,+8 (3.5) 其中Cov(x1,E)=0。而实际估计的模型为 y=a+Bx1+yx2+(E-yx2)(36) 由于真实参数y=0,故可将模型写为 y=a+Bx,+yx,+e 3.7)
3.2 无关变量 与遗漏变量相反的情形是,在回归方程中加入了与被 解释变量无关的变量。假设真实的模型为 (3.5) 其中 。而实际估计的模型为 (3.6) 由于真实参数 ,故可将模型写为 (3.7) 8
由予2与y无关,根据“无关变量”的定义,也x2与y 的扰动项无关,即Cov(x2,e)=0 扰动项与所有解释变量均无关,故OLS一致,即 plim B=B pliny= y=0 1→0 n→)0 引入无关变量后,受到无关变量的干扰,估计量β 的方差一般会增大
由于 与y无关,根据“无关变量”的定义, 也 与y 的扰动项无关,即 扰动项与所有解释变量均无关,故OLS一致,即 引入无关变量后,受到无关变量的干扰,估计量 的方差一般会增大。 9
3.3建模策略:“由小到大”or“由大到小” “由小到大”( specific to general)的建模方式首先从 最简单的小模型开始,逐渐增加解释变量 比如,先将被解释变量对关键解释变量回归,然后 再加入其他控制变量 但小模型很可能存在遗漏变量偏差,系数估计不一致 t检验、F检验都失效,很难确定如何取舍变量。 10
3.3 建模策略:“由小到大”or“由大到小” “由小到大”(specific to general)的建模方式首先从 最简单的小模型开始,逐渐增加解释变量。 比如,先将被解释变量 对关键解释变量 回归,然后 再加入其他控制变量 。 但小模型很可能存在遗漏变量偏差,系数估计不一致 ,t检验、F检验都失效,很难确定如何取舍变量。 10