§4.3多重共线性 Multicollinearity 多重共线性的概念 多重共线性的后果 三 多重共线性的检验 四、 克服多重共线性的方法 五、 例题 六、分部回归与多重共线性
一、多重共线性的概念 二、多重共线性的后果 三、多重共线性的检验 四、克服多重共线性的方法 五、例题 六、分部回归与多重共线性 §4.3 多重共线性 Multicollinearity
1、多重共线性 Y=Bo+BXu+B2X2++BxX+ i=1,2,.,n 如果某两个或多个解释变量之间出现了相关性,则 称为多重共线性(Multicollinearity)。 C,Xi+C2X2,+.+CkX右=0 perfect multicollinearity R(X)<k+1 approximate CXu+C2X2:+.+CX右+y:=0 multicollinearity
1、多重共线性 如果某两个或多个解释变量之间出现了相关性,则 称为多重共线性(Multicollinearity)。 Yi = 0 + 1 X1i + 2 X2i ++ k Xki + i i = 1,2, , n c1 X1i + c2 X2i ++ ck Xki = 0 0 c1 X1i + c2 X2i ++ ck Xki + vi = R(X) k +1 perfect multicollinearity approximate multicollinearity
2、实际经济问题中的多重共线性 。产生多重共线性的主要原因: (1)经济变量相关的共同趋势 (2)滞后变量的引入 (3)样本资料的限制
2、实际经济问题中的多重共线性 • 产生多重共线性的主要原因: (1)经济变量相关的共同趋势 (2)滞后变量的引入 (3)样本资料的限制
1、完全共线性下参数估计量不存在 Y=XB+u B=(XXXY 如果存在完全共线性,则XX不存在,无法得 到参数的估计量
1、完全共线性下参数估计量不存在 如果存在完全共线性,则(X’X)-1不存在,无法得 到参数的估计量。 Y = Xβ+μ β= XX XY −1 ( ) ˆ
2、近似共线性下OLS估计量非有效 近似共线性下,可以得到OLS参数估计量,但 参数估计量方差的表达式为 Cov(B)=o2(XX) 由于XX0,引起(XX)1主对角线元素较大, 使参数估计值的方差增大,OLS参数估计量非有 效
2、近似共线性下OLS估计量非有效 • 近似共线性下,可以得到OLS参数估计量,但 参数估计量方差的表达式为 由于|X’X|0,引起(X’X) -1主对角线元素较大, 使参数估计值的方差增大,OLS参数估计量非有 效。 2 1 ) ( ) ˆ ( − Cov β = XX
以二元线性模型y=B1x1+Bx2+4为例: var(B.)=o'(XX)= o2∑x σ21∑x品 ∑x∑x,-(∑,1-(∑xx)/∑∑场 2 1 ∑x1-r2 ∑xx ∑∑场 恰为X,与X,的线性相关系数的平方2 由于r2≤1,故1/(1-2)21
• 以二元线性模型 y= 1x1+2x2+ 为例: − = − = = − 2 2 2 1 2 1 2 2 1 2 2 1 2 2 2 2 1 2 2 2 1 1 1 2 1 1 ( ) / ( ) ) ( ) ˆ var( i i i i i i i i i i x x x x x x x x x x X X 2 2 1 2 1 1 x r i − = 2 2 2 1 2 1 2 ( ) i i i i x x x x 恰为X1与X2的线性相关系数的平方r 2 由于 r 2 1,故 1/(1- r 2 )1
当完全不共线时,2=0 ar(B)=o2/∑x品 2 当近似共线时,0<2<1 、2 多重共线性使参数估计值的方差增大,1/(1-r2)为 方差膨胀因子(Variance Inflation Factor,VIF) 表4.3.1方差膨胀因子表 相关系数平方 0 0.50.80.9 0.95 0.96 0.97 0.98 0.99 0.999 方差膨胀因子 2 10 20 25 33 50 100 1000 当完全共线时,2=1, var(B)=co
多重共线性使参数估计值的方差增大,1/(1-r 2 )为 方差膨胀因子(Variance Inflation Factor, VIF) 当完全不共线时, r 2 =0 = 2 1 2 1 ) / ˆ var( i x 当近似共线时, 0< r 2 <1 − = 2 1 2 2 2 1 2 1 1 1 ) ˆ var( i i x r x 表 4.3.1 方差膨胀因子表 相关系数平方 0 0.5 0.8 0.9 0.95 0.96 0.97 0.98 0.99 0.999 方差膨胀因子 1 2 5 10 20 25 33 50 100 1000 当完全共线时, r 2=1, var( ˆ 1 ) =
3、参数估计量经济含义不合理 ·如果模型中两个解释变量具有线性相关性,例 如X2入X, 这时,X和X2前的参数B1、B2并不反映各自与 被解释变量之间的结构关系,而是反映它们对被 解释变量的共同影响。 阝、B己经失去了应有的经济含义,于是经常 表现出似乎反常的现象:例如B本来应该是正的, 结果恰是负的
3、参数估计量经济含义不合理 • 如果模型中两个解释变量具有线性相关性,例 如 X2= X1 , 这时,X1和X2前的参数 1、 2并不反映各自与 被解释变量之间的结构关系,而是反映它们对被 解释变量的共同影响。 1、2已经失去了应有的经济含义,于是经常 表现出似乎反常的现象:例如 1本来应该是正的, 结果恰是负的