§4.3多重共线性 Multicollinearity 二 多重共线性的概念 多重共线性的后果 多重共线性的检验 四、 克服多重共线性的方法 五、 例题 六、 分部回归与多重共线性
§4.3 多重共线性 Multicollinearity 一、多重共线性的概念 二、多重共线性的后果 三、多重共线性的检验 四、克服多重共线性的方法 五、例题 六、分部回归与多重共线性
一、多重共线性的概念
一、多重共线性的概念
1、多重共线性 Y,=B。+P,X:+P2X2+.+BX6+4,i=1,2,.,n 如果某两个或多个解释变量之间出现了相关性,则 称为多重共线性Multicollinearity)。 CX,+C2X2,+.+CkXa=0 perfect multicollinearity R(X)<k+1 approximate iXu+C2X2i+.+CkXo+v;=0 multicollinearity
1、多重共线性 如果某两个或多个解释变量之间出现了相关性,则 称为多重共线性(Multicollinearity)。 Yi = 0 + 1 X1i + 2 X2i ++ k Xki + i i = 1,2, , n c1 X1i + c2 X2i ++ ck Xki = 0 0 c1 X1i + c2 X2i ++ ck Xki + vi = R(X) k +1 perfect multicollinearity approximate multicollinearity
2、实际经济问题中的多重共线性 ·产生多重共线性的主要原因: (1)经济变量相关的共同趋势 (2)滞后变量的引入 (3)样本资料的限制
2、实际经济问题中的多重共线性 • 产生多重共线性的主要原因: (1)经济变量相关的共同趋势 (2)滞后变量的引入 (3)样本资料的限制
二、多重共线性的后果 Consequences of Multicollinearity
二、多重共线性的后果 Consequences of Multicollinearity
1、完全共线性下参数估计量不存在 Y=XB+u B=(XXXY 如果存在完全共线性,则XX不存在,无法得 到参数的估计量
1、完全共线性下参数估计量不存在 如果存在完全共线性,则(X’X)-1不存在,无法得 到参数的估计量。 Y = Xβ+μ β= XX XY −1 ( ) ˆ
2、近似共线性下OLS估计量非有效 近似共线性下,可以得到OLS参数估计量,但 参数估计量方差的表达式为 Cov(B)=o2(X'X) 由于XX0,引起XX)主对角线元素较大, 使参数估计值的方差增大,OLS参数估计量非有 效
2、近似共线性下OLS估计量非有效 • 近似共线性下,可以得到OLS参数估计量,但 参数估计量方差的表达式为 由于|X’X|0,引起(X’X) -1主对角线元素较大, 使参数估计值的方差增大,OLS参数估计量非有 效。 2 1 ) ( ) ˆ ( − Cov β = XX
以二元线性模型y=B1+p2x2+4为例: o2∑号 σ21∑x a)=oXΣ∑2x,x1-x广/∑Σ 03 1 ∑1- (∑xx尸 ∑∑喝 恰为X,与X2的线性相关系数的平方r2 由于2≤1,故1/(1-2)≥1
• 以二元线性模型 y= 1x1+2x2+ 为例: − = − = = − 2 2 2 1 2 1 2 2 1 2 2 1 2 2 2 2 1 2 2 2 1 1 1 2 1 1 ( ) / ( ) ) ( ) ˆ var( i i i i i i i i i i x x x x x x x x x x X X 2 2 1 2 1 1 x r i − = 2 2 2 1 2 1 2 ( ) i i i i x x x x 恰为X1与X2的线性相关系数的平方r 2 由于 r 2 1,故 1/(1- r 2 )1
当完全不共线时,2=0 var(B,)=o2/∑x 当近似共线时,0<2<1 O 2 多重共线性使参数估计值的方差增大,1/(1-r)为 方差膨胀因子(Variance Inflation Factor,.VIF) 表4.3.1方差膨胀因子表 相关系数平方 0 0.50.8 0.9 0.95 0.96 0.97 0.98 0.99 0.999 方差膨胀因子 1 2 5 10 20 25 33 50 100 1000 当完全共线时, r2=1, var(B)=co
多重共线性使参数估计值的方差增大,1/(1-r 2 )为 方差膨胀因子(Variance Inflation Factor, VIF) 当完全不共线时, r 2 =0 = 2 1 2 1 ) / ˆ var( i x 当近似共线时, 0< r 2 <1 − = 2 1 2 2 2 1 2 1 1 1 ) ˆ var( i i x r x 表 4.3.1 方差膨胀因子表 相关系数平方 0 0.5 0.8 0.9 0.95 0.96 0.97 0.98 0.99 0.999 方差膨胀因子 1 2 5 10 20 25 33 50 100 1000 当完全共线时, r 2=1, var( ˆ 1 ) =
3、参数估计量经济含义不合理 如果模型中两个解释变量具有线性相关性, 例如X2=入X1, 这时,X和X前的参数B1、B2并不反映各 自与被解释变量之间的结构关系,而是反映 它们对被解释变量的共同影响。 B1、B2已经失去了应有的经济含义,于是 经常表现出似乎反常的现象:例如β1本来应 该是正的,结果恰是负的
3、参数估计量经济含义不合理 • 如果模型中两个解释变量具有线性相关性, 例如 X2= X1, 这时,X1和X2前的参数1、2并不反映各 自与被解释变量之间的结构关系,而是反映 它们对被解释变量的共同影响。 1、2已经失去了应有的经济含义,于是 经常表现出似乎反常的现象:例如1本来应 该是正的,结果恰是负的