§43多重共线性 Multi-Collinearity
§4.3 多重共线性 Multi-Collinearity
§43多重共线性 多重共线性的概念 二、实际经济问题中的多重共线性 三、多重线性的后果 四、多重共线性的检验 五、克服多重共线性的方法 六、案例 七、分部回归与多重共线性
• 一、多重共线性的概念 • 二、实际经济问题中的多重共线性 • 三、多重共线性的后果 • 四、多重共线性的检验 • 五、克服多重共线性的方法 • 六、案例 • *七、分部回归与多重共线性 §4.3 多重共线性
多重共线性的概念 对于模型 Y1=B0+B1x1;+B2X21+.+RX+ n 其基本假设之一是解释变量是互相独立的。 如果某两个或多个解释变量之间出现了相 关性,则称为多重共线性( Multicollinearity)
一、多重共线性的概念 对于模型 Yi =0+1X1i+2X2i++kXki+i i=1,2,…,n 其基本假设之一是解释变量是互相独立的。 如果某两个或多个解释变量之间出现了相 关性,则称为多重共线性(Multicollinearity)
如果存在 CIXi+c2X2 +. takAki =0 其中:c不全为0,则称为解释变量间存在完全共线 性( perfect multicollinearity)。 如果存在 C1X1+c2X2+..+ckX+v=0 其中c不全为0,v为随机误差项,则称为近似共线 性( approximate multicollinearity)或交互相关 (intercorrelated)
如果存在 c1X1i+c2X2i+…+ckXki=0 i=1,2,…,n 其中: ci不全为0,则称为解释变量间存在完全共线 性(perfect multicollinearity)。 如果存在 c1X1i+c2X2i+…+ckXki+vi=0 i=1,2,…,n 其中ci不全为0,vi为随机误差项,则称为 近似共线 性( approximate multicollinearity) 或交互相关 (intercorrelated)
在矩阵表示的线性回归模型 Y=Xβ+ 中,完全共线性指:秩(X)<k+1,即 XM X k1 XX 12 22 2n 中,至少有一列向量可由其他列向量(不包括第 列)线性表出。 如:X2=X1,则X2对Y的作用可由X1代替
在矩阵表示的线性回归模型 Y=X+ 中,完全共线性指:秩(X)<k+1,即 = n n kn k k X X X X X X X X X X 1 2 1 2 2 2 2 1 1 2 1 1 1 1 1 中,至少有一列向量可由其他列向量(不包括第 一列)线性表出。 如:X2= X1,则X2对Y的作用可由X1代替
注意: 完全共线性的情况并不多见,一般出现 的是在一定程度上的共线性,即近似共线 性
注意: 完全共线性的情况并不多见,一般出现 的是在一定程度上的共线性,即近似共线 性
二、实际经济问题中的多重共线性 般地,产生多重共线性的主要原因有以下三 方面: (1)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济 变量(收入、消费、投资、价格)都趋于增长; 衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动 力投入往往出现高度相关情况,大企业二者都大, 小企业都小
二、实际经济问题中的多重共线性 一般地,产生多重共线性的主要原因有以下三 个方面: (1)经济变量相关的共同趋势 时间序列样本:经济繁荣时期,各基本经济 变量(收入、消费、投资、价格)都趋于增长; 衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动 力投入往往出现高度相关情况,大企业二者都大, 小企业都小
(2)滞后变量的引入 在经济计量模型中,往往需要引入滞 后经济变量来反映真实的经济关系 例如,消费=当期收入,前期收入) 显然,两期收入间有较强的线性相关性
(2)滞后变量的引入 在经济计量模型中,往往需要引入滞 后经济变量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性
(3)样本资料的限制 由于完全符合理论模型所要求的样本数据较难 收集,特定样本可能存在某种程度的多重共线性。 般经验: 时间序列数据样本:简单线性模型,往往存在 多重共线性。 截面数据样本:问题不那么严重,但多重共线 性仍然是存在的
(3)样本资料的限制 由于完全符合理论模型所要求的样本数据较难 收集,特定样本可能存在某种程度的多重共线性。 一般经验: 时间序列数据样本:简单线性模型,往往存在 多重共线性。 截面数据样本:问题不那么严重,但多重共线 性仍然是存在的
二、多重共线性的后果 1、完全共线性下参数估计量不存在 Y=XB+u 的OLS估计量为: B=(XXXY 如果存在完全共线性,则(XX)不存在,无法得 到参数的估计量
二、多重共线性的后果 1、完全共线性下参数估计量不存在 如果存在完全共线性,则(X’X)-1不存在,无法得 到参数的估计量。 Y = Xβ+μ 的OLS估计量为: β= XX XY −1 ( ) ˆ