§28多重共线性 Muli→ collinearity 多重共线性的概念 、多重共线性的后果 三、多重线性的检验 四、克服多重共线性的方法 五、案例
§2.8多重共线性 Multi-Collinearity 一、多重共线性的概念 二、多重共线性的后果 三、多重共线性的检验 四、克服多重共线性的方法 五、案例
探求四个问题的答案 多重共线性的性质是什么? 多重共线性的后果是什么? 在实际中,如何检验多重共线性的存在? 如何处理多重共线性?
探求四个问题的答案 • 多重共线性的性质是什么? • 多重共线性的后果是什么? • 在实际中,如何检验多重共线性的存在? • 如何处理多重共线性?
多重共线性的概念
一、多重共线性的概念
1、多重共线性(弗里希引入)(针对解释 变量、针对多元模型) 对于模型 y=β0+β1x1;+B2x2+.+B1x;+ =1,2,,n (28.1) 其基本假设之一是解释变量是互不相关的 如果某两个或多个解释变量之间出现了相关性, 则称为多重共线性
1、多重共线性(弗里希引入)(针对解释 变量、针对多元模型) 对于模型 yi =0+1 x1i+2 x2i++k xki+i i=1,2,…,n (2.8.1) 其基本假设之一是解释变量是互不相关的。 如果某两个或多个解释变量之间出现了相关性, 则称为多重共线性
△(线性)相关图示 1200 1000 600 400 200 05001000150020002500 y=a+bx线性组合 y=a+bx+μ近似直线关系 y和x完全(线性)相关 和x不完全相关 (a+bx-y=0) (+bx -y+u=0)
△ (线性)相关图示 20 30 40 50 60 70 80 0 10 20 30 40 Y X 200 400 600 800 1000 1200 0 500 1000 1500 2000 2500 Y X y=a+bx 线性组合 y和x完全(线性)相关 (a+bx -y =0) y=a+bx+µ 近似直线关系 y和x不完全相关 (a+bx - y +µ =0)
如果存在 o+c1x1;+c2x2;+..+ckxk=0 (282) 其中:c1,C2,…,c不全为0,即某一个解释变量可以 用其它解释变量的线性组合表示,则称为解释变量 间存在完全共线性(完全的多重共线性) 如果存在 Co+ Cxi+c2x21+.+CKxki+v0 1=12..n 其中c1,c2,…,ck不全为0,v为随机误差项,则称为 般共线性(近似共线性)(高度多重共线性)或交互相 关( intercorrelated)
如果存在 c0+c1x1i+c2x2i+…+ckxki=0 i=1,2,…,n (2.8.2) 其中: c1 , c2 , …, ck不全为0,即某一个解释变量可以 用其它解释变量的线性组合表示,则称为解释变量 间存在完全共线性(完全的多重共线性)。 如果存在 c0+ c1x1i+c2x2i+…+ckxki+vi=0 i=1,2,…,n 其中c1 , c2 , …, ck不全为0,v为随机误差项,则称为一 般共线性(近似共线性)(高度多重共线性)或交互相 关(intercorrelated)
注意: 在实际经济统计数据中,完全共线性和完全无 多重共线性两种极端的情况都是极少见的。 常见的经济统计数据中,多个解释变量之间多 少都存在一定程度上的共线性 因此,通常人们关心的不是是否存在多重共 线性问题,而是共线性程度的强弱。 通常提到的多重共线性是指解释变量之间具有 较强的共线性(线性相关关系)—近似(高度 多重)共线性 从现在起仅考虑近似共线性即高度多重共线性 的情形
注意: 在实际经济统计数据中,完全共线性和完全无 多重共线性两种极端的情况都是极少见的。 常见的经济统计数据中,多个解释变量之间多 少都存在一定程度上的共线性。 因此,通常人们关心的不是是否存在多重共 线性问题,而是共线性程度的强弱。 通常提到的多重共线性是指解释变量之间具有 较强的共线性(线性相关关系)——近似(高度 多重)共线性 从现在起仅考虑近似共线性即高度多重共线性 的情形
在矩阵表示的线性回归模型 YEXB+N 中,完全共线性指:秩(X)<k+1,即矩阵 11 21 22 X k2 XX 2n X 中,至少有一列向量可由其他列向量(不包 括第一列)线性表出
在矩阵表示的线性回归模型 Y=XB+N 中,完全共线性指:秩(X)<k+1,即矩阵 = n n k n k k X X X X X X X X X X 1 2 12 22 2 11 21 1 1 1 1 中,至少有一列向量可由其他列向量(不包 括第一列)线性表出
2、实际经济问题中的多重共线性现象 ·经济变量的共同变化趋势 时间序列样本:经济繁荣时期,各基本经济 变量(收入、消费、投资、价格)都趋于增长; 衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动力 投入往往出现高度相关情况,大企业二者都大, 小企业都小
2、实际经济问题中的多重共线性现象 • 经济变量的共同变化趋势 时间序列样本:经济繁荣时期,各基本经济 变量(收入、消费、投资、价格)都趋于增长; 衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动力 投入往往出现高度相关情况,大企业二者都大, 小企业都小
滞后变量的引入 在计量经济模型中,往往需要引入滞后经济变 量来反映真实的经济关系。 例如,消费=当期收入,前期收入) 显然,两期收入间有较强的线性相关性
• 滞后变量的引入 在计量经济模型中,往往需要引入滞后经济变 量来反映真实的经济关系。 例如,消费=f(当期收入, 前期收入) 显然,两期收入间有较强的线性相关性