ome 计量经济学 第四章 多重共线性
1 第四章 多重共线性 计量经济学
0e 引子: 发展农业和建筑业会减少财政收入吗? 为了分析各主要因素对财政收入的影响,建立财政收 入模型: CS B+B NZ +B,GZ B.JZZ +β,TPOP+阝,CUM,+阝6SZM,+4 其中:CS财政收入(亿元) NZ农业增加值(亿元)方 GZ工业增加值(亿元)方 JZZ建筑业增加值(亿元);TPOP总人口(万人): CUM最终消费(亿元): SZM受灾面积(万公顷) 数据样本时期1978年-2003年(资料来源:《中国统计年鉴 2004》,中国统计出版社2004年版) 采用普通最小二乘法得到以下估计结果
2 引子: 发展农业和建筑业会减少财政收入吗? 为了分析各主要因素对财政收入的影响,建立财政收 入模型: 其中: CS财政收入(亿元) ; NZ农业增加值(亿元); GZ工业增加值(亿元); JZZ建筑业增加值(亿元); TPOP总人口(万人); CUM最终消费(亿元); SZM受灾面积(万公顷) 数据样本时期1978年-2003年(资料来源:《中国统计年鉴 2004》,中国统计出版社2004年版) 采用普通最小二乘法得到以下估计结果 i i i i i i i i TPOP CUM SZM u CS NZ GZ JZZ + + + + = + + + 4 5 6 0 1 2 3 b b b b b b b
ome 财政收入模型的EViews估计结果 Variable Coefficient Std.Error t-Statistic Prob. 农业增加值NZ -1.535090 0.129778 日82861 0.0000 工业增加值GZ 0.898788 0.245466 3.661558 0.0017 建筑业增加值JZZ -1.527089 1.206242 =1265989 0.2208 总人口TPOP 0.151160 0.033759 4.477646 0.0003 最终消费CUM 0.101514 0.105329 0963783 0.3473 受灾面积SZM -0.036836 0.018460 1.995382 0.0605 截距项 -1170334 3191.096 3605704 0.0015 R-squared 0.995015 Mean dependent var 5897.824 Adjusted R-squared 0.993441 S.D.dependent var 5945.854 S.E.of regression 481.5380 Akaike info criterion 15.41665 Sum squared resid 4405699 Schwarz criterion 15.75537 Log likelihood 193.4165 F-statistic 632.0999 Durbin-Watson stat 1.873809 Prob(F-statistic) 0.000090
3 Durbin-Watson stat 1.873809 Prob(F-statistic) 0.000000 Log likelihood -193.4165 F-statistic 632.0999 Sum squared resid 4405699. Schwarz criterion 15.75537 S.E. of regression 481.5380 Akaike info criterion 15.41665 Adjusted R-squared 0.993441 S.D. dependent var 5945.854 R-squared 0.995015 Mean dependent var 5897.824 截距项 -11793.34 3191.096 -3.695704 0.0015 受灾面积SZM -0.036836 0.018460 -1.995382 0.0605 最终消费CUM 0.101514 0.105329 0.963783 0.3473 总人口TPOP 0.151160 0.033759 4.477646 0.0003 建筑业增加值JZZ -1.527089 1.206242 -1.265989 0.2208 工业增加值GZ 0.898788 0.245466 3.661558 0.0017 农业增加值NZ -1.535090 0.129778 -11.82861 0.0000 Variable Coefficient Std. Error t-Statistic Prob. 财政收入模型的EViews估计结果
nome 模型估计与检验结果分析 可决系数为0.995,校正的可决系数为0.993,模型 拟合很好。模型对财政收入的解释程度高达99.5%。 ●F统计量为632.10,说明0.05水平下回归方程整体 上显著。 。t检验结果表明,除了工业增加值和总人口以 外,其他因素对财政收入的影响均不显著。 ·农业增加值和建筑业增加值的回归系数是负数。 农业和建筑业的发展反而会使财政收入减少吗?」 这样的异常结果显然与理论分析和实践经验不相符。 若模型设定和数据真实性没问题,问题出在哪里呢?
4 ●可决系数为0.995,校正的可决系数为0.993,模型 拟合很好。模型对财政收入的解释程度高达99.5%。 ●F统计量为632.10,说明0.05水平下回归方程整体 上显著。 ● t 检验结果表明,除了工业增加值和总人口以 外,其他因素对财政收入的影响均不显著。 ●农业增加值和建筑业增加值的回归系数是负数。 农业和建筑业的发展反而会使财政收入减少吗?! 这样的异常结果显然与理论分析和实践经验不相符。 若模型设定和数据真实性没问题,问题出在哪里呢? 模型估计与检验结果分析
第四章多重共线性 本章讨论四个问题: 。什么是多重共线性 。多重共线性产生的后果 。多重共线性的检验 。多重共线性的补救措施 5
5 第四章 多重共线性 本章讨论四个问题: ●什么是多重共线性 ●多重共线性产生的后果 ●多重共线性的检验 ●多重共线性的补救措施
onome 第一节什么是多重共线性 本节基本内容: 。多重共线性的含义 。产生多重共线性的背景 6
6 第一节 什么是多重共线性 本节基本内容: ●多重共线性的含义 ●产生多重共线性的背景
一、多重共线性的令义 在计量经济学中所谓的多重共线性(Mut Collinearity),不仅包括完全的多重共线性,还 包括不完全的多重共线性。 对于解释变量X2,X,X,如果存在不全为0的 数,2·人,使得 2+12X2,+入X,++1X6=0i=1,2,n 则称解释变量X2,X,.X之间存在着完全的多重 共线性
7 在计量经济学中所谓的多重共线性(MultiCollinearity),不仅包括完全的多重共线性,还 包括不完全的多重共线性。 对于解释变量 ,如果存在不全为0的 数 ,使得 则称解释变量 之间存在着完全的多重 共线性。 2 3 X , , X X L k λ1 2 k ,λ ,.λ 1 2 2 3 3 l +l +l l +.+ = = 0 1, 2,., X i X i kXki i n 2 3 , , , X X X L k 一、多重共线性的含义
当Rank(X)<k时,表明在数据矩阵X中,至少 有一个列向量可以用其余的列向量线性表示,则 说明存在完全的多重共线性
8 当 时,表明在数据矩阵 中,至少 有一个列向量可以用其余的列向量线性表示,则 说明存在完全的多重共线性。 Rank k ( ) X < X
ome 不完全的多重共线性 实际中,常见的情形是解释变量之间存在不完 全的多重共线性。 对于解释变量X2,X3,.X,存在不全为0的数 21,九2,.1,使得 入+12X2+人3X31++1X6+4=0i=1,2,n 其中,4,为随机变量。这表明解释变量 X2,X,.X只是一种近似的线性关系
9 不完全的多重共线性 实际中,常见的情形是解释变量之间存在不完 全的多重共线性。 对于解释变量 ,存在不全为0的数 ,使得 为随机变量。这表明解释变量 只是一种近似的线性关系。 其中, 2 3 X , , X X L k 1 2 l , , l l L k 1 2 2 3 3 l +l +l l +.+ + = = 0 1, 2,., X i X i kXki i u i n 2 3 X , , X X L k i u
回归模型中解释变量的关条 可能表现为三种情形: (但)上x,=0,解释变量间毫无线性关系,变量间相 互正交。这时己不需要作多元回归,每个参数B,都可 以通过Y对X的一元回归来估计。 (2)了,x,=1,解释变量间完全共线性。此时模型参 数将无法确定。 (3)0≤r≤1,解释变量间存在一定程度的线性关 系。实际中常遇到的情形。 10
10 ,解释变量间毫无线性关系,变量间相 互正交。这时已不需要作多元回归,每个参数bj都可 以通过Y 对 Xj 的一元回归来估计。 回归模型中解释变量的关系 可能表现为三种情形: (1) ,解释变量间完全共线性。此时模型参 数将无法确定。 ,解释变量间存在一定程度的线性关 系。实际中常遇到的情形。 (2) (3) 0 i j x x r = 1 i j x x r = 0 1 i j x x <r <