come 计量经济学 第四章 多重共线性
1 第四章 多重共线性 计量经济学
somet 引子 发展农业和建筑业会减少财政收入吗? 为了分析各主要因素对财政收入的影响,建立财政收 入模型:CS=Bn+BNZ+B、GZ1+B1,E1 B4TPOP+BsCUM+BsZM +u 其中:CS财政收入(亿元); Nz农业增加值(亿元)Gz工业增加值(亿元 Zz建筑业增加值(亿元)TPoP总人口(万人 CUM最终消费(亿元)SZM受灾面积(万公顷) 数据样本时期1978年-2003年(资料来源:《中国统计年鉴 2004》,中国统计出版社2004年版) 采用普通最小二乘法得到以下估计结果 2
2 引子: 发展农业和建筑业会减少财政收入吗? 为了分析各主要因素对财政收入的影响,建立财政收 入模型: 其中: CS财政收入(亿元) ; NZ农业增加值(亿元); GZ工业增加值(亿元); JZZ建筑业增加值(亿元); TPOP总人口(万人); CUM最终消费(亿元); SZM受灾面积(万公顷) 数据样本时期1978年-2003年(资料来源:《中国统计年鉴 2004》,中国统计出版社2004年版) 采用普通最小二乘法得到以下估计结果 i i i i i i i i TPOP CUM SZM u CS NZ GZ JZZ + + + + = + + + 4 5 6 0 1 2 3
come 财政收入模型的 EViews估计结果 Variable Coefficient Std. error t-Statistic Prob. 农业增加值NZ 1.535090 0.129778 82861 0.0000 工业增加值GZ 0.898788 0.245466 3.661558 0.0017 建筑业增加值JZZ 1.527089 206242 265989 0.2208 总人口TPOP 0.151160 0.033759 4.477646 0.0003 最终消费CUM 0.101514 0.105329 0963783 0.3473 受灾面积SZM -0.036836 0.018460 995382 0.0605 截距项 1170334 3191096 305T04 0.0015 R-squared 0.995015 Mean dependent var 5897.824 AdjustedR-squared 0.993441 S.D. dependent var 5945854 S.E. of regression 481.5380 Akaike info criterion 1541665 Sum squared resid 4405699 Schwarz criterion 15.75537 Log likelihood -1934165F-statistic 632.0999 Durbin-Watson stat1. 873809Prob(F-statistic) 0.000090
3 Variable Coefficient Std. Error t-Statistic Prob. 农业增加值NZ -1.535090 0.129778 -11.82861 0.0000 工业增加值GZ 0.898788 0.245466 3.661558 0.0017 建筑业增加值JZZ -1.527089 1.206242 -1.265989 0.2208 总人口TPOP 0.151160 0.033759 4.477646 0.0003 最终消费CUM 0.101514 0.105329 0.963783 0.3473 受灾面积SZM -0.036836 0.018460 -1.995382 0.0605 截距项 -11793.34 3191.096 -3.695704 0.0015 R-squared 0.995015 Mean dependent var 5897.824 Adjusted R-squared 0.993441 S.D. dependent var 5945.854 S.E. of regression 481.5380 Akaike info criterion 15.41665 Sum squared resid 4405699. Schwarz criterion 15.75537 Log likelihood -193.4165 F-statistic 632.0999 Durbin-Watson stat 1.873809 Prob(F-statistic) 0.000000 财政收入模型的EViews估计结果
come 模型估计与检验结果分析 可决系数为0.995,校正的可决系数为0993,模型 拟合很好。模型对财政收入的解释程度高达99.5%。 ●F统计量为63210,说明005水平下回归方程整体 上显著。 ●t检验结果表明,除了工业增加值和总人口以外 其他因素对财政收入的影响均不显著。 ●农业增加值和建筑业增加值的回归系数是负数。 农业和建筑业的发展反而会使财政收入减少吗?! 这样的异常结果显然与理论分析和实践经验不相符。 若模型设定和数据真实性没问题,问题出在哪里呢? 4
4 ●可决系数为0.995,校正的可决系数为0.993,模型 拟合很好。模型对财政收入的解释程度高达99.5%。 ●F统计量为632.10,说明0.05水平下回归方程整体 上显著。 ● t 检验结果表明,除了工业增加值和总人口以外, 其他因素对财政收入的影响均不显著。 ●农业增加值和建筑业增加值的回归系数是负数。 农业和建筑业的发展反而会使财政收入减少吗?! 这样的异常结果显然与理论分析和实践经验不相符。 若模型设定和数据真实性没问题,问题出在哪里呢? 模型估计与检验结果分析
come 第四章多重头线性 本章讨论四个问题: 什么是多重共线性 ●多重共线性产生的后果 ●多重共线性的检验 ●多重共线性的补救措施 5
5 第四章 多重共线性 本章讨论四个问题: ●什么是多重共线性 ●多重共线性产生的后果 ●多重共线性的检验 ●多重共线性的补救措施
come 第一节什么是多重共线性 本节基本内容: ●多重共线性的含义 ●产生多重共线性的背景 6
6 第一节 什么是多重共线性 本节基本内容: ●多重共线性的含义 ●产生多重共线性的背景
come ⌒、多重共线性的含义 在计量经济学中所谓的多重共线性(Mu|ti Collinearity),不仅包括完全的多重共线性,还 包括不完全的多重共线性。 对于解释变量X2X32…,Xk,如果存在不全为0的 数l, 使得 +2X2+3X3+…+X=0÷=1,2,…,n 则称解释变量2X3…X之间存在着完全的多重 共线性
7 在计量经济学中所谓的多重共线性(MultiCollinearity),不仅包括完全的多重共线性,还 包括不完全的多重共线性。 对于解释变量 ,如果存在不全为0的 数 ,使得 则称解释变量 之间存在着完全的多重 共线性。 2 3 , , X X Xk λ1 2 k ,λ ,...λ 1 2 2 3 3 + + + + = = ... 0 1, 2,..., X X X i n i i k ki 2 3 , , , X X Xk 一、多重共线性的含义
come 当 Rank(X)<k时,表明在数据矩阵X中,至少 有一个列向量可以用其余的列向量线性表示,则 说明存在完全的多重共线性。 8
8 当 时,表明在数据矩阵 中,至少 有一个列向量可以用其余的列向量线性表示,则 说明存在完全的多重共线性。 Rank k ( ) X X
come 3不完全的多重共线性 实际中,常见的情形是解释变量之间存在不完 全的多重共线性。 对于解释变量X2X2…X,存在不全为0的数 ,…,使得 1+2X2+3X3+…+4X+1=01=1,2…,n 其中,1为随机变量。这表明解释变量 X22X3,…只是一种近似的线性关系 9
9 不完全的多重共线性 实际中,常见的情形是解释变量之间存在不完 全的多重共线性。 对于解释变量 ,存在不全为0的数 ,使得 为随机变量。这表明解释变量 只是一种近似的线性关系。 其中, 2 3 , , X X Xk 1 2 , , k 1 2 2 3 3 + + + + + = = ... 0 1, 2,..., X X X u i n i i k ki i 2 3 , , X X Xk i u
come 回归模型中解释变量的关糸 可能表现为三种情形: (1)rx=0,解释变量间毫无线性关系,变量间相 互正交。这时已不需要作多元回归,每个参数/都可 以通过Y对X的一元回归来估计 (2)rx=1,解释变量间完全共线性。此时模型参 数将无法确定 (3)0≤κx<1,解释变量间存在一定程度的线性关 系。实际中常遇到的情形
10 ,解释变量间毫无线性关系,变量间相 互正交。这时已不需要作多元回归,每个参数j都可 以通过Y 对 Xj 的一元回归来估计。 回归模型中解释变量的关系 可能表现为三种情形: (1) ,解释变量间完全共线性。此时模型参 数将无法确定。 ,解释变量间存在一定程度的线性关 系。实际中常遇到的情形。 (2) (3) 0 i j x x r = 1 i j x x r = 0 1 i j x x <r <