第4讲模型诊断与检验 (1)回归函数的F检验 (2)回归参数的t检验。 3)检验线性约束条件是否成立的F检验 (4)JB正态性检验 (5)似然比(LR)检验 (6)W检验 (7)LM乘数检验。 (8)邹突变点检验( Chow Breakpoint Tests) (9)回归系数的稳定性检验(Chow检验) (10)是否为白噪声过程的Q检验 (11)平方的残差值序列的Q检验 (12) Ramsey reSeT检验( Ramsey模型设定误差检验) (13)异方差的 White检验(略) (14)自相关的LM检验(亦称BG检验)(略) (15)格兰杰非因果性检验 (16)内生性 Hausman检验(不讲) (1)回归函数的F检验。 多元回归模型, y=Bo+Bixn+ Bxn +. Ba-1xrk-1+ur H:B1=B=,,=B1=0;H1:房不全为零 原假设成立条件下,统计量 F= SSR/(-D-F(k-1T-k) 其中SSR是回归平方和,SSE是残差平方和。k表示被估参数个数。 注意:SSR旧指回归平方和( regression sum of squares),现指残差平方和( sum of squared residuals)。SE旧指残差平方和( error sum of squares( sum of squared errors),现指回归平方和 (explained sum of squares)o 检验规则是,若F≤Fa(k-1,T-k),接受H 若F>Fa(k-1,T-k),拒绝Ho (2)回归参数的t检验 对于多元回归模型, B+B1x1+Bx2+..+R-1xk1+m, (2) 如果F检验的结论是接受原假设,则检验止。如果F检验的结论是拒绝原假设,则进一步作t 检验 Ho:B=0;H1:B≠0,(=1,2,…,k-1) 原假设成立条件下,统计量 (7-k) s(B 判别规则:若|t|≤t(r-k),接受Ho 若|t|>a(7-k),拒绝H
1 第 4 讲 模型诊断与检验 (1)回归函数的 F 检验。 (2)回归参数的 t 检验。 (3)检验线性约束条件是否成立的 F 检验。 (4)JB 正态性检验 (5)似然比(LR)检验 (6)W 检验 (7)LM 乘数检验。 (8)邹突变点检验(Chow Breakpoint Tests) (9)回归系数的稳定性检验(Chow 检验) (10)是否为白噪声过程的 Q 检验 (11)平方的残差值序列的 Q 检验 (12)Ramsey RESET 检验(Ramsey 模型设定误差检验) (13)异方差的 White 检验(略) (14)自相关的 LM 检验(亦称 BG 检验)(略) (15)格兰杰非因果性检验 (16)内生性 Hausman 检验(不讲) (1)回归函数的 F 检验。 多元回归模型, yt = 0 +1xt1 + 2xt2 +…+ k- 1xt k -1 + ut , (1) H0:1= 2 = … = k-1 = 0;H1:j 不全为零 原假设成立条件下,统计量 F = /( ) /( 1) SSE T k SSR k − − F(k-1,T-k) 其中 SSR 是回归平方和,SSE 是残差平方和。k 表示被估参数个数。 注意:SSR 旧指回归平方和(regression sum of squares),现指残差平方和(sum of squared residuals)。SSE 旧指残差平方和(error sum of squares (sum of squared errors)),现指回归平方和 (explained sum of squares)。 检验规则是,若 F F (k-1,T-k),接受 H0; 若 F > F (k-1,T-k) , 拒绝 H0。 (2)回归参数的 t 检验。 对于多元回归模型, yt = 0 +1xt1 + 2xt2 +…+ k- 1xt k -1 + ut , (2) 如果 F 检验的结论是接受原假设,则检验止。如果 F 检验的结论是拒绝原假设,则进一步作 t 检验。 H0:j = 0;H1:j 0,(j = 1, 2, …, k-1) 原假设成立条件下,统计量 t = ) ˆ ( ˆ j j s t(−k) 判别规则:若 t t(−k),接受 H0; 若 t > t(−k),拒绝 H0
(3)检验线性约束条件是否成立的F检验。 约束条件的F检验可以用来检验回归参数的一个或多个线性约束条件,如Ho:B1=0,B= 0,a1++负1=1,角1=0.8等。 在零假设“约束条件成立”条件下,统计量 (SSE -SEW)/n F(m,T-k SSE/T-k 其中SSEr表示施加约東条件后估计模型的残差平方和;SSEn表示未施加约東条件的估计模型 的残差平方和:m表示约東条件个数:T表示样本容量:k表示非约束模型中被估参数的个数 判别规则是,若FFa(2,7-4),约束条件不成立 例:(file:blc4)中国国债发行额模型 首先分析中国国债发行额序列的特征。1980年国债发行额是4301亿元,占GDP当年总量 的1%,2001年国债发行额是4604亿元,占GDP当年总量的48%。以当年价格计算,21年间 (1980-2001)增长了106倍。平均年增长率是249%。 DEBT Mean 1216395 Median 4346850 Maximum 4604000 4301000 Std. Dev 1485993 中国当前正处在社会主义市场经济体制逐步完善,宏观经济运行平稳阶段。国债发行总量 应该与经济总规模,财政赤字的多少,每年的还本付息能力有关系。选择3个解释变量,国内 生产总值,财政赤字额,年还本付息额,根据散点图(略)建立中国国债发行额模型如下: DEBT,=B0+PI GDPI+B2 DEF+B REPAYI+ ur 其中DEBT表示国债发行总额(单位:亿元),GDP1表示年国内生产总值(单位:百亿元), DEF1表示年财政赤字额(单位:亿元),REPY表示年还本付息额(单位:亿元)。用1980~2001 年数据(资料来源:《中国统计年鉴》2002,表8-19,表3-1,表8-1,表820)得输出结果如 DEBT=4.31 +0.35 GDP,+1. 00 DEF,+0. 88 REPAY. (0.2)(2.2)(31.5)(17.8) R2=0.999,DW=2.12,T=22,SSE=48460.78,(1980-2001) Correlation matrix DEBT GDP EPAY 0000009677510945247 09677511000008696430.954508 0.945247 86943100000787957 REAY09440954508078795710000 图112
2 (3)检验线性约束条件是否成立的 F 检验。 约束条件的 F 检验可以用来检验回归参数的一个或多个线性约束条件,如 H0:1 = 0,2 = 0,1 +0 + 1 =1,1 /2 =0.8 等。 在零假设“约束条件成立”条件下,统计量 F = /( ) ( )/ SSE T k SSE SSE m u r u − − F( m , T – k ) 其中 SSEr 表示施加约束条件后估计模型的残差平方和;SSEu 表示未施加约束条件的估计模型 的残差平方和;m 表示约束条件个数;T 表示样本容量;k 表示非约束模型中被估参数的个数。 判别规则是,若 F < F (2, T - 4),约束条件成立, 若 F F (2, T - 4),约束条件不成立。 例:(file: b1c4)中国国债发行额模型 首先分析中国国债发行额序列的特征。1980 年国债发行额是 43.01 亿元,占 GDP 当年总量 的 1%,2001 年国债发行额是 4604 亿元,占 GDP 当年总量的 4.8%。以当年价格计算,21 年间 (1980-2001)增长了 106 倍。平均年增长率是 24.9%。 0 1000 2000 3000 4000 5000 80 82 84 86 88 90 92 94 96 98 00 DEBT 中国当前正处在社会主义市场经济体制逐步完善,宏观经济运行平稳阶段。国债发行总量 应该与经济总规模,财政赤字的多少,每年的还本付息能力有关系。选择 3 个解释变量,国内 生产总值,财政赤字额,年还本付息额,根据散点图(略)建立中国国债发行额模型如下: DEBTt = 0 +1 GDPt +2 DEFt +3 REPAYt+ ut 其中 DEBTt 表示国债发行总额(单位:亿元),GDPt 表示年国内生产总值(单位:百亿元), DEFt 表示年财政赤字额(单位:亿元),REPAYt 表示年还本付息额(单位:亿元)。用 19802001 年数据(资料来源:《中国统计年鉴》2002,表 8-19,表 3-1,表 8-1,表 8-20)得输出结果如 下; DEBTt = 4.31 +0.35 GDPt +1.00 DEFt +0.88REPAYt (11.7) (0.2) (2.2) (31.5) (17.8) R 2 = 0.9990, DW=2.12, T =22, SSEu= 48460.78, (1980-2001) 图 11.2
由上述4个变量的相关系数矩阵(图112)知,DEBT和GDP1的相关性最强。那么是否可 以从模型中删掉DEF和 REPAy呢? 可以用F统计量完成上述检验。原假设H是B3=B=0(约束DEF和 REPAY的系数为零) 给出约束模型估计结果如下 DEBT=-38840+4.49 GDP. (-3.1)(17.2) R2=0.94,DW=0.25,7=22,SSE=2942679,(1980-2001) 已知约束条件个数m=2,Tkl=18。根据(11.7)、(118)式,SSE=48460.78,SSE= 2942679。依照(11.6)式, F=(S-sE)/m=(2942679-4846078 537.5 SSE /(T-k-D 48460.78/(22-4) 因为F=537.5远远大于临界值Fo∞s(2,18)=3.5,所以拒绝原假设。不能从模型中删除解释变量 DEF和 REPAY EⅤiews可以有三种途径完成上述检验。 (1)在(11.7)式输出结果窗口中点击Vew,选 Coefficient Tests, Wald Coefficient Restrictions 功能(wald参数约束检验),在随后弹出的对话框中填入c(3)=c(4)=0。可得如图11.3结果。 其中F=537.5 Wald Test Equation: E@01 Test Statistic Valu df Probability F-statistic 53750502,18)0.000 Chi-square 1075012 Null Hypothesis Summary Normalized Restriction (0) alue Std. Err 09954030031613 C(4) 08797600049508 Restrictions are linear in coefficients 图11.3 (2)在(117)式输出结果窗口中点击vew,选 Coefficient Tests, Redundant variables Likelihood Ratio功能(模型中是否存在多余的不重要解释变量),在随后弹出的对话框中填入 DEF, REPAy。可得图11.4。计算结果同样是F=5375。 Redundant Variables: DEF REPAY F-statistic 537 5060 Probability Log likelihood ratio 90.33906 Probability 图114 (3)在(18)式输出结果窗口中点击View,选 Coefficient Tests, Omitted Variables- Likelihood Ratio功能(模型中是否丢了重要的解释变量),在随后弹出的对话框中填入拟加入的解释变量 DEF, REPAY。可得到如图11.5的结果。同样是F=5375
3 由上述 4 个变量的相关系数矩阵(图 11.2)知,DEBTt 和 GDPt 的相关性最强。那么是否可 以从模型中删掉 DEFt 和 REPAYt 呢? 可以用 F 统计量完成上述检验。原假设 H0 是3 = 4 = 0(约束 DEFt 和 REPAYt 的系数为零)。 给出约束模型估计结果如下, DEBTt = -388.40 +4.49 GDPt (11.8) (-3.1) (17.2) R 2 = 0.94, DW=0.25, T =22, SSEr= 2942679, (1980-2001) 已知约束条件个数 m = 2,T- k-1 = 18。根据(11.7)、(11.8)式,SSEu= 48460.78,SSEr= 2942679。依照(11.6)式, F = /( 1) ( )/ − − − SSE T k SSE SSE m u r u = 48460.78 /(22 4) (2942679 48460.78)/ 2 − − = 537.5 因为 F=537.5 远远大于临界值 F0.05 (2, 18) =3.55,所以拒绝原假设。不能从模型中删除解释变量 DEFt 和 REPAYt。 EViews 可以有三种途径完成上述检验。 (1)在(11.7)式输出结果窗口中点击 View,选 Coefficient Tests, Wald Coefficient Restrictions 功能(Wald 参数约束检验),在随后弹出的对话框中填入 c(3) = c(4) = 0。可得如图 11.3 结果。 其中 F = 537.5。 图 11.3 (2)在(11.7)式输出结果窗口中点击 View,选 Coefficient Tests, Redundant Variables -Likelihood Ratio 功能(模型中是否存在多余的不重要解释变量),在随后弹出的对话框中填入 DEF,REPAY。可得图 11.4。计算结果同样是 F = 537.5。 图 11.4 (3)在(11.8)式输出结果窗口中点击 View,选 Coefficient Tests, Omitted Variables -Likelihood Ratio 功能(模型中是否丢了重要的解释变量),在随后弹出的对话框中填入拟加入的解释变量 DEF,REPAY。可得到如图 11.5 的结果。同样是 F = 537.5
Omitted Variables, DEF REPAY F-statistic 537 5060 Probability Log likelihood ratio 90 33906 Probability 图11.5 (4)JB正态性检验 在给出JB统计量的定义之前,先给出偏度( skewness)和峰度( kurtosis,峭度)的定义, 对于时间序列(yn,y2,…,y),偏度S定义为, 其中y是观测值,是样本平均数,表示y的标准差,s=1三 T是样本容量。由 公式知,若分布是以对称的,则偏度为零。所以若y服从正态分布,则偏度为零;若分布是 右偏倚的,则偏度S>0:若分布是左偏倚的,则偏度S3,反之则K<3。 JB( Jarque-Bera)统计量定义如下
4 图 11.5 (4)JB 正态性检验 在给出 JB 统计量的定义之前,先给出偏度(skewness)和峰度(kurtosis,峭度)的定义。 对于时间序列(y1, y2, …, yT),偏度 S 定义为, 3 1 ( ) 1 = − = T t t s y y T S 其中 yt 是观测值, y 是样本平均数,s 表示 yt 的标准差, 1 ( ) 1 2 − − = = T y y s T t t ,T 是样本容量。由 公式知,若分布是以 y 对称的,则偏度为零。所以若 yt 服从正态分布,则偏度为零;若分布是 右偏倚的,则偏度 S 0;若分布是左偏倚的,则偏度 S 0。 x < Md < Mo x = Md = Mo MO Md x 峰度 K 定义为 4 1 ( ) 1 = − = T t t s y y T K 其中 yt 是观测值, y 是样本平均数,s 是样本标准差,T 是样本容量。正态分布的峰度值为 3。 如果一个分布的两侧尾部比正态分布的两侧尾部“胖”,则该分布的峰度 K 3,反之则 K 3。 JB(Jarque-Bera)统计量定义如下, JB = ( 3) ] 4 1 [ 6 2 2 + − − S K T n 2 (2)
其中T表示观测值个数。对于直接得到的观测时间序列,取n=0。对于残差序列,取n等于原 回归模型中解释变量个数。S表示偏度。K表示峰度。计算结果 若JBx2(2),该分布不是正态分布 当用样本计算偏度和峰度时,T应换为T-1,σ2用y的样本方差s代替。 例:(fle:simu2,x) EViews操作如下。 ries: orkfile: SI12 spreadsheet eeze Edit+/- Smpl+/-Label+/ L: X Bar Graph ptive Statisti and Stat Tests for Descriptive Stats Stats by Classificati on 12000 ample 1 100000 10000 Observations 100000 8000 0.002371 Median 0.006320 4.546195 Minimum 4000 -0.014181 Kurtosis 3.009264 Jarque-Bera 3.709376 Probability 0. 156502 因为JB=3.71<x205(2)=599,所以上述分布为正态分布 0.5
5 其中 T 表示观测值个数。对于直接得到的观测时间序列,取 n = 0。对于残差序列,取 n 等于原 回归模型中解释变量个数。S 表示偏度。K 表示峰度。计算结果 若 JB 2 (2),该分布为正态分布, 若 JB 2 (2),该分布不是正态分布。 当用样本计算偏度和峰度时,T 应换为 T -1, 2 用 yt 的样本方差 s 2 代替。 例:(file: simu2, x)EViews 操作如下。 0 2000 4000 6000 8000 10000 12000 -2.5 0.0 2.5 Series: Y Sample 1 100000 Observations 100000 Mean 0.002371 Median 0.006320 Maximum 4.546195 Minimum -4.489619 Std. Dev. 0.998553 Skewness -0.014181 Kurtosis 3.009264 Jarque-Bera 3.709376 Probability 0.156502 因为 JB = 3.71 < 2 0.05 (2) = 5.99,所以上述分布为正态分布。 2 4 6 8 10 0.1 0.2 0.3 0.4 0.5
2800 2400 Sample 1 100000 2000 1600 Maximum 171e05 0288633 newness 0.001811 Kurtosis 400. Jarque-Bera 6009.177 0.75 因为JB=6009>x200(2)=599,所以上述分布不是正态分布。 英 K Pearson提出的分布律检验适用性更广。 (5)似然比(LR)检验 下面介绍三种常用的检验方法,即似然比(LR)检验,沃尔德(W)检验和拉格朗日( lagrange) 乘数(LM)检验。这三种检验所用统计量都是利用极大似然估计法计算的。LR检验由内曼 皮尔逊( Neyman- Pearson1928)提出,只适用于对线性约束的检验。W检验和LM检验既适用 于对线性约束条件的检验,也适用于对非线性约束条件的检验。 首先介绍LR检验。LR检验的基本思路是如果约束条件成立则相应约束模型与非约束模型 的极大似然函数值应该是近似相等的。用 logL(B, a2)=--l0g 2o2- ∑n2 (3) 表示非约束模型的极大似然函数。其中B和a2分别是对B(参数集合),a2的极大似然估计。 用 logl(b,0) 表示约束模型的极大似然函数。其中B和2分别是对B和σ2的极大似然估计。定义似然比 (LR)统计量为 LR=-2[ log L(B, 02)-l0gL(B, 62) 中括号内是两个似然函数之比(似然比检验由此而得名)。在零假设约束条件成立条件下 LR-(m) 其中m表示约束条件个数。用样本计算LR统计量。 判别规则是,若LRx2a(m),则拒绝零假设,约束条件不成立。 例:(fle:blc4)仍以中国国债发行总量(DEBT,亿元)模型为例。选择3个解释变量, 国内生产总值(百亿元),财政赤字额(亿元),年还本付息额(亿元),根据散点图建立中国国 债发行额(DEBT,亿元)模型如下:
6 0 400 800 1200 1600 2000 2400 2800 0.00 0.25 0.50 0.75 1.00 Series: X Sample 1 100000 Observations 100000 Mean 0.499003 Median 0.499078 Maximum 0.999974 Minimum 1.71e-05 Std. Dev. 0.288633 Skewness 0.001811 Kurtosis 1.799088 Jarque-Bera 6009.177 Probability 0.000000 因为 JB = 6009 > 2 0.05 (2) = 5.99,所以上述分布不是正态分布。 英 K. Pearson 提出的分布律检验适用性更广。 (5)似然比(LR)检验 下面介绍三种常用的检验方法,即似然比(LR)检验,沃尔德(W)检验和拉格朗日(lagrange) 乘数(LM)检验。这三种检验所用统计量都是利用极大似然估计法计算的。LR 检验由内曼— 皮尔逊(Neyman-Pearson 1928)提出,只适用于对线性约束的检验。W 检验和 LM 检验既适用 于对线性约束条件的检验,也适用于对非线性约束条件的检验。 首先介绍 LR 检验。LR 检验的基本思路是如果约束条件成立则相应约束模型与非约束模型 的极大似然函数值应该是近似相等的。用 log L( ˆ , 2 ˆ ) = - 2 T log 2 2 ˆ - 2 2 2 ˆ ˆ t u (3) 表示非约束模型的极大似然函数。其中 ˆ 和 2 ˆ 分别是对 (参数集合), 的极大似然估计。 用 log L( ~ , ~2 ) = - 2 T log 2 ~2 - 2 2 ~ 2 ~ t u (4) 表示约束模型的极大似然函数。其中 ~ 和 ~2 分别是对 和 2 的极大似然估计。定义似然比 (LR)统计量为 LR = - 2 [ log L( ~ , ~2 ) - log L( ˆ , 2 ˆ ) ] (5) 中括号内是两个似然函数之比(似然比检验由此而得名)。在零假设约束条件成立条件下 LR (m) (6) 其中 m 表示约束条件个数。用样本计算 LR 统计量。 判别规则是,若 LR 2 (m) , 则拒绝零假设,约束条件不成立。 例:(file: b1c4)仍以中国国债发行总量(DEBTt,亿元)模型为例。选择 3 个解释变量, 国内生产总值(百亿元),财政赤字额(亿元),年还本付息额(亿元),根据散点图建立中国国 债发行额(DEBTt,亿元)模型如下:
DEBT:=B0+BI GDP+B2 DEF+B3 REPAY,+ ur 其中GDP表示年国内生产总值(百亿元),DEF表示年财政赤字额(亿元), REPAY表示年还 本付息额(亿元)。用1980-2001年数据得输出结果如下 DEBT=431 +0.35 GDP, +0.99 DEF, +O 88 REPAY (0.2)(2 (31.5)(17.8) R2=0.999,DW=2.12,T=22,logl=-115888(1980-2001) DEBTGDP DEFREPAY 100000096775109452470944498 09677110000008696430.954508 0945247 0869543 1000000 0.78795 09444809545080.78795710000 有相关系数矩阵知,DEBT;和GDP的相关性最强。那么是否可以从模型中删掉DEF和 REPAy呢? 用LR统计量检验是否可以对上式施加约束DEF和REPY的系数房=B=0。给出约束模 型估计结果如下, DEBT1=-38840+449GDP (11.8) (-3.1)(17.2) R2=094,DW=0.25,7=2,logL=-161.0583,(1980-2001) LR=-2[logL(B,G2)-lgL(B,a2)]=-2(-161.0583+115.888=90.34 因为LR=90.34>x2(2)=59,所以推翻原假设,即不能从模型中删除变量DEF1和 REPAY, 附录 EViews操作(1):在(11.7)式窗口中点击vew,选 Coefficient Tests, Redundant Variables Likelihood Ratio功能(模型中是否存在多余的不重要解释变量),在随后弹出的对话框中填入 DEF和 REPAy。可得如下结果 Redundant Variables: DEF REPAY F-statistic 537 5060 Probabilit Log likelihood ratio 90.33906 Probability EViews操作(2):在(1.8)式窗口中点击Vew,选 Coefficient Tests, Omitted Variables Likelihood Ratio功能(模型中是否丢了重要的解释变量),在随后弹出的对话框中填入拟加入 的解释变量DEF和REPY。也可得到如上结果。 (6)W检验 W检验的优点是只需估计无约東模型。当约束模型的估计很困难时,此方法尤其适用。 检验由沃尔德(wald1943)提出,适用于线性与非线性约束条件的检验 W检验的原理是测量无约束估计量与约束估计量之间的距离。先举一个简单例子。比如对 如下模型 y=B1xIt+B2x2r+ B3x3t+vr 检验线性约束条件负=B是否成立。W检验只需对无约束模型(进行估计,因为对约束模型, 上式必变化为y=月xn+B(x2x+x)+,所以对约束估计量B2和B3来说,必然有B2-B3=0
7 DEBTt = 0 +1 GDPt +2 DEFt +3 REPAYt+ ut 其中 GDPt 表示年国内生产总值(百亿元),DEFt 表示年财政赤字额(亿元),REPAYt 表示年还 本付息额(亿元)。用 1980-2001 年数据得输出结果如下; DEBTt = 4.31 +0.35GDPt +0.99 DEFt +0.88REPAYt (11.7) (0.2) (2.2) (31.5) (17.8) R 2 = 0.9990, DW=2.12, T =22, logL= -115.8888, (1980-2001) 有相关系数矩阵知,DEBTt 和 GDPt 的相关性最强。那么是否可以从模型中删掉 DEFt 和 REPAYt 呢? 用 LR 统计量检验是否可以对上式施加约束 DEFt 和 REPAYt 的系数3 = 4 = 0。给出约束模 型估计结果如下, DEBTt = -388.40 +4.49 GDPt (11.8) (-3.1) (17.2) R 2 = 0.94, DW=0.25, T =22, logL= -161.0583, (1980-2001) LR = - 2 [ log L( ~ , ~2 ) - log L( ˆ , 2 ˆ ) ]= -2 (-161.0583 +115.8888) = 90.34 因为 LR = 90.34 2 (2) = 5.99,所以推翻原假设,即不能从模型中删除变量 DEFt 和 REPAYt。 附录: EViews 操作(1):在(11.7)式窗口中点击 View,选 Coefficient Tests, Redundant Variables -Likelihood Ratio 功能(模型中是否存在多余的不重要解释变量),在随后弹出的对话框中填入 DEF 和 REPAY。可得如下结果。 EViews 操作(2):在(11.8)式窗口中点击 View,选 Coefficient Tests, Omitted Variables -Likelihood Ratio 功能(模型中是否丢了重要的解释变量),在随后弹出的对话框中填入拟加入 的解释变量 DEF 和 REPAY。也可得到如上结果。 (6)W 检验 W 检验的优点是只需估计无约束模型。当约束模型的估计很困难时,此方法尤其适用。W 检验由沃尔德(Wald 1943)提出,适用于线性与非线性约束条件的检验。 W 检验的原理是测量无约束估计量与约束估计量之间的距离。先举一个简单例子。比如对 如下模型 yt = 1 x 1t + 2 x2 t + 3 x3 t + vt (7) 检验线性约束条件2 = 3 是否成立。W 检验只需对无约束模型(7)进行估计,因为对约束模型, 上式必变化为 yt = 1 x 1t + 2 (x2t + x3t) + vt ,所以对约束估计量 2 ~ 和 3 ~ 来说,必然有 2 ~ - 3 ~ = 0
如果约束条件成立,则无约束估计量2-B3应该近似为零。如果约束条件不成立,则无约束估 计量B2B3应该显著地不为零。关键是要找到一个准则,从而判断什么是显著地不为零。 首先需要知道(B2-B3)的抽样分布。依据经典回归的假定条件,(B2-B3)服从均值为 (B-B),方差为Ma(B2-B3)的正态分布。通常W(B2-B3)是未知的,使用的是wa(2-B3) 的样本估计量,定义W统计量为, 2-/√m(A2-)~NO,D) 在约束条件成立条件下,W渐进服从N(0,1)分布 下面讨论多个约束条件的情形。假定若干约束条件是以联合检验的形式给出 fB)=0 其中∫表示由约束条件组成的列向量。用B表示施加约束条件后对参数集合{B,B,…,B} 的估计。若把B代入上式,则上式一定成立。当把无约束估计值β代入上式时,通常上式不 会成立。W统计量定义如下, w=f()(xm)ar((p))(mxm)f()(mxl) 其中∫B)是用B代替B后的fB)表达式,VarB)是爪B)的估计的方差协方差矩阵。计算公 式如下 Arff(B) vartAn kxk) (10) 其中可()/B表示AB用无约束估计量B代替后的偏导数矩阵,其中第i行第j列位置上的 元素表示第i个约束条对第j个无约束估计量的偏导数值。Ⅴar(B)是B的估计的方差协方差矩 阵 在约束条件成立条件下,W=fBy[var(fB)]fB)渐近服从x2m)分布。 W=f(B(wmyn(fB)mxm)f(B(m)~-xom) 其中m表示被检验的约束条件的个数 举一个非线性约束的例子如下。假定对模型 y=B1xn+A2xn+B3 x13+ ur 检验约束条件BB=B是否成立。用B1,B2和B3分别表示,鱼和房的非约束估计量。B1 B2和B3既可以是极大似然估计量,也可以是最小二乘估计量。因为对于本例几B)只含有 个约束条件,所以改用fB)表示,有 f(B)=B B2-B3 (B=(9y(B)=(2B1-1
8 如果约束条件成立,则无约束估计量 2 ˆ - 3 ˆ 应该近似为零。如果约束条件不成立,则无约束估 计量 2 ˆ - 3 ˆ 应该显著地不为零。关键是要找到一个准则,从而判断什么是显著地不为零。 首先需要知道( 2 ˆ - 3 ˆ )的抽样分布。依据经典回归的假定条件,( 2 ˆ - 3 ˆ )服从均值为 (2-3),方差为 Var( 2 ˆ - 3 ˆ ) 的正态分布。通常 Var( 2 ˆ - 3 ˆ ) 是未知的,使用的是 Var( 2 ˆ - 3 ˆ ) 的样本估计量,定义 W 统计量为, W = ) ˆ ˆ ) Var( ˆ ˆ (2 − 3 2 − 3 N(0, 1) 在约束条件成立条件下,W 渐进服从 N(0, 1) 分布。 下面讨论多个约束条件的情形。假定若干约束条件是以联合检验的形式给出, f( ) = 0, (8) 其中 f() 表示由约束条件组成的列向量。用 ~ 表示施加约束条件后对参数集合 {1, 2, …, k } 的估计。若把 ~ 代入上式,则上式一定成立。当把无约束估计值 ˆ 代入上式时,通常上式不 会成立。W 统计量定义如下, ( 1) 1 ( ) ' (1 ) ) ˆ )) ( ˆ ) ( ( ˆ ( − = W m m m m f Var f f (9) 其中 f( ˆ )是用 ˆ 代替 后的 f( )表达式,Var(f( ˆ )) 是 f( ˆ )的估计的方差协方差矩阵。计算公 式如下: ' ( ) ( ) ( ) ˆ ) ˆ ( ) ˆ ( ˆ ) ˆ ( )) ˆ ( ( k m k k m k = f Var f Var f (10) 其中 ˆ ) ˆ f ( 表示 f() 用无约束估计量 ˆ 代替后的偏导数矩阵,其中第 i 行第 j 列位置上的 元素表示第 i 个约束条对第 j 个无约束估计量的偏导数值。Var( ˆ ) 是 ˆ 的估计的方差协方差矩 阵。 在约束条件成立条件下,W = f( ˆ )' [Var( f( ˆ ) ) ] –1 f( ˆ ) 渐近服从 (m) 分布。 ( 1) 1 ( ) ' (1 ) ) ˆ )) ( ˆ ) ( ( ˆ ( − = W m m m m f Var f f (m) 其中 m 表示被检验的约束条件的个数, 举一个非线性约束的例子如下。假定对模型 yt = 1 xt1 +2 xt2 +3 xt3 + ut (11) 检验约束条件 1 2 = 3 是否成立。用 , ˆ 1 2 ˆ 和 3 ˆ 分别表示 , 和 的非约束估计量。 1 ˆ , 2 ˆ 和 3 ˆ 既可以是极大似然估计量,也可以是最小二乘估计量。因为对于本例 f( ˆ ) 只含有一 个约束条件,所以改用 f( ˆ ) 表示,有 f ( ˆ ) = 1 ˆ 2 ˆ - 3 ˆ (12) ˆ ) ˆ ( f = ( 1 ˆ ) ˆ ( f 2 ˆ ) ˆ ( f 3 ˆ ) ˆ ( f ) = ( 2 ˆ 1 ˆ -1 ), (13)
Var() Cov(Bi B2)Cov B,B3) Var( B)=Cov(B1B2) Var(B2)Cov(B2B,) Cov(B,B3)Cov(B2 B3) Var(B3) AI Var(B)=(B2 B-1)Var(B)B 根据(9)式,W统计量的具体表达式是 W=-(P1B2-B3) 「B2 (B2 B-1)Var(P)Pl 在零假设BB=B成立条件下,W统计量近似服从x2(1)分布 例:( file: nonoil2)对台湾制造业生产函数,检验/B=0.5是否成立。 Lny=-8.4010+0.6731Lnxn+1.1816Lnx (15) (-3.1)(4.4) R2=0.98,F=3358,DW=1.3,T=15,(1958-1972) 检验B/B=0.5是否成立。 变换约束条件为 B2-0.56=0 因为只有一个约束条件,则 八B)=f(B)=B2-0.56 (B)=9()9902)=(0105) Coefficient Covariance Matrix OG(X1)L LOG C 73859620377604081578 LoG(X1)03776040023453004378 LoG(X2)081567800438780091226 在(15式窗口中点击Vew,选 Coefficient Covariance功能。 738600.3776-0.8157 Var(B)=037760.0235-00439 0.8157-0.04390.0912 Varve)=(g(B) 可f(B) )(var(B))() B
9 Var( ˆ ) = ) ˆ ) Var( ˆ ˆ ) Cov( ˆ ˆ Cov( ) ˆ ˆ ) Cov( ˆ ) Var( ˆ ˆ Cov( ) Cov ˆ ˆ ) ˆ ˆ ) Cov( ˆ Var( 1 3 2 3 3 1 2 2 2 3 1 1 2 1 3 (14) 和 Var(f( ˆ )) = ( 2 ˆ 1 ˆ -1) Var( ) ˆ −1 ˆ ˆ 1 2 , 根据(9)式,W 统计量的具体表达式是, W = − − − 1 ˆ ˆ ) ˆ 1) ( ˆ ˆ ( ) ˆ ˆ ˆ ( 1 2 2 1 2 1 2 3 Var 在零假设 1 2 = 3 成立条件下,W 统计量近似服从 (1) 分布。 例:(file: nonli12)对台湾制造业生产函数,检验1/2 = 0.5 是否成立。 Lnyt = -8.4010 + 0.6731 Lnxt1 + 1.1816 Lnxt2 (15) (-3.1) (4.4) (3.9) R 2 = 0.98, F = 335.8, DW=1.3, T=15, (19581972) 检验2/3 = 0.5 是否成立。 变换约束条件为 2 - 0.53 = 0 因为只有一个约束条件,则 f( ˆ ) = f ( ˆ ) = 2 - 0.53 ˆ ) ˆ ( f = ( 1 ˆ ) ˆ ( f 2 ˆ ) ˆ ( f 3 ˆ ) ˆ ( f ) = (0 1 -0.5 ) 在(15)式窗口中点击 View,选 Coefficient Covariance 功能。 Var( ˆ ) = − − − − 0.8157 0.0439 0.0912 0.3776 0.0235 0.0439 7.3860 0.3776 0.8157 Var(f( ˆ )) = ( ˆ ) ˆ ( f ) (Var( ˆ ) ) ( ˆ ) ˆ ( f )
738600.3776-0.815710 =p1-05]037760023500911-00903 0.8157-0.04390.0912 fB)=f(B)=B2-0.56=(0.6731-0.5×1.1816)=0.0823 w=f B)[Var(B))]fB) =0.0823( 0093)0.0823≈0823)2 0.0750 0.0903 因为W=0075<2(1)=3.8,所以,约束条件B=B1=0被接受,成立 在(15)式窗口中点击view,选 Coefficient Tests,Wad- Coefficient Restrictions功能得 m Equation: EQ01 Workfile: HONLI12 JO View Procs objects Print Name Freeze Estimate Forecastst Wald Test Equation: EQ01 Null Hypothesis: C(2)/C(=0.5 F-statistic 0.065787 Probability 0801917 Chi-square 0.065787 Probability 0.797573 概率大于0.05,说明统计量落在了零假设的接收域。结论是接受原假设(约束条件成立)。 (7)LM乘数检验 与W检验不同的是拉格朗日( Lagrange)乘数(LM)检验只需估计约束模型。所以当施 加约束条件后模型形式变得简单时,更适用于这种检验。LM检验是由艾奇逊一西尔维 ( Aitchison- Silvey1960)提出的。LM检验另一种表达式是由拉奥(Rao1948)提出的,称为得 分检验。 首先给出非约束模型的对数似然函数 B L(B, 0) 对于非约束极大似然估计量B必然有 gL 0.b (17) aB 若约束条件成立,则施加约束条件下房的极大似然估计量B,应与不施加约束条件下房的极大 似然估计量B非常接近。也就是说aogL/B,应近似为零。LM检验的原理是如果 alogL/aB 显著地不为零,则约束条件不成立。LM统计量定义为 aB)((B)-1(logL (18) 其中( alogL/aB)是以( voglI)为元素组成的列向量,同时用β,替换了B。B)称为信 息矩阵,其逆矩阵是B,的方差协方差矩阵。在约束条件成立条件下,LM近似服从x2m)分布。 LM-X(m)
10 = 0 1 − 0.5 − − − − 0.8157 0.0439 0.0912 0.3776 0.0235 0.0439 7.3860 0.3776 0.8157 − 0.5 1 0 = 0.0903 f( ˆ ) = f ( ˆ ) = 2 - 0.53 = (0.6731-0.51.1816) = 0.0823 W = f( ˆ )' [Var( f( ˆ ) ) ]-1 f( ˆ ) = 0.0823 ( 0.0903 1 ) 0.0823 = 0.0903 (0.0823) 2 = 0.0750 因为 W = 0.075 < (1) = 3.8,所以,约束条件0 = 1 = 0 被接受,成立。 在(15)式窗口中点击 View,选 Coefficient Tests, Wald-Coefficient Restrictions 功能得 概率大于 0.05,说明统计量落在了零假设的接收域。结论是接受原假设(约束条件成立)。 (7)LM 乘数检验。 与 W 检验不同的是拉格朗日(Lagrange)乘数(LM)检验只需估计约束模型。所以当施 加约束条件后模型形式变得简单时,更适用于这种检验。LM 检验是由艾奇逊—西尔维 (Aitchison-Silvey 1960)提出的。LM 检验另一种表达式是由拉奥(Rao 1948)提出的,称为得 分检验。 首先给出非约束模型的对数似然函数 logL( , ) (16) 对于非约束极大似然估计量 ˆ j 必然有 j logL ˆ = 0, j (17) 若约束条件成立,则施加约束条件下 j 的极大似然估计量 j ~ 应与不施加约束条件下j 的极大 似然估计量 ˆ j 非常接近。也就是说 logL/ j ~ 应近似为零。LM 检验的原理是如果 logL/ j ~ 显著地不为零,则约束条件不成立。LM 统计量定义为 LM = ( ~ logL )' (I( 1 )) ~ − ( ~ ) logL (18) 其中(logL/ ~ )是以(logL/j)为元素组成的列向量,同时用 j ~ 替换了j 。I( ~ ) 称为信 息矩阵,其逆矩阵是 j ~ 的方差协方差矩阵。在约束条件成立条件下,LM 近似服从 2 (m) 分布。 LM 2 (m)