第6讲单位根检验 由于虚假回归问题的存在,在回归模型中应避免直接使用不存在协积关系的非平稳变 量。因此检验变量的平稳性是一个必须解决的问题。在第二章中介绍用相关图判断时间序列 的平稳性。这一章则给出序列平稳性的严格的统计检验方法,即单位根检验 在介绍单位根检验之前,先认识四种典型的非平稳随机过程 41四种典型的非平稳随机过程 (1)随机游走过程。 由第2章知,其均值为零,方差无限大,但不含有确定性时间趋势。(见图4.1a)。 2200 y=y(1)+u 2040608010 图4.1a由y=计+t,~ID(0,1)生成的序列 图41b深证成指( lestock) (2)随机趋势过程。 =a+y-1+l,y=0,t~ⅢID(0,a2) 其中α称作位移项(漂移项)。由上式知,E(ση)=α(过程初始值的期望)。将(42)式作如下 迭代变换, =a+y+1+l=a+(a+y2+l-1)+t=…=at+1+ ν由确定性时间趋势项αt和υ+∑u1组成。可以把υ+∑u1看作随机的截距项。在不存在 任何冲击的情况下,截距项为υ。而每个冲击t都表现为截距的移动。每个冲击山对截 距项的影响都是持久的,导致序列的条件均值发生变化,所以称这样的过程为随机趋势过程 ( stochastic trend process,或有漂移项的非平稳过程(non- stationary process with drift),有 漂移项的随机游走过程( random walk with drift)见图42,虽然总趋势不变,但随机游走过 程围绕趋势项上下游动。由上式还可以看出,α是确定性时间趋势项的系数(原序列y的増 长速度)。a为正时,趋势向上;a为负时,趋势向下
1 第 6 讲 单位根检验 由于虚假回归问题的存在,在回归模型中应避免直接使用不存在协积关系的非平稳变 量。因此检验变量的平稳性是一个必须解决的问题。在第二章中介绍用相关图判断时间序列 的平稳性。这一章则给出序列平稳性的严格的统计检验方法,即单位根检验。 在介绍单位根检验之前,先认识四种典型的非平稳随机过程。 4.1 四种典型的非平稳随机过程 (1)随机游走过程。 yt = yt-1 + ut , y0 = 0, ut IID(0, 2 ) (4.1) 由第 2 章知,其均值为零,方差无限大,但不含有确定性时间趋势。(见图 4.1a)。 -10 -5 0 5 10 20 40 60 80 100 120 140 160 180 200 y=y(-1)+u 1200 1400 1600 1800 2000 2200 50 100 150 200 250 300 图 4.1a 由 yt = yt-1+ ut, ut IID(0, 1)生成的序列 图 4.1b 深证成指(file:stock) (2)随机趋势过程。 yt = + yt-1 + ut , y0 = 0, ut IID(0, 2 ) (4.2) 其中称作位移项(漂移项)。由上式知,E(y1)= (过程初始值的期望)。将(4.2) 式作如下 迭代变换, yt = + yt-1 + ut = + ( + yt-2 + ut-1) + ut = … = t +y0 + − t i i u 1 yt 由确定性时间趋势项 t 和 y0 + − t i i u 1 组成。可以把 y0 + − t i i u 1 看作随机的截距项。在不存在 任何冲击 ut 的情况下,截距项为 y0。而每个冲击 ut 都表现为截距的移动。每个冲击 ut 对截 距项的影响都是持久的,导致序列的条件均值发生变化,所以称这样的过程为随机趋势过程 (stochastic trend process),或有漂移项的非平稳过程(non-stationary process with drift),有 漂移项的随机游走过程(random walk with drift)见图 4.2,虽然总趋势不变,但随机游走过 程围绕趋势项上下游动。由上式还可以看出,是确定性时间趋势项的系数(原序列 yt 的增 长速度)。为正时,趋势向上;为负时,趋势向下
stochastic trend process y0.1+y(1)+u 图42a由y=0.+y+tl~ID(0,1)生成的序列图42b由y=0.1+yt+t~ID(0,1)生成的序列 因为对y作一次差分后,序列就平稳了 Ay=y-y21=a+l(平稳过程) 所以也称y为差分平稳过程( difference- stationary process。p是4序列的均值,原序列y 的增长速度。 (3)趋势平稳过程 y=B+B1t+l,t1=P1+v,(p<1,v~ID(0,G2) (4.3) (43)式中y与趋势值Bt不同,差值为4。因为4是平稳的,y只会暂时背离趋势 η≮的长期预测值将趋近于趋势线角+B(+k)。所以称其为趋势平稳过程( trend stationary process)。趋势平稳过程由确定性时间趋势βt所主导。趋势平稳过程见图4.3,属于非平稳 过程。 趋势平稳过程也称为退势平稳过程,因为减去趋势后,其为平稳过程,y-B1t=B+l。 整理上式,得趋势平稳过程的另一种表达形式 y=a+yt+py-1+ Vi, (p<l, VI-lID(O, o)) 其中a=B-p(-B),y=B(1-p)。当p<1时,必然有y≠0,y为退势平稳过程;当p=1时, 必然有y=0,y为随机趋势过程。 趋势平稳过程的差分过程是过度差分过程。=B1+-l1。移动平均特征方程中含有 单位根。所以应该用退势的方法获得平稳过程。y-B1t=B0+u (43)式中的是AR(1)过程。进一步放宽时,可以看成是ARMA(pq)过程:严格时 可以看成是白噪声过程。 trend stationary process 图4.3y=005+0.1t+AR(1,P=0.8生成的序列图44y2=001+001t+y1+l,~ID(O,1)生成的序列
2 0 20 40 60 80 50 100 150 200 250 300 350 400 stochastic trend process -100 -80 -60 -40 -20 0 20 100 200 300 400 500 600 700 800 900 1000 y=-0.1+y(-1)+u 图 4.2a 由 yt =0.1+ yt-1+ ut, ut IID(0, 1)生成的序列 图 4.2b 由 yt =- 0.1+ yt-1+ ut, ut IID(0, 1)生成的序列 因为对 yt 作一次差分后,序列就平稳了, yt = yt - yt-1 = + ut (平稳过程) 所以也称 yt 为差分平稳过程(difference- stationary process)。0 是yt 序列的均值,原序列 yt 的增长速度。 (3)趋势平稳过程 yt = 0 + 1 t + ut, ut = ut-1 + vt, ( <1, vt IID(0, 2 )) (4.3) (4.3)式中 yt 与趋势值 0+1t 不同,差值为 ut。因为 ut 是平稳的,yt 只会暂时背离趋势。 yt+k 的长期预测值将趋近于趋势线0+1(t+k)。所以称其为趋势平稳过程(trend stationary process)。趋势平稳过程由确定性时间趋势1 t 所主导。趋势平稳过程见图 4.3,属于非平稳 过程。 趋势平稳过程也称为退势平稳过程,因为减去趋势后,其为平稳过程,yt - 1t = 0+ ut。 整理上式,得趋势平稳过程的另一种表达形式。 yt = + t + yt-1 + vt, ( <1, vt IID(0, 2 )) 其中 = 0 - (0-1), = 1(1-)。当 < 1 时,必然有 0,yt 为退势平稳过程;当 = 1 时, 必然有 =0,yt 为随机趋势过程。 趋势平稳过程的差分过程是过度差分过程。yt = 1 + ut - ut-1。移动平均特征方程中含有 单位根。所以应该用退势的方法获得平稳过程。yt - 1t = 0 + ut。 (4.3)式中的 ut 是 AR(1)过程。进一步放宽时,可以看成是 ARMA(p,q)过程;严格时 可以看成是白噪声过程。 -10 0 10 20 30 40 50 50 100 150 200 250 300 350 400 trend stationary process -10 0 10 20 30 40 50 60 70 80 25 50 75 100 125 图 4.3 yt = 0.05+0.1 t + AR(1), =0.8 生成的序列 图 4.4 yt = 0.01+ 0.01t + yt-1+ ut, ut IID(0, 1)生成的序列
(4)趋势非平稳过程 =a+yI+ 0,t~ID(0,a2) 其中φ称作位移项(漂移项),γ称为趋势项。(44)式是含有随机趋势和确定性趋势的混 合随机过程(见图44)。对上式进行迭代运算 y=a+yt+y-1+l=a+yt+(a+y(1-1)+y2+l-1)+m [t+(t-1) +at+2(1+1)+∑u=(a+2)1+212+∑u,(设定y=0) 趋势非平稳过程是含有随机趋势和确定性趋势的混合过程。趋势项中包括t的1次和2次项。 这种过程在经济问题中非常少见 由上面4种随机过程走势可以看出,对于对数的宏观经济变量,趋势平稳过程和退势平 稳过程是两种最常见的表现形式。 下面分析随机趋势过程与平稳的AR(1)过程的区别。对于如下过程 yi=a+o1 yr-1+ur 当如=1时,y是一个随机趋势过程;当例<1时,y是一个均值为,的平稳过程。 随机趋势过程y=0.1+y-1+4和带有漂移项的平稳过程y=4+0.6y4+的比较见下 图。差别在于随机趋势过程的自回归系数为1,带有漂移项的平稳过程的自回归系数绝对值 小于1。 stochastic trend -- AR(1)wth me 体的以人学时 图4.5随机趋势过程和带有漂移项的平稳过程的比较 实际经济序列的增长趋势常常是指数形式的。如中国的国民收入和消费见图4.6。然而 无论随机趋势过程还是趋势平稳过程所设定的趋势都是线性的。这是为什么?原因是原序列 取对数后,趋势项常是线性的。例如y=eB,则 Ln y=BI 所以用经济序列建立模型之前应先取对数。这样既可以用线性趋势模型描述,又可以消除异 方差。对数的中国国民收入和消费见图47
3 (4)趋势非平稳过程 yt = + t + yt-1 + ut , y0 = 0, ut IID(0, 2 ) (4.4) 其中0 称作位移项(漂移项), t 称为趋势项。 (4.4) 式是含有随机趋势和确定性趋势的混 合随机过程(见图 4.4)。对上式进行迭代运算 yt = + t + yt-1 + ut = + t + ( + (t-1) + yt-2 + ut-1) + ut = … = y0 + t + [t + (t-1) +…+2 +1 ] + = t i i u 1 = y0 + t + 2 ( 1+ t ) t + = t i i u 1 = (+ 2 ) t + 2 t 2 + = t i i u 1 , (设定 y0 = 0) 趋势非平稳过程是含有随机趋势和确定性趋势的混合过程。趋势项中包括 t 的 1 次和 2 次项。 这种过程在经济问题中非常少见。 由上面 4 种随机过程走势可以看出,对于对数的宏观经济变量,趋势平稳过程和退势平 稳过程是两种最常见的表现形式。 下面分析随机趋势过程与平稳的 AR(1)过程的区别。对于如下过程 yt = + 1 yt-1 + ut 当1 = 1 时,yt 是一个随机趋势过程;当1 1 时,yt 是一个均值为 1 1 − 的平稳过程。 随机趋势过程 yt = 0.1 + yt-1 + ut 和带有漂移项的平稳过程 yt = 4 +0.6 yt-1 + ut 的比较见下 图。差别在于随机趋势过程的自回归系数为 1,带有漂移项的平稳过程的自回归系数绝对值 小于 1。 -20 -10 0 10 20 30 40 50 100 150 200 250 300 350 400 stochastic trend AR(1) with mean 图 4.5 随机趋势过程和带有漂移项的平稳过程的比较 实际经济序列的增长趋势常常是指数形式的。如中国的国民收入和消费见图 4.6。然而 无论随机趋势过程还是趋势平稳过程所设定的趋势都是线性的。这是为什么?原因是原序列 取对数后,趋势项常是线性的。例如 yt = e t,则 Ln yt = t 所以用经济序列建立模型之前应先取对数。这样既可以用线性趋势模型描述,又可以消除异 方差。对数的中国国民收入和消费见图 4.7
LNCP 图46中国的国民收入和消费 图47对数的中国国民收入和消费 对于单位根过程(差分平稳),每个随机冲击都具有长记忆性,方差趋于无穷大,其均 值概念变得毫无意义; 对于退势平稳过程,随机成分是一个白噪声或平稳的ARMA过程,所以接受冲击后只 具有有限记忆能力,其影响会很快消失,由其引起的对趋势的偏离只是暂时的。对退势平稳 序列,只要正确估计出其确定性趋势,即可实现长期趋势与平稳波动部分的分离 大量的实证研究显示,不变价格的宏观经济序列为退势平稳过程的可能性远大于名义价 格的宏观经济序列。中国的GDP、固定资产投资和居民消费等序列均为退势平稳序列。这 意味着,改革开放以来,中国的经济增长虽然因为受到各种冲击因素的影响而出现不同程度 的偏离趋势的上下波动,但这种偏离是暂时的,从较长时期来看,经济增长总体上沿着确定 的均衡增长路径平稳运行。 而随机趋势过程虽然也有长期‘引力线’,但其数据生成过程含有单位根,随机冲击对 它具有持续的长期影响。只有通过差分才能使其平稳,属于差分平稳过程 例:给出对数的中国GDP序列(实线)如图48。无论采取线性退势,还是2次退势, 所得序列都是平稳序列。 LNGP73127+0.0677t LNGP…7.8693+0.0014t^2 图48a线性趋势 图48b2次趋势
4 0 5000 10000 15000 20000 25000 55 60 65 70 75 80 85 90 IP CP 7.0 7.5 8.0 8.5 9.0 9.5 10.0 55 60 65 70 75 80 85 90 LNIP LNCP 图 4.6 中国的国民收入和消费 图 4.7 对数的中国国民收入和消费 对于单位根过程(差分平稳),每个随机冲击都具有长记忆性,方差趋于无穷大,其均 值概念变得毫无意义; 对于退势平稳过程,随机成分是一个白噪声或平稳的 ARMA 过程,所以接受冲击后只 具有有限记忆能力,其影响会很快消失,由其引起的对趋势的偏离只是暂时的。对退势平稳 序列,只要正确估计出其确定性趋势,即可实现长期趋势与平稳波动部分的分离。 大量的实证研究显示,不变价格的宏观经济序列为退势平稳过程的可能性远大于名义价 格的宏观经济序列。中国的 GDP、固定资产投资和居民消费等序列均为退势平稳序列。这 意味着,改革开放以来,中国的经济增长虽然因为受到各种冲击因素的影响而出现不同程度 的偏离趋势的上下波动,但这种偏离是暂时的,从较长时期来看,经济增长总体上沿着确定 的均衡增长路径平稳运行。 而随机趋势过程虽然也有长期‘引力线’,但其数据生成过程含有单位根,随机冲击对 它具有持续的长期影响。只有通过差分才能使其平稳,属于差分平稳过程。 例:给出对数的中国 GDP 序列(实线)如图 4.8。无论采取线性退势,还是 2 次退势, 所得序列都是平稳序列。 7 8 9 10 11 55 60 65 70 75 80 85 90 95 LNGP 7.3127+0.0677t 7 8 9 10 11 55 60 65 70 75 80 85 90 95 LNGP 7.8693+0.0014t^2 图 4.8a 线性趋势 图 4.8b 2 次趋势 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 55 60 65 70 75 80 85 90 95 -0.8 -0.6 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 55 60 65 70 75 80 85 90 95
图49ADF=-3.05<ADF00s)=-195 图410ADF=-436<ADF(05)=-1.95 42DF统计量和t统计量的分布特征 在介绍检验方法之前,先讨论回归系数统计量的分布 情形1 数据生成过程(DGP):y=y1+l,1=0,t~IDO,a2) OIS估计式:y1=y1+l1 B=1;Hn:B<1 讨论ta1的极限分布和有限样本分布特征。 以OLS估计式y2=的1-1+1为例,若真值B=0,统计量 s(B) 的极限分布为标准正态分布。若真值B|<1,统计量 (B-B) s(B) 渐近服从标准正态分布。根据中心极限定理,当T→∞时, √(7-B)→N(0,a2(1-B2) 如果数据生成过程是y=y1+l,y是非平稳的。在B=1条件下,统计量√T(x-B)的 极限分布发生退化(方差为零)。 在B=1条件下,OLS估计式是y1=角1-1+l1,统计量)服从什么分布呢?分析如下 y,Vt-I (4.9) 因己知y=0, +l1)yt-1 Sutil 由上一章,当T→、∞, 72∑y1x2→o2[(W()2ad (4.11)
5 图 4.9 ADF= -3.05 < ADF(0.05) = -1.95 图 4.10 ADF= -4.36 < ADF(0.05) = -1.95 4.2 DF 统计量和 t 统计量的分布特征 在介绍检验方法之前,先讨论回归系数统计量的分布。 情形 1: 数据生成过程(DGP):yt = yt-1 + ut, y0 = 0, ut IID(0, 2 ) (4.1) OLS 估计式: t t ut y = y −1 + (4.5) H0: = 1;H1: 1 讨论 ) ˆ ( t 的极限分布和有限样本分布特征。 以 OLS 估计式 t t ut y = y −1 + 为例,若真值 = 0,统计量 ) ˆ ( t = ) ˆ ( ˆ s t(T-1) , (4.6) 的极限分布为标准正态分布。 若真值 < 1,统计量 ) ˆ ( t = ) ˆ ( ) ˆ ( s − (4.5) 渐近服从标准正态分布。根据中心极限定理,当 T → 时, ) ˆ T ( T − → N (0, 2 (1- 2 ) ) (4.6) 如果数据生成过程是 yt = yt-1 + ut,yt 是非平稳的。在 = 1 条件下,统计量 ) ˆ T ( T − 的 极限分布发生退化(方差为零)。 在 = 1 条件下,OLS 估计式是 t t ut y = y −1 + ,统计量 ) ˆ t( 服从什么分布呢?分析如下: ˆ = = − = − T t t T t t t y y y 1 2 1 1 1 (4.9) 因已知 y0 = 0, ˆ = = − = − + − T t t T t t t t y y u y 1 2 1 1 1 1 ( ) = = − = − T t t T t t y y 1 2 1 1 2 1 + = − = − T t t T t t t y u y 1 2 1 1 1 = 1 + = − = − T t t T t t t y u y 1 2 1 1 1 ˆ -1= = − = − T t t T t t t y u y 1 2 1 1 1 (4.10) 由上一章,当 T→ ∞, T -2 = − T t t y 1 2 1 1 0 2 2 (W(i)) di (4.11)
T1∑yl1→[a2(W()2-a2]=(W(1)2-1) ∑yL,是OD的。∑y12是O2(72)的。所以当T→∞时, pim()=pm(1+41,/y2 可见是B=1的一致估计量 由(410)式、(411)式和(4.13)式,当T→∞时, yr (1/2)H(1)2-1 Tw(di (B-1)是Op(T-)的 0.0 0.06 0 -20 7=100,模拟1万次的r(B-1)的分布 T(B-1)是检验单位根的一个常用统计量。有三个结论如下: (1)由上式知B是On(T1)的。由(410)式知,当y平稳时,B是O(T-)的。所 以前者的收敛速度更快。β以速度T接近真值β=1,所以称β是β=1的超一致估计量。 (2)T(B-1)的极限分布是标准维纳过程的函数。它不服从正态分布,也不服从t分布 (3)因为T(β-1)不服从t分布,所以假设检验时不能查t临界值表 检验单位根的另一个统计量是统计量。统计量在这里称DF统计量。当r →∞
6 T -1 = − T t t ut y 1 1 2 1 [ 2 (W(1) ) 2 - 2 ] = 2 2 (W(1) 2 – 1). (4.13) = − T t t ut y 1 1 是 Op(T)的。 = − T t t y 1 2 1 是 Op (T 2 )的。所以当 T → 时, plim( ˆ ) = plim(1 + 2 1 2 1 2 1 1 y T u y T T t t T t t t = − = − ) → 1 可见 ˆ 是 =1 的一致估计量。 由(4.10)式、(4.11) 式和 (4.13) 式,当 T → 时, T ( ˆ - 1) = = − − = − − T t t T t t t T y T u y 1 2 1 2 1 1 1 W i di W − 1 0 2 2 ( ) (1/ 2)[ (1) 1] ( ˆ - 1) 是 Op (T -1 )的。 -30 -20 -10 0 0 0.02 0.04 0.06 0.08 0.1 0.12 T=100,模拟 1 万次的 T ( ˆ - 1)的分布 T ( ˆ - 1)是检验单位根的一个常用统计量。有三个结论如下: (1)由上式知 ˆ 是 Op(T –1 )的。由 (4.10) 式知,当 yt 平稳时, ˆ 是 Op(T –1 /2 )的。所 以前者的收敛速度更快。 ˆ 以速度 T 接近真值 = 1,所以称 ˆ 是 = 1 的超一致估计量。 (2)T( ˆ - 1)的极限分布是标准维纳过程的函数。它不服从正态分布,也不服从 t 分布。 (3) 因为 T( ˆ - 1) 不服从 t 分布,所以假设检验时不能查 t 临界值表。 检验单位根的另一个统计量是 ) ˆ ( t 统计量。 ) ˆ ( t 统计量在这里称 DF 统计量。当 T → 时
siB) baodi DF统计量是O(1)的,其渐近分布与σ无关 由于该极限分布无法用解析的方法求解,一般都是用模拟和数值计算的方法研究DF统 计量的有限样本分布 有限样本条件下的DF统计量的分布特征(蒙特卡罗模拟结果)。 表1 DF分布百分位数衰 生成过程 和估计式 0.010.0250050.100.900.950.9750.99 2.26-1.95 0.921.331.702.16 2.2 1.951.610.91 311.66208 情形1100-2602241.951.610901.291.64203 2.231.951.620.891291.63201 数据生成过程(DGP):y=y+1=0,B~ID(O,a2),OLS估计式:y1=1-1+ T=100,模拟1万次的DF统计量的分布结果 1000 -0482977 Minimum 059540 Skewness 0.250905 Jarque-Bera 109. 8776 Probabil 0.000000 3.75-250-1250001.252.503.75 (file: 5simudf1 情形2: 数据生成过程(DGP):y=y1+t,y=0,t~ID(0,a2) (4.1) OLS估计式:y1=a+1+u1 (4.16) H:a=0;B=1;H1;a≠0;B<1 讨论(、1的极限分布和有限样本分布特征。统计量()=DF、(a)的极限分布都 是 Wiener过程的泛函。可以证明,当T→∞时 IW(1)2-1-W()W()dhi w()di-lLw( 推导见 Hamilton《时间序列分析》(17436)式。DF统计量是O(1)的。 a2)不再服从t分布。la)的极限分布是 Wiener过程的泛函
7 W i di W s DF t − − = = 1 0 2 2 ) ˆ ( ) ˆ ( ( ( )) [( (1)) 1] 2 1 1 ˆ (4.15) DF 统计量是 Op(1 )的,其渐近分布与 无关。 由于该极限分布无法用解析的方法求解,一般都是用模拟和数值计算的方法研究 DF 统 计量的有限样本分布。 有限样本条件下的 DF 统计量的分布特征(蒙特卡罗模拟结果)。 表 1 DF 分布百分位数表 生成过程 T 和估计式 0.01 0.025 0.05 0.10 0.90 0.95 0.975 0.99 25 - 2.66 - 2.26 - 1.95 - 1.60 0.92 1.33 1.70 2.16 50 - 2.62 - 2.25 - 1.95 - 1.61 0.91 1.31 1.66 2.08 情形 1 100 - 2.60 - 2.24 - 1.95 - 1.61 0.90 1.29 1.64 2.03 250 - 2.58 - 2.23 - 1.95 - 1.62 0.89 1.29 1.63 2.01 500 - 2.58 - 2.23 - 1.95 - 1.62 0.89 1.28 1.62 2.00 - 2.58 - 2.23 - 1.95 - 1.62 0.89 1.28 1.62 2.00 注:数据生成过程(DGP):yt = yt-1 + ut, y0 = 0, ut IID(0, 2 ),OLS估计式: t t ut y = y −1 + 。 T=100,模拟1万次的DF统计量的分布结果。 0 200 400 600 800 1000 1200 -3.75 -2.50 -1.25 0.00 1.25 2.50 3.75 Series: DF Sample 1 10000 Observations 10000 Mean -0.403611 Median -0.482977 Maximum 3.710184 Minimum -4.059540 Std. Dev. 0.996819 Skewness 0.250905 Kurtosis 3.109055 Jarque-Bera 109.8776 Probability 0.000000 (file:5simudf1) 情形 2: 数据生成过程(DGP):yt = yt-1 + ut, y0 = 0, ut IID(0, 2 ) (4.1) OLS 估计式: t t ut y = + y −1 + (4.16) H0: = 0; = 1; H1: 0; 1 讨论 ) ˆ ( t 、 ( ˆ) t 的极限分布和有限样本分布特征。统计量 ) ˆ ( t = DF、 ( ˆ) t 的极限分布都 是 Wiener 过程的泛函。可以证明,当 T → 时, 2 1 0 1 0 2 1 0 2 ) ˆ ( ) ˆ ( ( ( )) [ ( ) ] [( (1)) 1] (1) ( ) 2 1 1 ˆ − − − − = = W i di W i di W W W i di s DF t 推导见 Hamilton《时间序列分析》(17.4.36)式。DF 统计量是 O(1 )的。 ( ˆ) t 不再服从 t 分布。 ( ˆ) t 的极限分布是 Wiener 过程的泛函
W()w()2di-[(W(1)2-lW(n)dh t(a) Ga统计量是o(1)的。(推导见张晓峒,攸频:DF检验式中漂移项和趋势项的t统计量研 究,《数量经济技术经济研究》,2006,2,p,126-137。) 有限样本条件下的DF统计量的分布特征(蒙特卡罗模拟结果)。 表2 DF分布百分位数表 生成过程 和估计式 0.010.0250050.100.900.950.9750.99 3.33 2.630.37 0.34 50-3.583.22-293-2 0.29 0.66 情形2 3.513.172.892.580.420.050.260.63 2.57-0.42-0.060.240.62 5003.443.13-2.872.570.430.070.240.61 注:数据生成过程(DGP):y=y1+m110=0,t~ID(0,a2),OLS估计式:y=a+v-1+l1 7=100,模拟1万次的DF统计量的分布结果 Mean 1.531341 Maximum 1934342 0.131914 arque- Bera 74.10418 robability 0.000000 3.75-250-1250.00125 (file: 5simu-dn2) 表3 估计式y=a+1-1+v中1(a的分布(糗拟5万次) CV0005CV0.025 CV0.05 CV095CV0.975Cv0.995 303.71607298201-2641942.510202864673.56780 3.57894-2912532.583412528262887223.58953 100-347011-285596-2.549972558332885393.50376 -3.44065-2.853782.544702.57503290392 56663 200 -3429022824712529792.546312877993.56599 .37406-2.823172533742.540352884943.56644 注:( M. Fileunitrootl02) 注:数据生成过程为y=y1+l,l~ⅢD(O,1)。OLS估计式:yr=a+1-1+u T=100条件下,l(a)的分布见图
8 = ( ˆ) ( ˆ) ˆ s t − − − 1 0 2 2 1 0 1 0 2 1 0 1 0 2 2 ( ( )) [ ( ) ] ( ( )) [( (1)) 1] ( ) 2 1 (1) ( ( )) W i di W i di W i di W W i di W W i di ( ˆ) t 统计量是 Op(1 )的。(推导见张晓峒,攸频:DF 检验式中漂移项和趋势项的 t 统计量研 究,《数量经济技术经济研究》,2006,2, p,126-137。) 有限样本条件下的 DF 统计量的分布特征(蒙特卡罗模拟结果)。 表 2 DF 分布百分位数表 生成过程 T 和估计式 0.01 0.025 0.05 0.10 0.90 0.95 0.975 0.99 25 - 3.75 - 3.33 - 3.00 - 2.63 - 0.37 0.00 0.34 0.72 50 - 3.58 - 3.22 - 2.93 - 2.60 - 0.40 - 0.03 0.29 0.66 情形 2 100 - 3.51 - 3.17 - 2.89 - 2.58 - 0.42 - 0.05 0.26 0.63 250 - 3.46 - 3.14 - 2.88 - 2.57 - 0.42 - 0.06 0.24 0.62 500 - 3.44 - 3.13 - 2.87 - 2.57 - 0.43 - 0.07 0.24 0.61 - 3.43 - 3.12 - 2.86 - 2.57 - 0.44 - 0.07 0.23 0.60 注:数据生成过程(DGP):yt = yt-1 + ut, y0 = 0, ut IID(0, 2 ),OLS估计式: t t ut y = + y −1 + 。 T=100,模拟1万次的DF统计量的分布结果。 0 200 400 600 800 1000 1200 1400 -5.00 -3.75 -2.50 -1.25 0.00 1.25 Series: DF Sample 1 10000 Observations 10000 Mean -1.531341 Median -1.555245 Maximum 1.934342 Minimum -5.380393 Std. Dev. 0.867661 Skewness 0.131914 Kurtosis 3.329006 Jarque-Bera 74.10418 Probability 0.000000 (file:5simu-df2) 表 3: 估计式 t t t y = + y + v −1 中 ( ˆ) t 的分布(模拟 5 万次) T CV0.005 CV0.025 CV0.05 CV0.95 CV0.975 CV0.995 30 -3.71607 -2.98201 -2.64194 2.51020 2.86467 3.56780 50 -3.57894 -2.91253 -2.58341 2.52826 2.88722 3.58953 100 -3.47011 -2.85596 -2.54997 2.55833 2.88539 3.50376 150 -3.44065 -2.85378 -2.54470 2.57503 2.90392 3.56663 200 -3.42902 -2.82471 -2.52979 2.54631 2.87799 3.56599 250 -3.37406 -2.82317 -2.53374 2.54035 2.88494 3.56644 注:(M.File:unitroot02) 注:数据生成过程为 yt = yt-1 + ut , ut IID(0, 1)。OLS 估计式: t t ut y = + y −1 + T = 100 条件下, ( ˆ) t 的分布见图
Series: DRIFT Sample 1 10000 Mean 0000423 4.278126 Skewness -0.002115 Jarque-Bera 554 2285 robability 0.000000 (file: 5: 情形3: 数据生成过程(DGP):y=a+y1+t,a是否为零均可,y=0,l~ID(0,a2) OLS估计式:y1=a+1-1++l1 (4.17) 为防止α不为零时从而使估计式引入时间趋势项,导致解释变量多重共线性,等价的 OLS估计式是 yI yt+ur 其中,a*=(1-B)x,*=B,y*=y+Bo Hn:a=ao;B=1;y=0。相当于:H:a=0;P=1;y2=ao f<1;y≠0 讨论DF=、l(a)、()的极限分布和有限样本分布特征。可以证明,当T→∞时, 12F 其中 v(idi l/2 w(idi w(o-di l/2 ()d1/3 推导见 Hamilton《时间序列分析》(17455)式。DF统计量是O(1)的,其渐近分布既不依 赖于α,也不依赖于σ。 a),l()服从的是如下极限分布。 w(O-di t:→ 其中F1和F2都是 Wiener过程的泛函。la),G)统计量是O(1)的,其渐近分布既不依赖于
9 0 100 200 300 400 500 600 700 800 -5.0 -2.5 0.0 2.5 Series: DRIFT Sample 1 10000 Observations 10000 Mean 0.000423 Median -0.028121 Maximum 4.278126 Minimum -4.938927 Std. Dev. 1.713000 Skewness -0.002115 Kurtosis 1.846687 Jarque-Bera 554.2285 Probability 0.000000 (file:5simu-df2) 情形 3: 数据生成过程(DGP):yt = + yt-1 + ut, 是否为零均可,y0 = 0, ut IID(0, 2 ) OLS 估计式: t t ut y = + y −1 +t + (4.17) 为防止 不为零时从而使估计式引入时间趋势项,导致解释变量多重共线性,等价的 OLS 估计式是 t t ut y = *+ * y −1 *+ *t + 其中, * = (1− ), * = ,* = + H0: = 0; = 1; = 0。相当于:H0:* = 0;* = 1;* = 0 H1: 0; 1; 0 讨论 DF= ) ˆ ( t 、 ( ˆ) t 、 ( ˆ) t 的极限分布和有限样本分布特征。可以证明,当 T → 时, − = = ) ˆ ( ) ˆ ( 1 ˆ s DF t A 12F2 其中 F2= ( (1) 1) 24 1 (1) ( ) 2 1 (1) ( ) 6 1 2 1 0 1 0 − + − W W i di W iW i di W + − 2 1 0 1 0 1 0 [ ( ) ] 2 1 W (i)di iW(i)di W i di A = 1/ 2 ( ) 1/ 3 ( ) ( ) ( ) 1 ( ) 1/ 2 1 0 1 0 1 0 2 1 0 1 0 iW i di W i di W i di iW i di W i di 推导见 Hamilton《时间序列分析》(17.4.55)式。DF 统计量是 Op(1 )的,其渐近分布既不依 赖于,也不依赖于。 ( ˆ) t , ( ˆ) t 服从的是如下极限分布。 t ( ˆ) 2 1 0 1 0 2 1 ( ( )) [ ( ) ] 3 1 A W i di − W i di F t ( ˆ) 2 1 0 1 0 2 3 ( ( )) [ ( ) ] A W i di − W i di F 其中 F1 和 F2 都是 Wiener 过程的泛函。 ( ˆ) t , ( ˆ) t 统计量是 Op(1 )的,其渐近分布既不依赖于
也不依赖于 有限样本条件下的DF统计量的分布特征(蒙特卡罗模拟结果)。 表 DF分布百分位数表 生成过程 0.025 0.05 0.950.9750.99 4.383.953.60-3.24-1.140.800.500.15 18-1.190.87-0.58 情形3 4.04 0.28 0.92-0.64 3.41 注:数据生成过程:y=1+1=0,m~ⅢDO,a2),OLS估计式:y1=a*+B*y1-1*+y*t+ T=100,模拟1万次的DF统计量的分布结果 Observations 10000 2.177181 2.164688 0.76774 Kurtosis Probability (file: 5simu-df3) 有限样本条件下的ta分布的估计结果见表4 表5: 估计式y2=a+例7-1++中1(a)的分布(模拟5万次) Cv0.005CV0.025Cv0.05Cv0.95Cv0.975Cv0.995 07560-3.321382928162.800003.194623.99269 -394834-3.25371-2.864652.832573.198083.87910 100 -3.85926-3.17450-2815062870253217653.83482 503.760033098512774222895 3.260193.90150 200 3.76003-3.106292771772.89391325672390993 3.749543.105822771192914743299413.95097 注:( M. File unitroot01) T=100,模拟1万次的ta)分布见图
10 ,也不依赖于。 有限样本条件下的 DF 统计量的分布特征(蒙特卡罗模拟结果)。 表 4 DF 分布百分位数表 生成过程 T 和估计式 0.01 0.025 0.05 0.10 0.90 0.95 0.975 0.99 25 - 4.38 - 3.95 - 3.60 - 3.24 - 1.14 - 0.80 - 0.50 - 0.15 50 - 4.15 - 3.80 - 3.50 - 3.18 - 1.19 - 0.87 - 0.58 - 0.24 情形 3 100 - 4.04 - 3.73 - 3.45 - 3.15 - 1.22 - 0.90 - 0.62 - 0.28 250 - 3.99 - 3.69 - 3.43 - 3.13 - 1.23 - 0.92 - 0.64 - 0.31 500 - 3.98 - 3.68 - 3.42 - 3.13 - 1.24 - 0.93 - 0.65 - 0.32 - 3.96 - 3.66 - 3.41 - 3.12 - 1.25 - 0.94 - 0.66 - 0.33 注:数据生成过程:yt = yt-1 + ut, y0 = 0, ut IID(0, 2 ),OLS估计式: t t ut y = *+ * y −1 *+ *t + 。 T=100,模拟1万次的DF统计量的分布结果。 0 200 400 600 800 1000 1200 1400 -5 -4 -3 -2 -1 0 1 Series: DF Sample 1 10000 Observations 10000 Mean -2.177181 Median -2.164688 Maximum 0.814376 Minimum -5.444336 Std. Dev. 0.767743 Skewness 0.005023 Kurtosis 3.399799 Jarque-Bera 66.64172 Probability 0.000000 (file:5simu-df3) 有限样本条件下的 ( ˆ) t 分布的估计结果见表 4。 表 5: 估计式 t t ut y = + y −1 +t + 中 ( ˆ) t 的分布(模拟 5 万次) T CV0.005 CV0.025 CV0.05 CV0.95 CV0.975 CV0.995 30 -4.07560 -3.32138 -2.92816 2.80000 3.19462 3.99269 50 -3.94834 -3.25371 -2.86465 2.83257 3.19808 3.87910 100 -3.85926 -3.17450 -2.81506 2.87025 3.21765 3.83482 150 -3.76003 -3.09851 -2.77422 2.89550 3.26019 3.90150 200 -3.76003 -3.10629 -2.77177 2.89391 3.25672 3.90993 250 -3.74954 -3.10582 -2.77119 2.91474 3.29941 3.95097 注:(M.File:unitroot01) T =100,模拟 1 万次的 ( ˆ) t 分布见图