《时间序列模型》课程教材讲义（ARIMA）第6讲单位根检验

由于虚假回归问题的存在，在回归模型中应避免直接使用不存在协积关系的非平稳变量。因此检验变量的平稳性是一个必须解决的问题。在第二章中介绍用相关图判断时间序列的平稳性。这一章则给出序列平稳性的严格的统计检验方法，即单位根检验。在介绍单位根检验之前，先认识四种典型的非平稳随机过程。

团购合买资源类别：文库，文档格式：DOC，文档页数：41，文件大小：6.42MB

1 第 6 讲单位根检验由于虚假回归问题的存在，在回归模型中应避免直接使用不存在协积关系的非平稳变量。因此检验变量的平稳性是一个必须解决的问题。在第二章中介绍用相关图判断时间序列的平稳性。这一章则给出序列平稳性的严格的统计检验方法，即单位根检验。在介绍单位根检验之前，先认识四种典型的非平稳随机过程。 4.1 四种典型的非平稳随机过程（1）随机游走过程。 yt = yt-1 + ut , y0 = 0, ut  IID(0,  2 ) (4.1) 由第 2 章知，其均值为零，方差无限大，但不含有确定性时间趋势。（见图 4.1a）。 -10 -5 0 5 10 20 40 60 80 100 120 140 160 180 200 y=y(-1)+u 1200 1400 1600 1800 2000 2200 50 100 150 200 250 300 图 4.1a 由 yt = yt-1+ ut, ut  IID(0, 1)生成的序列图 4.1b 深证成指（file:stock）（2）随机趋势过程。 yt =  + yt-1 + ut , y0 = 0, ut  IID(0,  2 ) (4.2) 其中称作位移项（漂移项）。由上式知，E(y1)= （过程初始值的期望）。将(4.2) 式作如下迭代变换， yt =  + yt-1 + ut =  + ( + yt-2 + ut-1) + ut = … = t +y0 + − t i i u 1 yt 由确定性时间趋势项 t 和 y0 + − t i i u 1 组成。可以把 y0 + − t i i u 1 看作随机的截距项。在不存在任何冲击 ut 的情况下，截距项为 y0。而每个冲击 ut 都表现为截距的移动。每个冲击 ut 对截距项的影响都是持久的，导致序列的条件均值发生变化，所以称这样的过程为随机趋势过程（stochastic trend process），或有漂移项的非平稳过程（non-stationary process with drift），有漂移项的随机游走过程（random walk with drift）见图 4.2，虽然总趋势不变，但随机游走过程围绕趋势项上下游动。由上式还可以看出，是确定性时间趋势项的系数（原序列 yt 的增长速度）。为正时，趋势向上；为负时，趋势向下

2 0 20 40 60 80 50 100 150 200 250 300 350 400 stochastic trend process -100 -80 -60 -40 -20 0 20 100 200 300 400 500 600 700 800 900 1000 y=-0.1+y(-1)+u 图 4.2a 由 yt =0.1+ yt-1+ ut, ut IID(0, 1)生成的序列图 4.2b 由 yt =- 0.1+ yt-1+ ut, ut  IID(0, 1)生成的序列因为对 yt 作一次差分后，序列就平稳了，  yt = yt - yt-1 =  + ut （平稳过程）所以也称 yt 为差分平稳过程（difference- stationary process）。0 是yt 序列的均值，原序列 yt 的增长速度。（3）趋势平稳过程 yt = 0 + 1 t + ut, ut = ut-1 + vt, ( <1, vt  IID(0,  2 )) (4.3) (4.3)式中 yt 与趋势值 0+1t 不同，差值为 ut。因为 ut 是平稳的，yt 只会暂时背离趋势。 yt+k 的长期预测值将趋近于趋势线0+1(t+k)。所以称其为趋势平稳过程（trend stationary process）。趋势平稳过程由确定性时间趋势1 t 所主导。趋势平稳过程见图 4.3，属于非平稳过程。趋势平稳过程也称为退势平稳过程，因为减去趋势后，其为平稳过程，yt - 1t = 0+ ut。整理上式，得趋势平稳过程的另一种表达形式。 yt =  +  t + yt-1 + vt, ( <1, vt  IID(0,  2 )) 其中 = 0 - (0-1),  = 1(1-)。当 < 1 时，必然有 0，yt 为退势平稳过程；当 = 1 时，必然有 =0，yt 为随机趋势过程。趋势平稳过程的差分过程是过度差分过程。yt = 1 + ut - ut-1。移动平均特征方程中含有单位根。所以应该用退势的方法获得平稳过程。yt - 1t = 0 + ut。（4.3）式中的 ut 是 AR(1)过程。进一步放宽时，可以看成是 ARMA(p,q)过程；严格时可以看成是白噪声过程。 -10 0 10 20 30 40 50 50 100 150 200 250 300 350 400 trend stationary process -10 0 10 20 30 40 50 60 70 80 25 50 75 100 125 图 4.3 yt = 0.05+0.1 t + AR(1), =0.8 生成的序列图 4.4 yt = 0.01+ 0.01t + yt-1+ ut, ut  IID(0, 1)生成的序列

3 （4）趋势非平稳过程 yt =  +  t + yt-1 + ut , y0 = 0, ut  IID(0,  2 ) (4.4) 其中0 称作位移项（漂移项）， t 称为趋势项。 (4.4) 式是含有随机趋势和确定性趋势的混合随机过程（见图 4.4）。对上式进行迭代运算 yt =  +  t + yt-1 + ut =  +  t + ( +  (t-1) + yt-2 + ut-1) + ut = … = y0 +  t +  [t + (t-1) +…+2 +1 ] + = t i i u 1 = y0 +  t + 2  ( 1+ t ) t + = t i i u 1 = (+ 2  ) t + 2  t 2 + = t i i u 1 , (设定 y0 = 0) 趋势非平稳过程是含有随机趋势和确定性趋势的混合过程。趋势项中包括 t 的 1 次和 2 次项。这种过程在经济问题中非常少见。由上面 4 种随机过程走势可以看出，对于对数的宏观经济变量，趋势平稳过程和退势平稳过程是两种最常见的表现形式。下面分析随机趋势过程与平稳的 AR(1)过程的区别。对于如下过程 yt =  + 1 yt-1 + ut 当1 = 1 时，yt 是一个随机趋势过程；当1  1 时，yt 是一个均值为 1 1   − 的平稳过程。随机趋势过程 yt = 0.1 + yt-1 + ut 和带有漂移项的平稳过程 yt = 4 +0.6 yt-1 + ut 的比较见下图。差别在于随机趋势过程的自回归系数为 1，带有漂移项的平稳过程的自回归系数绝对值小于 1。 -20 -10 0 10 20 30 40 50 100 150 200 250 300 350 400 stochastic trend AR(1) with mean 图 4.5 随机趋势过程和带有漂移项的平稳过程的比较实际经济序列的增长趋势常常是指数形式的。如中国的国民收入和消费见图 4.6。然而无论随机趋势过程还是趋势平稳过程所设定的趋势都是线性的。这是为什么？原因是原序列取对数后，趋势项常是线性的。例如 yt = e  t，则 Ln yt =  t 所以用经济序列建立模型之前应先取对数。这样既可以用线性趋势模型描述，又可以消除异方差。对数的中国国民收入和消费见图 4.7

7 W i di W s DF t  −  − = = 1 0 2 2 ) ˆ ( ) ˆ ( ( ( )) [( (1)) 1] 2 1 1 ˆ    (4.15) DF 统计量是 Op(1 )的，其渐近分布与 无关。由于该极限分布无法用解析的方法求解，一般都是用模拟和数值计算的方法研究 DF 统计量的有限样本分布。有限样本条件下的 DF 统计量的分布特征（蒙特卡罗模拟结果）。表 1 DF 分布百分位数表生成过程 T  和估计式 0.01 0.025 0.05 0.10 0.90 0.95 0.975 0.99 25 - 2.66 - 2.26 - 1.95 - 1.60 0.92 1.33 1.70 2.16 50 - 2.62 - 2.25 - 1.95 - 1.61 0.91 1.31 1.66 2.08 情形 1 100 - 2.60 - 2.24 - 1.95 - 1.61 0.90 1.29 1.64 2.03 250 - 2.58 - 2.23 - 1.95 - 1.62 0.89 1.29 1.63 2.01 500 - 2.58 - 2.23 - 1.95 - 1.62 0.89 1.28 1.62 2.00  - 2.58 - 2.23 - 1.95 - 1.62 0.89 1.28 1.62 2.00 注：数据生成过程（DGP）：yt = yt-1 + ut, y0 = 0, ut  IID(0,  2 )，OLS估计式： t t ut y = y −1 + 。 T=100，模拟1万次的DF统计量的分布结果。 0 200 400 600 800 1000 1200 -3.75 -2.50 -1.25 0.00 1.25 2.50 3.75 Series: DF Sample 1 10000 Observations 10000 Mean -0.403611 Median -0.482977 Maximum 3.710184 Minimum -4.059540 Std. Dev. 0.996819 Skewness 0.250905 Kurtosis 3.109055 Jarque-Bera 109.8776 Probability 0.000000 （file：5simudf1）情形 2：数据生成过程（DGP）：yt = yt-1 + ut, y0 = 0, ut  IID(0,  2 ) (4.1) OLS 估计式： t t ut y = + y −1 + (4.16) H0： = 0； = 1； H1：  0；  1 讨论 ) ˆ ( t 、 ( ˆ) t 的极限分布和有限样本分布特征。统计量 ) ˆ ( t = DF、 ( ˆ) t 的极限分布都是 Wiener 过程的泛函。可以证明，当 T →  时， 2 1 0 1 0 2 1 0 2 ) ˆ ( ) ˆ ( ( ( )) [ ( ) ] [( (1)) 1] (1) ( ) 2 1 1 ˆ    − − −  − = = W i di W i di W W W i di s DF t    推导见 Hamilton《时间序列分析》（17.4.36）式。DF 统计量是 O(1 )的。 ( ˆ) t 不再服从 t 分布。 ( ˆ) t 的极限分布是 Wiener 过程的泛函

8 =  ( ˆ) ( ˆ) ˆ    s t            − − − 1 0 2 2 1 0 1 0 2 1 0 1 0 2 2 ( ( )) [ ( ) ] ( ( )) [( (1)) 1] ( ) 2 1 (1) ( ( )) W i di W i di W i di W W i di W W i di ( ˆ) t 统计量是 Op(1 )的。（推导见张晓峒，攸频：DF 检验式中漂移项和趋势项的 t 统计量研究，《数量经济技术经济研究》，2006,2, p,126-137。）有限样本条件下的 DF 统计量的分布特征（蒙特卡罗模拟结果）。表 2 DF 分布百分位数表生成过程 T  和估计式 0.01 0.025 0.05 0.10 0.90 0.95 0.975 0.99 25 - 3.75 - 3.33 - 3.00 - 2.63 - 0.37 0.00 0.34 0.72 50 - 3.58 - 3.22 - 2.93 - 2.60 - 0.40 - 0.03 0.29 0.66 情形 2 100 - 3.51 - 3.17 - 2.89 - 2.58 - 0.42 - 0.05 0.26 0.63 250 - 3.46 - 3.14 - 2.88 - 2.57 - 0.42 - 0.06 0.24 0.62 500 - 3.44 - 3.13 - 2.87 - 2.57 - 0.43 - 0.07 0.24 0.61  - 3.43 - 3.12 - 2.86 - 2.57 - 0.44 - 0.07 0.23 0.60 注：数据生成过程（DGP）：yt = yt-1 + ut, y0 = 0, ut  IID(0,  2 )，OLS估计式： t t ut y = + y −1 + 。 T=100，模拟1万次的DF统计量的分布结果。 0 200 400 600 800 1000 1200 1400 -5.00 -3.75 -2.50 -1.25 0.00 1.25 Series: DF Sample 1 10000 Observations 10000 Mean -1.531341 Median -1.555245 Maximum 1.934342 Minimum -5.380393 Std. Dev. 0.867661 Skewness 0.131914 Kurtosis 3.329006 Jarque-Bera 74.10418 Probability 0.000000 （file：5simu-df2）表 3：估计式 t t t y = + y + v   −1 中 ( ˆ) t 的分布（模拟 5 万次） T CV0.005 CV0.025 CV0.05 CV0.95 CV0.975 CV0.995 30 -3.71607 -2.98201 -2.64194 2.51020 2.86467 3.56780 50 -3.57894 -2.91253 -2.58341 2.52826 2.88722 3.58953 100 -3.47011 -2.85596 -2.54997 2.55833 2.88539 3.50376 150 -3.44065 -2.85378 -2.54470 2.57503 2.90392 3.56663 200 -3.42902 -2.82471 -2.52979 2.54631 2.87799 3.56599 250 -3.37406 -2.82317 -2.53374 2.54035 2.88494 3.56644 注：(M.File:unitroot02) 注：数据生成过程为 yt = yt-1 + ut , ut  IID(0, 1)。OLS 估计式： t t ut y = + y −1 + T = 100 条件下， ( ˆ) t 的分布见图

点击下载完整版文档（DOC格式）

共41页，可试读14页，点击继续阅读 ↓↓

点击下载（DOC格式）

浏览记录