第2讲ARMA模型的干扰分析 ARMA模型的干扰分析就是对平稳时间序列的均值变化进行显著性检验。先以AR(1) 过程为例, 其中1,表示随机误差项,D表示虚拟变量。定义如下: D lt≥4 其中t表示干扰时点。对(1)式两侧求期望,可得到y的长期均值。当【<t时,干扰前的 长期均值是 E() 当t≥1,干扰后的长期均值是 E(v)= a+r 那么施加干扰后对系统的长期影响是 对于MA(1)过程,干扰分析的表达式是 y=A+u+ a ur-1+y 干扰前的长期均值是 E() 当1≥1,干扰后的长期均值是 E()=+y 那么施加干扰后对系统的长期影响是 对于ARMA过程, y=a+aL)yi1+AL)u+yD (4) 其中q(L)和(L)分别是y1和t的滞后算子,干扰分析如下 干扰前的长期均值是 当t≥t,干扰后的长期均值是 E()= a+y 1-φ(L 那么施加干扰对系统的长期影响是 Φ(L)1-(L)1-(L
1 第 2 讲 ARMA 模型的干扰分析 ARMA 模型的干扰分析就是对平稳时间序列的均值变化进行显著性检验。先以 AR(1) 过程为例, yt = + 1 yt-1 + D + ut, 1 < 1 (1) 其中 ut,表示随机误差项,D 表示虚拟变量。定义如下: D = i i t t t t 1, 0, (2) 其中 ti 表示干扰时点。对(1)式两侧求期望,可得到 yt 的长期均值。当 t < ti 时,干扰前的 长期均值是 E(yt) = 1 1 − 当 t ti,干扰后的长期均值是 E(yt) = 1 1 − + 那么施加干扰后对系统的长期影响是 1 1 − + - 1 1 − = 1 1 − 对于 MA(1)过程,干扰分析的表达式是 yt = + ut + 1 ut-1 + D (3) 干扰前的长期均值是 E(yt) = 当 t ti,干扰后的长期均值是 E(yt) = + 那么施加干扰后对系统的长期影响是 ( + ) - = 对于 ARMA 过程, yt = + (L) yt-1 +(L)ut + D (4) 其中(L)和(L)分别是 yt-1 和 ut 的滞后算子,干扰分析如下。 干扰前的长期均值是 E(yt) = 1−Φ(L) 当 t ti,干扰后的长期均值是 E(yt) = 1−Φ(L) + 那么施加干扰对系统的长期影响是 1−Φ(L) + - 1−Φ(L) = 1−Φ(L)
总结如下表 过程类型干扰前的长期均值干扰后的长期均值干扰对系统的长期影响 AR(1) ARMA(P, q) (L) AA(1) u+y MA(q) 可以总结出如下两点: (1)只要过程中存在自回归(AR)分量,那么无论有无移动平均分量(MA)以及移 动平均分量滞后期有多长,对于干扰前后的均值都无影响。 (2)对于纯移动平均过程,无论滞后期有多长,干扰分析的结论相同。 对系统的干扰可以分成若干种类型,包括阶跃式干扰、脉冲式干扰、渐进式干扰、衰退 式干扰等。(2)式表达的属于阶跃式干扰(如图1)。 图1阶跃( level)式干扰 比如中国就业人员数统计,从1990年起包括了对农民工的统计。这种变化属于对中国 就业人员数序列的阶跃式干扰。因为1990年以后将都按这种方式统计。 脉冲式干扰见图2。其定义是 lL,t=t, 其中t表示干扰时点。 七如中国人口年死亡率序列中在1960年就存在脉冲式冲击。 2
2 总结如下表: 过程类型 干扰前的长期均值 干扰后的长期均值 干扰对系统的长期影响 AR(1) 1 1 − 1 1 − + 1 1 − ARMA (p, q) 1−Φ(L) 1−Φ(L) + 1−Φ(L) MA(1) + MA ( q) + 可以总结出如下两点: (1)只要过程中存在自回归(AR)分量,那么无论有无移动平均分量(MA)以及移 动平均分量滞后期有多长,对于干扰前后的均值都无影响。 (2)对于纯移动平均过程,无论滞后期有多长,干扰分析的结论相同。 对系统的干扰可以分成若干种类型,包括阶跃式干扰、脉冲式干扰、渐进式干扰、衰退 式干扰等。(2)式表达的属于阶跃式干扰(如图 1)。 0.0 0.5 1.0 1.5 25 50 75 100 125 150 175 200 DL 图 1 阶跃(level)式干扰 比如中国就业人员数统计,从 1990 年起包括了对农民工的统计。这种变化属于对中国 就业人员数序列的阶跃式干扰。因为 1990 年以后将都按这种方式统计。 脉冲式干扰见图 2。其定义是 DP= = i i t t t t 1, 0, 其中 ti 表示干扰时点。 比如中国人口年死亡率序列中在 1960 年就存在脉冲式冲击。 ti
DEATHRATE 0.5 0.0 25150175200 图2脉冲( pulse)式干扰 中国人口死亡率(fle:6popu-rate) 累进式干扰见图3。其定义是 ln≤<l2 其中l,l表示干扰时点 number o new students B9099998co04 图3累进( slope)式 中国高校年招生人数(万人)(fle: datal) 比如中国教育部近年来实施的普通高校扩招计划。这种扩招计划不是在一年内完成的 而是通过在连续若干年内的努力才使中国普通高校学生数序列达到一个新的水平,这相当于 对中国普通高校学生数序列加载了一个渐进式冲击。 又如在农业生产领域推广水稻优良品种,这个过程不是在一年中完成的,而是经过 干年的努力从而使水稻产量达到一个新水平。 衰退式干扰见图4。其定义是 D 其中,12表示干扰时点
3 0.0 0.5 1.0 1.5 25 50 75 100 125 150 175 200 DP 4 8 12 16 20 24 28 50 55 60 65 70 75 80 85 90 95 DEATHRATE 图 2 脉冲(pulse)式干扰 中国人口死亡率(file:6popu-rate) 累进式干扰见图 3。其定义是 D = 2 1 2 1 2 1 1 1, , 0, i i i i i i i t t t t t t t t t t t − − 其中 ti1, ti2 表示干扰时点。 0.0 0.5 1.0 1.5 25 50 75 100 125 150 175 200 DT 0 100 200 300 400 500 86 88 90 92 94 96 98 00 02 04 number of new students 图 3 累进(slope)式 中国高校年招生人数(万人)(file:data1) 比如中国教育部近年来实施的普通高校扩招计划。这种扩招计划不是在一年内完成的, 而是通过在连续若干年内的努力才使中国普通高校学生数序列达到一个新的水平,这相当于 对中国普通高校学生数序列加载了一个渐进式冲击。 又如在农业生产领域推广水稻优良品种,这个过程不是在一年中完成的,而是经过若 干年的努力从而使水稻产量达到一个新水平。 衰退式干扰见图 4。其定义是 D = 2 1 2 1 2 1 1 0, 1 , 0, i i i i i i i t t t t t t t t t t t − − − 其中 ti1, ti2 表示干扰时点。 ti1 ti2 ti
图4衰退式 根据不同的干扰模式还可以写出若干种其他类型的干扰表达式。如倒Ⅴ字型干扰、梯 形干扰、阶梯形干扰等 例1(ile:5 break4)中国全国居民对数的消费水平时间序列(1952~1997)见图1l.1 从图中可以明显的看出1978年改革开放以后,对数的居民消费水平增加速度明显高于改革 开放之前 28 DLOGY 20 00 Lnyt DUmmy 对对数的消费水平序列差分得差分序列如图。两个时期的均值分别是00320和01234 由于经济的快速发展,改革开放以后的消费水平比改革开放以前有了显著的提高。利用干扰 模型分析这种提高是否存在显著性。设定虚拟变量如下, 0.1953≤t≤1977 l,1978≤t≤1997 得估计结果如下, DEnY=0.0321+0.1030D1+v+0.93671 (2.1)(4.8) (154) R2=069,Q(15)=7.5<x20(14)=237,DW=24,7=45,(1952~1997) 由于D1的系数存在显著性(=48),说明改革开放的政策确实给居民的消费水平带来 很大提高。干扰分析是 0.0321,1953≤t≤197 E(DUnYi= 0.1351,1978≤t≤1997 改革开放以前对数的消费水平年增均值是0.0321,改革开放以后的消费水平年增均值是 1351。改革开放的政策带来的提高是0.1030 估计过程是用DnY先对常数和虚拟变量D回归,然后通过相关图分析残差序列的结 构。这是一个一阶移动平均过程。最终建立模型如上式
4 0.0 0.5 1.0 1.5 25 50 75 100 125 150 175 200 D 图 4 衰退式 根据不同的干扰模式还可以写出若干种其他类型的干扰表达式。如倒 V 字型干扰、梯 形干扰、阶梯形干扰等。 例 1 (file:5break4)中国全国居民对数的消费水平时间序列(19521997)见图 11.12。 从图中可以明显的看出 1978 年改革开放以后,对数的居民消费水平增加速度明显高于改革 开放之前。 4 5 6 7 8 55 60 65 70 75 80 85 90 95 LOG(Y) -.08 -.04 .00 .04 .08 .12 .16 .20 .24 .28 55 60 65 70 75 80 85 90 95 DLOG(Y) Lnyt D Lnyt 对对数的消费水平序列差分得差分序列如图。两个时期的均值分别是 0.0320 和 0.1234。 由于经济的快速发展,改革开放以后的消费水平比改革开放以前有了显著的提高。利用干扰 模型分析这种提高是否存在显著性。设定虚拟变量如下, D1= 1, 1978 1997 0, 1953 1977 t t 得估计结果如下, DLnYt = 0.0321 + 0.1030 D1 + vt + 0.9367vt-1 (2.1) (4.8) (15.4) R 2 = 0.69, Q(15) = 7.5 < 2 0.05 (14) = 23.7, DW=2.4, T= 45,(19521997) 由于 D1 的系数存在显著性(t = 4.8),说明改革开放的政策确实给居民的消费水平带来 很大提高。干扰分析是 E(DLnYt) = 0.1351, 1978 1997 0.0321, 1953 1977 t t 改革开放以前对数的消费水平年增均值是 0.0321,改革开放以后的消费水平年增均值是 0.1351。改革开放的政策带来的提高是 0.1030。 估计过程是用 DLnYt 先对常数和虚拟变量 D1 回归,然后通过相关图分析残差序列的结 构。这是一个一阶移动平均过程。最终建立模型如上式。 ti1 ti2
Autocorrelation Partial Correlation Ac PAc Q-Stat Prob 20.1520234434370.114 30.1060003490970.179 40.140.166597640.201 5-008400186.34740.274 600460085646270.373 70.1400.167755110.374 801530018889260.351 Method: Least Squares Sample(adjusted): 1953 199 Included obserations: 45 after adjustments Convergence achieved after 14 iterations Backcast: 1952 Variable Coefficient Std Error t-Statistic Prob 00321490015488 07574100441 0.10300002125748456390000 MA(1) 09356720050744154200800000 R-squared 0. 687750 Mean dependent var 0.079276 Adjusted R-squared 0.672881 S.D. dependent var 0.075247 S.E. of regression 0.043037 Akaike info criterion -3.389166 Sum squared resid 0.077792 Schwarz criterion 3.268722 Log likelihood 79.25623 F-statistic 46.25383 Durbin-Watson stat 2. 426073 Prob(F-statistic Inverted mA Roots 94 例2(fle: 5citypopu)用干扰模型分析中国城镇人口数(y:万人,19491~995)序列 中国城镇人口数序列明显在1978年存在一个转折点。年增加量大大增加。其原因并不 是城镇人口自身的能力增加,而是新的城镇人口管理政策使农村人口向城镇人口转移的速度 大大增加 中国城镇人口数差分序列图如下。1977年前的城镇人口年增均值是3894万人,1978 年以后的城镇人口年增均值是1028.1万人 36000 32000 1028
5 例 2 (file:5citypopu)用干扰模型分析中国城镇人口数(yt:万人,19491995)序列。 中国城镇人口数序列明显在 1978 年存在一个转折点。年增加量大大增加。其原因并不 是城镇人口自身的能力增加,而是新的城镇人口管理政策使农村人口向城镇人口转移的速度 大大增加。 中国城镇人口数差分序列图如下。1977 年前的城镇人口年增均值是 389.4 万人,1978 年以后的城镇人口年增均值是 1028.1 万人。 4000 8000 12000 16000 20000 24000 28000 32000 36000 50 55 60 65 70 75 80 85 90 95 Y -1500 -1000 -500 0 500 1000 1500 2000 50 55 60 65 70 75 80 85 90 95 DY 389.4 1028.1
下面用干扰模型分析这种提高是否存在显著性。设定虚拟变量 D!=0.1949151977 l.1978≤t≤1995 得估计结果如下, Dy=397.06+61898D1+v+0.2986v-1 (4.0)(3.9) R2=0.41,Q(15)=82<x(14)=237,DW=21,7=46,(1950-1995) 因为DⅠ的系数存在显著性(【=39),说明改革开放以后,城镇人口管理政策的松动使 农村人口向城镇人口转移的速度增加。 上式也可写成, =39706+"+02986s/1sts1977 101604+v+0.2986v-1,1978≤t≤1995 干扰分析是 E(Dy= 101604,1978≤t≤1995 改革开放以前城镇人口年均增加39706万人,改革开放以后城镇人口年均增加1016.04 万人。城镇人口管理政策的松动导致城镇人口年均增加618.98万人。 Dependent variable: DY Method: Least Squares Date:06/2707Tme:17:42 ample(adjusted): 1950 1995 Included observations: 46 after adjustments Convergence achieved after 7 iterations Backcast: 1949 Variable Coefficient Std Error t-Statistic Prob 39706209998095397137700003 61898401580643391602600003 MA(1) 0.2986100.145574205126500464 R-sq 0.407410 Mean dependent var 639.326 Adjusted R-squared 0.379848 S.D. dependent var 521.5426 S.E. of regressior 410.7133 Akaike info criterion 14,93666 Sum squared resid 7253474. Schwarz criterion 1505592 Log likelihood 340 5432 F-statistic 14.78144 Durbin-Watson stat 2.057364 Prob(F-statistic 000013 Inverted MA Roots 见图,注意到1978年以后,城镇人口管理政策的松动是在两年中完成的。所以可以把 虚拟变量设计为累进式。定义D3如下 1949≤t≤1977 D3=0.5 t=1978 l,1979 这样得到的估计结果更好些
6 下面用干扰模型分析这种提高是否存在显著性。设定虚拟变量 D1= 1, 1978 1995 0, 1949 1977 t t 得估计结果如下, Dyt = 397.06 + 618.98 D1 + vt + 0.2986 vt-1 (4.0) (3.9) (2.1) R 2= 0.41, Q(15) = 8.2 < 2 (14) = 23.7, DW=2.1, T= 46,(19501995) 因为 D1 的系数存在显著性(t = 3.9),说明改革开放以后,城镇人口管理政策的松动使 农村人口向城镇人口转移的速度增加。 上式也可写成, Dyt = + + + + − − 1016.04 0.2986 , 1978 1995 397.06 0.2986 , 1949 1977 1 1 v v t v v t t t t t 干扰分析是 E(Dyt)= 1016 .04, 1978 1995 397.06, 1949 1977 t t 改革开放以前城镇人口年均增加 397.06 万人,改革开放以后城镇人口年均增加 1016.04 万人。城镇人口管理政策的松动导致城镇人口年均增加 618.98 万人。 见图,注意到 1978 年以后,城镇人口管理政策的松动是在两年中完成的。所以可以把 虚拟变量设计为累进式。定义 D3 如下, D3= = 1, 1979 1995 0.5, 1978 0, 1949 1977 t t t 这样得到的估计结果更好些
Dv2=38487+668.29D3+v+0.372v1 (3.8) (23) R2=043,Q(15)=77<x2(14)=237,DW=2.1,7=46,(1950-1995) 上式也可写成, 384.87+V1+0.3372v-1,1949≤t≤1977 Dn=1719.015+V+03327-1 t=1978 1053.16+v+0.372V1 979≤t≤1995 干扰分析是 ≤t≤1977 E(D)={79015, 1053.16 ≤t≤1995 经济解释是改革开放以前城镇人口年均增加384.87万人,1987年城镇人口增加79.015 万人;改革开放以后城镇人口年均增加1053.16万人。城镇人口管理政策的松动导致城镇人 口年均增加66829万人 Dependent Variable: DY Method: Least Squares Date:06/2707Tme:8:11 Sample(adjusted): 1950 1995 Included obserations: 46 after adjustments Convergence achieved after 6 iterations Backcast: 1949 Variable Coefficient Std Error t-Statistic Prob C 38487141008537381613500004 668.2854163.6110408459900002 MA(1) 0.3372370143573234888900235 R-squared 0. 430247 Mean dependent 6393261 Adjusted R-squared 0. 403747 S.D. dependent var 521 5426 S E. of regression 402.7218 Akaike info criterion 14.89736 Sum squared resid 6973949. Schwarz criterion 1501662 339 6393 F-statistic 16.23 Durbin-Watson stat 2.080831 Prob(F-statistic 0. 000006 Inverted MA Roots
7 Dyt = 384.87 + 668.29 D3 + vt + 0.3372 vt-1 (3.8) (4.1) (2.3) R 2= 0.43, Q(15) = 7.7 < 2 (14) = 23.7, DW=2.1, T= 46,(19501995) 上式也可写成, Dyt = + + + + = + + − − − 1053.16 0.3372 , 1979 1995 719.015 0.3372 , 1978 384.87 0.3372 , 1949 1977 1 1 1 v v t v v t v v t t t t t t t 干扰分析是 E(Dyt) = = 1053 .16, 1979 1995 719.015, 1978 384.87, 1949 1977 t t t 经济解释是改革开放以前城镇人口年均增加 384.87 万人,1987 年城镇人口增加 719.015 万人;改革开放以后城镇人口年均增加 1053.16 万人。城镇人口管理政策的松动导致城镇人 口年均增加 668.29 万人