第3讲回归与ARMA组合模型 已经学习回归模型和时间序列模型,如果把这两种分析方法结合在一起,有时会得到比 其中任何一种方法都好的预测结果。 例如有如下回归模型 =Bo+Bi 其中x是解释变量,y是被解释变量,ψ是随机误差项。上述模型的估计式是 Bo+B,xr+u 令=0,用上式可预测y的值。L,是一个平稳的、非自相关的残差序列。当,存在自相关 时,时间序列分析的一个有效应用是对残差序列l,建立ARMA模型。然后将上式中的残差 项用ARMA模型替换。在利用上述模型预测y时,可以利用ARMA模型先预测出的值 有时,这会使y的预测值更准确 这种回归与时间序列相结合的模型形式是 y-Bo+B,x+a-(L)O(L)vr (2) 其中1=(LO(L)v,或写成中(L)1=已(Lvov是服从正态分布的、非自相关的误差 项。v的方差一般与,不一样。这种回归与时间序列相组合的模型称作转(变)换函数模型 ( transfer function model),多元(变量)自回归移动平均模型( multivariate autoregressive moving average model),简称 MARMA模型,或回归与时间序列组合模型( combined regression-time series model 假设(1)式中的t是一个ARMA(1,1)过程,则估计(1)式的 EViews估计命令是 ⅹAR(1)MA(1) 注意 (1)如果(1)式中的t是一个AR(1)过程,则回归与ARMA组合模型表达的就是误 差项为一阶自相关的经典回归模型 (2)以(2)式为例,按wold分解定理,也可以对转换函数模型作如下理解。y-B x=表示在y中剔除了确定性影响角+Bx后所得序列是一个不含任何确定性成分的 平稳的随机序列。用山建立时间序列模型。 回归与ARMA组合模型也可以由被解释变量及其滞后项、一个或多个解释变量及其滞 后项、和描述随机误差序列的时间系列模型3部分组成 只含有一个解释变量的组合模型可写为, A(D)y=yo+rd+B(L)x,+e() vi (3) 其中=φ(L)θ(Lv。)表示常数(漂移项)。d表示y的线性确定性成分,如周期性成 分、时间t的多项式和指数形式,虚拟变量等,可以直接用t预测。通过对特征多项式A(L) B(L)、Φ(L)、O(L)的约束可以得到组合模型的不同特殊形式。整理如表1。 站在回归模型基础上看组合模型(3),是通过把模型误差项拟合成ARMA形式从而提 高回归系数a,房的有效性。 站在时间序列模型基础上看组合模型(3),是把解释变量B(Lx;看作υ中的确定性成分, 通过回归,把这些确定性成分从y中减掉,从而对一个平稳误差序列建立ARMA模型。 通过对组合模型的施加约束条件可以得到各种形式的模型
1 第 3 讲 回归与 ARMA 组合模型 已经学习回归模型和时间序列模型,如果把这两种分析方法结合在一起,有时会得到比 其中任何一种方法都好的预测结果。 例如有如下回归模型 yt = 0 + 1 xt + ut (1) 其中 xt是解释变量,yt是被解释变量,ut是随机误差项。上述模型的估计式是 yt = 0ˆ + 1ˆ xt + t uˆ 令 t uˆ = 0,用上式可预测 yt的值。 t uˆ 是一个平稳的、非自相关的残差序列。当 t uˆ 存在自相关 时,时间序列分析的一个有效应用是对残差序列 t uˆ 建立 ARMA 模型。然后将上式中的残差 项用 ARMA 模型替换。在利用上述模型预测 yt时,可以利用 ARMA 模型先预测出 t uˆ 的值。 有时,这会使 yt的预测值更准确。 这种回归与时间序列相结合的模型形式是 yt = 0ˆ + 1ˆ xt + -1(L) (L) vt (2) 其中 t uˆ = -1(L) (L) vt,或写成 (L) t uˆ = (L) vt。vt 是服从正态分布的、非自相关的误差 项。vt的方差一般与 t uˆ 不一样。这种回归与时间序列相组合的模型称作转(变)换函数模型 (transfer function model),多元(变量)自回归移动平均模型(multivariate autoregressive -moving average model),简称 MARMA 模型,或回归与时间序列组合模型(combined regression-time series model)。 假设(1)式中的 ut是一个 ARMA(1, 1)过程,则估计(1)式的 EViews 估计命令是 Y c X AR(1) MA(1) 注意: (1)如果(1)式中的 ut是一个 AR(1) 过程,则回归与 ARMA 组合模型表达的就是误 差项为一阶自相关的经典回归模型。 (2)以(2)式为例,按 Wold 分解定理,也可以对转换函数模型作如下理解。yt - 0 - 1 xt = ut 表示在 yt 中剔除了确定性影响0 +1 xt 后所得序列 ut 是一个不含任何确定性成分的 平稳的随机序列。用 ut建立时间序列模型。 回归与 ARMA 组合模型也可以由被解释变量及其滞后项、一个或多个解释变量及其滞 后项、和描述随机误差序列的时间系列模型 3 部分组成。 只含有一个解释变量的组合模型可写为, A(L) yt = 0 + dt +B(L) xt + ( ) ( ) L L vt (3) 其中 ut =-1(L) (L) vt。0 表示常数(漂移项)。dt 表示 yt的线性确定性成分,如周期性成 分、时间 t 的多项式和指数形式,虚拟变量等,可以直接用 t 预测。通过对特征多项式 A(L)、 B(L)、 (L)、 (L)的约束可以得到组合模型的不同特殊形式。整理如表 1。 站在回归模型基础上看组合模型(3),是通过把模型误差项拟合成 ARMA 形式从而提 高回归系数j,j的有效性。 站在时间序列模型基础上看组合模型(3),是把解释变量 B(L)xt看作 yt中的确定性成分, 通过回归,把这些确定性成分从 yt中减掉,从而对一个平稳误差序列建立 ARMA 模型。 通过对组合模型的施加约束条件可以得到各种形式的模型
表1 组合模型及其各种特殊形式 名称 模型形式 约束条件 组合模型(一般形式) +r+ B()xr 6(L) Φ(L) 分布滞后模型 0+xd, +B(L)x,+v A(L)=6(D=d(L=1 动态分布滞后模型 A(L)y=№+B(L)x+v (D)=(D=1,y=0 自回归(AR)模型 A(D)n=20+ve B(D)=0,(D=d(D=1,r0 移动平均(MA)模型 y=D+eL)v A(D=1,B(L=0,(D)=1,y 自回归移动平均(ARMA)模型A(L)y=为+6D)v B(L=0,d(L=1 ARMA误差项的分布滞后模型 线性回归模型 =0+%+6x+v A(L)=B(D)=6(L)=d(D=1 注:为表示常数(截距项)。d表示y的线性确定性成分,如周期性成分、时间t的多项式和指数形式, 虚拟变量等,可以直接用时间t预测。A(L)、BL)、O(D)、Φ(L)是特征多项式,B(L)的第1项是角,不必为 回归模型和ARMA模型都包括在组合模型之中。他们只不过是组合模型的一个特殊形 式 进一步分析发现,回归与ARMA组合模型实际上是动态分布滞后模型的一种表现形式。 假定有如下组合模型, +B1x+ (2) v2~IN(0,a2) 用滞后算子形式改写(2)式 (1-L)a=v 中1L 把上式代入(1)式, =B+B1x1+ P,L 上式两侧同乘(1-L,得 (1-L)y=(1-D负+B1(1-91L)x+v =+(1-)B为+B1x-Bx1+v 可见如果回归模型误差项是1阶自回归形式。实际上y是一个一阶自回归分布滞后模 型,只不过对x1的系数多加了一个约束条件。若x1的系数用表示,则约束条件是, B2=-B1pu 以组合模型一般形式 A(D)y =%+rd, +B(L)x,+e() vi
2 表 1 组合模型及其各种特殊形式 名称 模型形式 约束条件 组合模型(一般形式) A(L) yt = 0 +dt + B(L) xt + ( ) ( ) L L vt 无 分布滞后模型 yt = 0 +dt +B(L) xt + vt A(L) = (L) = (L) = 1 动态分布滞后模型 A(L) yt = 0 +B(L) xt + vt (L) = (L) = 1,=0 自回归(AR)模型 A(L) yt = 0 +vt B(L) =0, (L) = (L) = 1,=0 移动平均(MA)模型 yt = 0 +(L) vt A(L) =1,B(L)=0, (L) = 1,=0 自回归移动平均(ARMA)模型 A(L) yt = 0 +(L) vt B(L)=0, (L) = 1,=0 ARMA 误差项的分布滞后模型 yt =0 +B(L) xt + ( ) ( ) L L vt A(L) =1,=0 线性回归模型 yt = 0 +dt +0 xt + vt A(L) = B(L) = (L) = (L) = 1 注:0 表示常数(截距项)。dt 表示 yt 的线性确定性成分,如周期性成分、时间 t 的多项式和指数形式, 虚拟变量等,可以直接用时间 t 预测。A(L)、B(L)、 (L)、 (L)是特征多项式,B(L)的第 1 项是0,不必为 1。 回归模型和 ARMA 模型都包括在组合模型之中。他们只不过是组合模型的一个特殊形 式。 进一步分析发现,回归与 ARMA 组合模型实际上是动态分布滞后模型的一种表现形式。 假定有如下组合模型, yt = 0 + 1 xt + ut (1) ut = 1ut-1 + vt (2) vt IN(0, 2) 用滞后算子形式改写(2)式, (1-1L) ut = vt ut = 1 1L 1 vt 把上式代入(1)式, yt = 0 + 1 xt + 1 1L 1 vt (3) 上式两侧同乘(1-1L),得 (1-1L) yt = (1-1L) 0 + 1 (1-1L) xt +vt yt = 1 yt-1 + (1-1) 0 + 1 xt -11 xt-1 +vt 可见如果回归模型误差项是 1 阶自回归形式。实际上 yt 是一个一阶自回归分布滞后模 型,只不过对 xt-1的系数多加了一个约束条件。若 xt-1的系数用2表示,则约束条件是, 2 = -11 以组合模型一般形式 A(L) yt = 0 + dt +B(L) xt + ( ) ( ) L L vt
为例,可变换为, A (L)d()y=0()+rd ()B()o()x +O(L)v, 如果A(L阶数为n,B(L)阶数为m,Φ(L阶数为p,那么一般组合模型(4)实际上是一个 带有确定性成分的ADL(n+pm+p)模型。 组合模型主要有三种用处。(1)克服回归模型中的自相关:(2)对序列做长期预测 应用1:用组合模型克服回归模型中的自相关。 【案例1】(fle:5 autos7,5 autos7b)中国储蓄存款总额(DEPO,亿元,1960-2001) 储蓄存款年增加额(储蓄存款余额序列的差分序列)(Y,亿元,1970-2006)对GDP(亿元) 的计量经济模型 包括两项内容:(1)储蓄存款年底余额对GDP的计量经济分析(总量对增量):(2)储 蓄存款年増加额(储蓄存款余额序列的差分序列)对GDP的计量经济分析(増量对增量)。 从分析方法上包括如下内容:作图分析;边际系数分析,弹性系数分析:线性模型分析 非线性模型分析:回归模型分析,组合模型分析:估计方法上包括OLS估计,WLS估计, 估计 见下图分析储蓄存款年底余额与GDP的比率序列( DEPO/GDP,1970-2006)。 DEPO/GDP 先回忆用广义差分的方法克服自相关。用Y对GDP回归(eq03) DEPO1=-3028.56+0.6975GDP (-46)(36.6) R=0.97,D∥=0.18,T=42,(1960-2001) 残差图如下 Residual Actual- Fitted 15000 40000 0000 20000 5000 20000 图1线性模型的拟合与残差图
3 为例,可变换为, A(L) (L) yt = 0 (L) + dt (L)+B(L) (L) xt + (L)vt 如果 A(L)阶数为 n,B(L) 阶数为 m, (L)阶数为 p,那么一般组合模型(4)实际上是一个 带有确定性成分的 ADL(n+p,m+p) 模型。 组合模型主要有三种用处。(1)克服回归模型中的自相关;(2)对序列做长期预测; 应用 1:用组合模型克服回归模型中的自相关。 【案例 1】(file: 5autoco7, 5autoco7b)中国储蓄存款总额(DEPO,亿元,1960-2001)、 储蓄存款年增加额(储蓄存款余额序列的差分序列)(Y,亿元,1970-2006)对 GDP(亿元) 的计量经济模型。 包括两项内容:(1)储蓄存款年底余额对GDP的计量经济分析(总量对增量);(2)储 蓄存款年增加额(储蓄存款余额序列的差分序列)对GDP的计量经济分析(增量对增量)。 从分析方法上包括如下内容:作图分析;边际系数分析,弹性系数分析;线性模型分析, 非线性模型分析;回归模型分析,组合模型分析;估计方法上包括OLS估计,WLS估计, ML估计。 见下图分析储蓄存款年底余额与GDP的比率序列(DEPO/GDP,1970-2006)。 .0 .1 .2 .3 .4 .5 .6 .7 .8 .9 60 65 70 75 80 85 90 95 00 DEPO/GDP 0 10000 20000 30000 40000 50000 60000 70000 80000 0 10000 30000 50000 70000 90000 GDP Y 先回忆用广义差分的方法克服自相关。用 Yt对 GDPt回归(eq03), DEPOt = -3028.56 + 0.6975 GDPt (5) (-4.6) (36.6) R 2 = 0.97, DW=0.18, T = 42, (1960-2001) 残差图如下, -10000 -5000 0 5000 10000 15000 -20000 0 20000 40000 60000 80000 1960 1965 1970 1975 1980 1985 1990 1995 2000 Residual Actual Fitted 图 1 线性模型的拟合与残差图
Breusch-Godfrey Serial Correlation LM Test F-statistic 174.5373 Probability 00o Obs"R-squared 37. 87676 Probability 0000000 (2阶自相关的LM检验结果,存在自相关 White Heteroskedasticity Test F-statistic 19.78057 Probability Obs*R-squared 21.15000 Probability 000026 (无交叉项Whte异方差检验结果,存在异方差。) 由图1、2阶自相关的LM检验结果和Whte异方差检验结果可以看出模型既存在自相 关又存在异方差。 下面尝试建立对数线性模型。(eq01) LnDEPO, =-88685+1.7647 LnGDP, (6) (-389)(696)R2=0.99,DW=0.23,T=42,(1960-2001) Actual Fitted 075808.59.09.5100105110115120 196019651970197519801985199019952000 图2对数线性模型的拟合与残差图 Breusch-Godfrey Serial Correlation LM Test F-stati 76 39188 Probability 00000 Obs"R-squared 33.63451 Probabilit (2阶自相关的LM检验结果,存在自相关) White Heteroskedasticity Test F-statistic 3240260Prob.F239) 0049907 Obs*R-squared 5.984581 Prob Chi-Square (2) 0.050172 (无交叉项Whte异方差检验结果,不存在异方差。) 由图2、2阶自相关的LM检验结果和 White异方差检验结果可以看出对数模型仍然存 在自相关,但不存在异方差 用模型的残差序列做2阶自回归,结果如下, RES1=-0.0094+1.18RES1-0.36RES2 (7) (-0.6)(8.0)(-2.4) R2=0.81,DW=1.65,7=40,(19622001)
4 (2 阶自相关的 LM 检验结果,存在自相关。) (无交叉项 White 异方差检验结果,存在异方差。) 由图 1、2 阶自相关的 LM 检验结果和 White 异方差检验结果可以看出模型既存在自相 关又存在异方差。 下面尝试建立对数线性模型。(eq01) LnDEPOt = -8.8685 +1.7647 LnGDPt (6) (-38.9) (69.6) R 2 = 0.99, DW=0.23, T = 42, (1960-2001) 3 4 5 6 7 8 9 10 11 12 7.0 7.5 8.0 8.5 9.0 9.5 10.0 10.5 11.0 11.5 12.0 LOG(GDP) LOG(Y) -.4 -.2 .0 .2 .4 .6 2 4 6 8 10 12 1960 1965 1970 1975 1980 1985 1990 1995 2000 Residual Actual Fitted 图 2 对数线性模型的拟合与残差图 (2 阶自相关的 LM 检验结果,存在自相关) (无交叉项 White 异方差检验结果,不存在异方差。) 由图 2、2 阶自相关的 LM 检验结果和 White 异方差检验结果可以看出对数模型仍然存 在自相关,但不存在异方差。 用模型的残差序列做 2 阶自回归,结果如下, RESt = -0.0094 +1.18 RESt-1 -0.36 RESt-2 (7) (-0.6) (8.0) (-2.4) R 2 = 0.81, DW=1.65, T = 40, (1962-2001)
模型残差中存在2阶自相关形式 先回忆用广义差分方法克服自相关 克服自相关方法(1):采取2阶广义差分变量回归,估计参数。定义2个广义差分变量 如下: GLnY,= LnY-1 18 LnY -1+0.36 Ln Y+-2 (8) GLnGDP,=LnGDP,-1. 18 LnGDP,-+0.36 LnGDP:-2 得估计结果。 GLnY,=-15820+1.7505 GLnGDP, (-15.8)(295) R=0.96,D=1.64,T=40,(1962-2001) 做异方差和自相关检验如下。 Breusch-Godfrey Serial Correlation LM Test F-statis 0743307Prob.F(137 0.394157 Obs*R-squared 0787749Prob. Chi-Square(1)0.374782 (1阶自相关LM检验结果) Breusch-Godfrey Serial Correlation LM Test F-statistic 1.077537 Probability 0.351159 Obs"R-squared 2.259280 Probabilit 0.32315 (2阶自相关LM检验结果) White Heteroskedasticity Test F-statistic 1.397597 Probability 0.259935 Obs"R-squared 2.809580 Probability 0.245419 (无交叉项Whte异方差检验结果) 19651970197519801985199019952000 观测值、拟合值、残差 模型符合要求。储蓄存款总额(Y,亿元)对GDP的弹性是1.75。即GDP每增长1%, 储蓄存款总额增长1.75%。 克服自相关方法(2):用回归与ARMA的组合模型克服自相关估计回归参数 观察(6)式的残差序列的相关图、偏相关图。应该是2阶自回归过程,(7)也证明了 这一结论
5 模型残差中存在 2 阶自相关形式。 先回忆用广义差分方法克服自相关。 克服自相关方法(1):采取 2 阶广义差分变量回归,估计参数。定义 2 个广义差分变量 如下: GLnYt = LnYt-1.18 LnYt-1+0.36 Ln Yt-2 (8) GLnGDPt = LnGDPt-1.18 LnGDPt-1+0.36 LnGDPt-2 (9) 得估计结果。 GLnYt = -1.5820+1.7505 GLnGDPt (10) (-15.8) (29.5) R 2 = 0.96, DW=1.64, T = 40, (1962-2001) 做异方差和自相关检验如下。 (1 阶自相关 LM 检验结果) (2 阶自相关 LM 检验结果) (无交叉项 White 异方差检验结果) -.3 -.2 -.1 .0 .1 .2 0.4 0.8 1.2 1.6 2.0 2.4 1965 1970 1975 1980 1985 1990 1995 2000 Residual Actual Fitted 观测值、拟合值、残差 模型符合要求。储蓄存款总额(Y,亿元)对 GDP 的弹性是 1.75。即 GDP 每增长 1%, 储蓄存款总额增长 1.75%。 克服自相关方法(2):用回归与 ARMA 的组合模型克服自相关估计回归参数。 观察(6)式的残差序列的相关图、偏相关图。应该是 2 阶自回归过程,(7)也证明了 这一结论
Correlogram of Residuals te:09506Tme:1428 Sample:19602001 Included obserations: 42 Autocorrelation Partial Correlation AC Pac @-Stat Prob 10.8680868 0000 20.6580387 0000 30.5050232 000 40.3710232727870000 50.2470071758350000 60.1410116768520000 700280126769040000 801340317778730000 903190164835570000 1004650.118960280000 (6)式残差序列的相关图、偏相关图) 在对数线性模型(6)的基础上再加入两个AR项。得估计结果 LnYr=-8.7350+1.7443 LnGDP+1.1840AR(1)-0.3511AR(2) (-13.6)(252) (-23) R2=0998,DW=1.64,T=40,(1962-2001) Dependent Variable: LOGY) Method: Least squares Date: 09/05/06 Time: 13: 46 Sample (adjusted): 1962 2001 Included observations: 40 after adjustments Convergence achieved after 8 iterations Variable Coefficient Std Error t-Statistic Prob C -8.7349500.54246513595000.0000 LOG(GDP) 1.7442810.06916025220850000 AR(1) 1.1839510150943784377200000 AR(2) -0.3511310.152700229948800274 R squar 0.998491 Mean dependent var 6.946438 Adjusted R-squared 0.998366 S.D. dependent var 2.529740 S.E. of regression 0.102272 Akaike info criterion-1.627715 Sum squared resid 0. 376547 Schwarz criterion 1.458827 Log likelihood 36.55431 F-statistic 941876 Durbin-Watson stat 1.641384 Prob(F-statistic Inverted ar root 59-03 59+03i Breusch-Godfrey Serial Correlation LM Test F-statistic 2091288Prob.F234) 0.139134 Obs"R-squared 4.381660 Prob Chi-Square (2) 0. 111824 (自相关检验结果)
6 ((6)式残差序列的相关图、偏相关图) 在对数线性模型(6)的基础上再加入两个 AR 项。得估计结果, LnYt = -8.7350 +1.7443 LnGDPt + 1.1840AR(1) -0.3511AR(2) (11) (-13.6) (25.2) (7.8) (-2.3) R 2 = 0.998, DW=1.64, T = 40, (1962-2001) (自相关检验结果)
White Heteroskedasticity Test F-statistic 1.109122Prob.F(2,37) 0.340555 Obs "R-squared 2.262462 Prob, Chi-Square(2) 0. 322636 异方差检验结果 Inverse Roots of AR/MA Polynomial(s AR roots 通过以上自相关和异方差检验,模型中已不存在自相关和异方差。模型符合要求。 储蓄存款总额(Y,亿元)对GDP的弹性是1.74。即GDP每增长1%,储蓄存款总额 增长1.74% 弹性系数的OLS估计结果是1.765,GLS估计结果是1.751,回归与ARMA组合模型 估计结果是1.744。 注意:这个方法要求对ARMA模型的设定一定要正确,否则对回归系数影响非常大 下面利用组合模型预测。预测分结构模型预测和非结构模型预测。非结构模型预测是指 ARMA项参与预测计算的预测方法,结构模型预测是指ARMA项不参与预测计算的预测方 用1962-2000年数据估计模型,然后对2001年做样本外一期非结构模型预测结果是 YF YFSE 20173762.407136417861673 Forecast: YF 0000 Forecast sample: 2001 2001 60000 Mean Abs Percent Error 结构模型预测结果是
7 (异方差检验结果) 通过以上自相关和异方差检验,模型中已不存在自相关和异方差。模型符合要求。 储蓄存款总额(Y,亿元)对 GDP 的弹性是 1.74。即 GDP 每增长 1%,储蓄存款总额 增长 1.74%。 弹性系数的 OLS 估计结果是 1.765,GLS 估计结果是 1.751,回归与 ARMA 组合模型 估计结果是 1.744。 注意:这个方法要求对 ARMA 模型的设定一定要正确,否则对回归系数影响非常大。 下面利用组合模型预测。预测分结构模型预测和非结构模型预测。非结构模型预测是指 ARMA 项参与预测计算的预测方法,结构模型预测是指 ARMA 项不参与预测计算的预测方 法。 用 1962-2000 年数据估计模型,然后对 2001 年做样本外一期非结构模型预测结果是 50000 60000 70000 80000 90000 100000 2001 71386.4 88974.8 57274.9 YF Forecast: YF Actual: Y Forecast sample: 2001 2001 Included observations: 1 Root Mean Squared Error 2375.987 Mean Absolute Error 2375.987 Mean Abs. Percent Error 3.221135 结构模型预测结果是
Mean Absolute Error Mean Abs Percent Error 3.742179 40000 下面分析储蓄存款年增加额(Y,亿元)与GDP(亿元)的关系。(5 autos7b) YNGDP 16,000 12000 050,000100000150,000200.000250.000 储蓄存款年增加额(Y)与GDP的比率序列(Y/GDP)储蓄存款年増加额(Y)对GDP的散点图 表3分析储蓄存款年增加额Y对GDP的关系 解释变量 模型8,Y 模型15,H 模型9,F (OLS (GLS (OLS+D) 0.1002 AR(1) 0.48 R- 0.9472 0.8832 0.9593 1.8 1.83 0.18 01 (1.00) (067) 12.8 (p) (0.08) (000) (000) 1970-2006 =37 T=37 注:第一栏中不带括号的数字是相应变量的回归系数值,括号内数字是t值。LM1)、DW表示1阶自相关 检验统计量。Whte表示异方差检验统计量。R2表示可决系数 模型8和模型9对GDP系数的估计几乎无差异。GDP每增加1亿元,储蓄存款年增加额Y 增加0.1亿元人民币。 见下图对数模型1和倒数模型12比较,倒数模型12更合理。以倒数回归和AR(1)组合模 型12b讨论储蓄存款年增加额Y对GDP的弹性
8 40000 60000 80000 100000 120000 140000 2001 76522.7 123003.9 47606.0 YF Forecast: YF Actual: Y Forecast sample: 2001 2001 Included observations: 1 Root Mean Squared Error 2760.321 Mean Absolute Error 2760.321 Mean Abs. Percent Error 3.742179 下面分析储蓄存款年增加额(Y,亿元)与GDP(亿元)的关系。(5autoco7b) .00 .02 .04 .06 .08 .10 .12 .14 1970 1975 1980 1985 1990 1995 2000 2005 Y/GDP 0 4,000 8,000 12,000 16,000 20,000 24,000 0 50,000 100,000 150,000 200,000 250,000 GDP Y 储蓄存款年增加额(Y)与GDP的比率序列(Y/GDP) 储蓄存款年增加额(Y)对GDP的散点图 表3 分析储蓄存款年增加额Y对GDP的关系 解释变量 模型8,Yt (OLS) 模型15,Yt (GLS) 模型9,Y (OLS+D) C () () -1870.52 (-4.7) GDP 0.10 (31.6) 0.1002 (20.7) 0.10 (20.1) AR(1) 0.48 (3.2) R 2 0.9472 0.8832 0.9593 DW 1.0 1.8 1.83 LM(1) (p) 7.8 (0.01) 0.0 (1.00) 0.18 (0.67) White (p) 3.1 (0.08) 12.8 (0.00) 13.3 (0.00) 1970-2006 T =37 T =37 T = 37 注:第一栏中不带括号的数字是相应变量的回归系数值,括号内数字是t值。LM(1)、DW表示1阶自相关 检验统计量。White表示异方差检验统计量。R 2表示可决系数。 模型8和模型9对GDP系数的估计几乎无差异。GDP每增加1亿元,储蓄存款年增加额Y 增加0.1亿元人民币。 见下图对数模型11和倒数模型12比较,倒数模型12更合理。以倒数回归和AR(1)组合模 型12b讨论储蓄存款年增加额Y对GDP的弹性
68.0848.89.29.610.010410811211.612.012.4 68.08.48.8929610010410811.211.6120124 对数变量的对数模型(模型11) 对数变量的倒数模型(模型12,更好些) LnY=224-150.86 LnGDP +0.69AR(1) (20.2)(-136) (6.5)R2=0.9891,DW=1.64,LM(1)=1.1, White=5.0 LnY对 LngDP的导函数是 dEny 150.86 dLnGDP(LnGDP 约在1972年和2006年储蓄存款对GDP的弹性分别是 dEny 150.86 246(约在1972年) dLnGDPIGDP-25001Z (Ln2500) dEny 150.86 dLnGDP 1GP=20万亿(Lm20000101(约在2006年) 需要注意的是1972年GDP增加1%(25亿元),储蓄存款年增加额Y增加246%(较大), 但只相当于增加04亿元,而2006年GDP增加1%(2108亿元),储蓄存款年增加额Y只增加 101%(较小),但相当于增加205亿元。虽然2006年的弹性系数小,但增加值却大很多。 分析储蓄存款年增加额Y对GDP的弹性关系 解释变量模型11,LnY1模型11b,Lny模型12,LnY:模型12b,LnY (OLS (OLS+AR) (OLS (OLS+AR) 26.4 23.60 22.40 (-22.6) (-6.3) (46.5) (20.2) LnLnGDP 16.87 14.6 (8.2) (-) I/LnGDP 163.47 150.86 (-34.3) R(1) 0.77 84) 0.9882 09711 0.9891 0.31 1.67 1.64 LM1) 0.66 White (p) (0.05)(0.2) 1970-2006 T=37 注:第一栏中不带括号的数字是相应变量的回归系数值,括号内数字是t值。LM1)、DW表示1阶自相关 检验统计量。 White表示异方差检验统计量。R表示可决系数
9 0 2 4 6 8 10 12 7.6 8.0 8.4 8.8 9.2 9.6 10.0 10.4 10.8 11.2 11.6 12.0 12.4 LNGDP LNY 0 2 4 6 8 10 12 7.6 8.0 8.4 8.8 9.2 9.6 10.0 10.4 10.8 11.2 11.6 12.0 12.4 LNY LNGDP 对数变量的对数模型(模型11) 对数变量的倒数模型(模型12,更好些) LnY = 22.4 -150.86 LnGDP 1 + 0.69 AR(1) (20.2) (-13.6) (6.5) R 2 = 0.9891, DW = 1.64, LM(1)=1.1, White=5.0 LnY 对LnGDP的导函数是 2 ( ) 150.86 dLnGDP LnGDP dLnY 约在1972年和2006年储蓄存款对GDP的弹性分别是 2.46 ( 2500) 150.86 2 2500 dLnGDP Ln dLnY GDP 亿 (约在1972年) 1.01 ( 200000) 150.86 2 20 dLnGDP Ln dLnY GDP 万亿 (约在2006年) 需要注意的是1972年GDP增加1%(25亿元),储蓄存款年增加额Y增加2.46%(较大), 但只相当于增加0.4亿元,而2006年GDP增加1%(2108亿元),储蓄存款年增加额Y只增加 1.01%(较小),但相当于增加205亿元。虽然2006年的弹性系数小,但增加值却大很多。 表4 分析储蓄存款年增加额Y对GDP的弹性关系 解释变量 模型11,LnYt (OLS) 模型11b,LnY (OLS+ AR) 模型12,LnY t (OLS) 模型12b,LnY (OLS+ AR) C -31.8 (-22.6) -26.4 (-6.3) 23.60 (46.5) 22.40 (20.2) LnLnGDP 16.87 (27.2) 14.6 (8.2) () () 1/LnGDP () () -163.47 (-34.3) -150.86 (-13.6) AR(1) () 0.77 (8.4) () 0.69 (6.5) R 2 0.9547 0.9882 0.9711 0.9891 DW 0.31 1.67 0.45 1.64 LM(1) (p) 21.5 (0.00) 0.66 (0.41) 17.4 (0.00) 1.1 (0.30) White (p) 3.8 (0.15) 6.2 (0.05) 3.3 (0.2) 5.0 (0.08) 1970-2006 T =36 T =36 T =37 T = 36 注:第一栏中不带括号的数字是相应变量的回归系数值,括号内数字是t值。LM(1)、DW表示1阶自相关 检验统计量。White表示异方差检验统计量。R 2表示可决系数
应用2:用组合模型进行长期预测 对含有确定性成分(如时间t,季节性虚拟变量D等)的序列采用组合模型进行长期预 测,有时预测效果更好。由于样本外预测属于动态预测,纯时间序列模型优于短期预测,长 期预测效果欠佳。由于组合模型中含有时间趋势项,以及描述周期变化的虚拟变量,所以优 于长期预测 案例3:用组合模型预测(fle:5bc3a) 北京市19781-1989:12社会商品零售额月度数据(y)曲线见图1。y与时间呈指数关 系且存在递增型异方差。对数的社会商品零售额月度数据(Lmy)曲线见图2。Lmy与时间 近似呈线性关系(异方差问题也得到抑制)。 787980818283848586878889 图1 首先拟合趋势 Method: Least Square Date:08/197Time:0044 Sample:1978M11989M12 Included observations 144 Variable oefficient Std Error t-Statistic Prob @ TRENDI1977M12)0.0077200000709108835400000 @ TREND(1977M2)23.57E05474E06753025100000 0. 974616 Mean dependent var 5.628832 Adjusted R-squared 0. 974256 S.D. dependent var 0.547692 S.E. of regression 0.087877 Akaike info criterion -2.005150 Sum squared resid 1.088848 Schwarz criterion 1943278 147 3708 F-statistic 2706851 Durbin-Watson stat 0.776039 Prob(F-statistic Residual Fitted N NW
10 应用 2:用组合模型进行长期预测。 对含有确定性成分(如时间 t,季节性虚拟变量 D 等)的序列采用组合模型进行长期预 测,有时预测效果更好。由于样本外预测属于动态预测,纯时间序列模型优于短期预测,长 期预测效果欠佳。由于组合模型中含有时间趋势项,以及描述周期变化的虚拟变量,所以优 于长期预测。 案例 3:用组合模型预测(file:5b2c3a) 北京市 1978:1~1989:12 社会商品零售额月度数据(yt)曲线见图 1。yt 与时间呈指数关 系且存在递增型异方差。对数的社会商品零售额月度数据(Lnyt)曲线见图 2。Lnyt与时间 近似呈线性关系(异方差问题也得到抑制)。 100 200 300 400 500 600 700 800 900 78 79 80 81 82 83 84 85 86 87 88 89 Y 4.4 4.8 5.2 5.6 6.0 6.4 6.8 78 79 80 81 82 83 84 85 86 87 88 89 log(y) 图 1 yt 图 2 Lnyt 首先拟合趋势。 -.2 -.1 .0 .1 .2 .3 4.5 5.0 5.5 6.0 6.5 7.0 78 79 80 81 82 83 84 85 86 87 88 89 Residual Actual Fitted -.2 -.1 .0 .1 .2 .3 4.5 5.0 5.5 6.0 6.5 7.0 78 79 80 81 82 83 84 85 86 87 88 89 Residual Actual Fitted