§27序列相关 含义 1、概念:序列相关( serial correlation)与自相关( autocorrelation) 通常不加区别,按时间(如在时间序列数据中)或者空间 (如在截面数据中)排列的观测值序列的成员之间的相 关 2、含义:①古典假定Cov(1,H)=0,1≠j不成立,即 Cov(A1,4)≠0 ②其余假定一应成立。 、产生的背景(机理或原因) 1、惯性多数经济界时间序列都有一个明显的特点,就是它的惯性 或者粘滞性。 2、设定偏误(遗漏相对重要的解释变量) 3、设定偏误(不正确的函数形式) 蛛网现象 5、滞后效应 6、数据的“编造”(对数据的统计处理) 序列相关的后果 1、残差方差G2=∑e2/n-k-1)很可能低估了真实的a2 2、很可能高估了R2 3、参数估计虽仍为无偏的,但却不是有效的(参数估计量的稳定性 下降,低估参数估计量的方差)
§2.7 序列相关 一、含义 1、概念:序列相关(serial correlation)与自相关(autocorrelation) 通常不加区别,按时间(如在时间序列数据中)或者空间 (如在截面数据中)排列的观测值序列的成员之间的相 关。 2、含义:○1 古典假定 Cov( i , j ) = 0 , i j 不成立,即 Cov( i , j ) 0 , i j ○2 其余假定一应成立。 二、产生的背景(机理或原因) 1、惯性 多数经济界时间序列都有一个明显的特点,就是它的惯性 或者粘滞性。 2、设定偏误(遗漏相对重要的解释变量) 3、设定偏误(不正确的函数形式) 4、蛛网现象 5、滞后效应 6、数据的“编造” (对数据的统计处理) 三、序列相关的后果 1、残差方差 ˆ ( 1) 2 2 = ei n − k − 很可能低估了真实的 2 2、很可能高估了 R2 3、参数估计虽仍为无偏的,但却不是有效的(参数估计量的稳定性 下降,低估参数估计量的方差)
4、通常的t检验和F检验都变成无效的了 四、序列相关的检验 (一)一般方法 1、图解法 、游程检验 3、冯诺曼比检验 4、高阶序列相关的布劳殊一戈弗雷( Breusch( godfrey)检验 (二)德宾一瓦特森( Durbin- Watson)检验 D.W统计量 DW(d=∑(-2) d统计量的最大优点在于它仅只依赖于残差的估计值,而后者在回 归分析中照例被计算出来了,与t值、R2值、F值等摘要统计 量一起报告,已成为统计软件的常规 2、d统计量(DW检验)使用的前提 ●回归方程含有截拒项 诸解释变量是非随机的 随机误差项是一阶自回归模式A1=pu1+v 回归模型不把滞后应变量当作解释变量 没有缺落数据 3、d统计量的取值范围 p=2一样本一阶自相关系数,作为的估计值
4、通常的 t 检验和 F 检验都变成无效的了 四、序列相关的检验 (一)一般方法 1、图解法 2、游程检验 3、冯诺曼比检验 4、高阶序列相关的布劳殊—戈弗雷(Breusch—Godfrey)检验 (二) 德宾—瓦特森(Durbin —Watson)检验 1、D.W.统计量: D.W.(d)= − − 2 2 1 ~ ) ~ ~ ( i i i e e e d 统计量的最大优点在于它仅只依赖于残差的估计值,而后者在回 归分析中照例被计算出来了,与 t 值、R2 值、F 值等摘要统计 量一起报告,已成为统计软件的常规。 2、d 统计量(D.W.检验)使用的前提 ⚫ 回归方程含有截拒项 ⚫ 诸解释变量是非随机的 ⚫ 随机误差项 t 是一阶自回归模式 t = t−1 + t ⚫ 回归模型不把滞后应变量当作解释变量 ⚫ 没有缺落数据 3、d 统计量的取值范围 ⚫ − = 2 1 ~ ~ ~ ˆ t t t e e e ——样本一阶自相关系数,作为 的估计值
●d≈2(1-p) 0≤d≤4 =0→d=2即如果没有序列相关,则可以预期d=2,因此作为 一种经验法则,如果在一项应用中求出d=2便可以认为没有 自相关。 =1,表明残差中有完全的自相关,则d=0,因此d越接近于 0,正的序列相关迹象越明显。 =-1,表明残差中有完全的负自相关,则d=4,因此d越 接近于4,幅序列相关的迹象越明显。 4、 Durbin- Watson检验的操作步骤: 1)做OLS回归并获取残差 2)计算d值 3)对给定的样本容量及解释变量数找出临界值dL和du 4)按下表的决策规则进行检验 条件 决策 0<d<d 有正的序列相关 d1≤d≤du 无结论 dusd<4--du 没有序列相关 4-du≤d≤4-du 无结论 4-d<d<4 有负的序列相关 借助下图帮助记忆
⚫ d 2(1- ˆ) ⚫ 0≤d≤4 ⚫ ˆ = 0 d = 2 即如果没有序列相关,则可以预期 d=2,因此作为 一种经验法则,如果在一项应用中求出 d=2 便可以认为没有 自相关。 ˆ =1 ,表明残差中有完全的自相关,则 d=0,因此 d 越接近于 0,正的序列相关迹象越明显。 ˆ = −1 ,表明残差中有完全的负自相关,则 d=4,因此 d 越 接近于 4,幅序列相关的迹象越明显。 4、Durbin —Watson 检验的操作步骤: 1) 做 OLS 回归并获取残差 2) 计算 d 值 3) 对给定的样本容量及解释变量数找出临界值dL和 dU 4)按下表的决策规则进行检验 条件 决策 0<d<dL 有正的序列相关 dL≤d≤dU 无结论 du<d<4-dU 没有序列相关 4-dU≤d≤4-dL 无结论 4-dL<d<4 有负的序列相关 借助下图帮助记忆:
正的无结论无序列相关无结论负的序 序列 列相关 相关 d u 4-du4-d4 一个例子假设在一个回归中用了50个观测值和4个解释变量,估 计得d=1.43。从德宾一瓦特森表査得5%水平的临界值为 dL=1.38 U 1.72 d1=138<143=d<1.72=du∴不能确定有无序列相关 补救措施 (一)自相关的结构已知 1、广义差分法 (1)假定μ遵循一阶自回归模式,即: 山=P1-1+v 其中p|<1(已知),而v满足关于随机误差项的一切古典假 定 (2)方法(以一元线性回归为例说明) 设y=B0+月1x,+1 如果上式在时刻t成立,则在时刻t-1也成立,即 B0+Bx1+{1
正的 序列 相关 无结论 无序列相关 无结论 负的序 列相关 0 dL dU 4-dU 4-dL 4 一个例子 假设在一个回归中用了 50 个观测值和 4 个解释变量,估 计得 d =1.43 。从德宾—瓦特森表查得 5%水平的临界值为 dL =1.38 dU = 1.72 dL =1.38 <1.43=d<1.72=dU 不能确定有无序列相关 一、 补救措施 (一)自相关的结构已知 1、广义差分法: (1)假定 t 遵循一阶自回归模式,即: t = t−1 + t 其中 | | <1(已知),而 t 满足关于随机误差项的一切古典假 定 (2)方法(以一元线性回归为例说明) 设 t t t y = 0 + 1 x + (a) 如果上式在时刻 t 成立,则在时刻 t-1 也成立,即 t−1 = 0 + 1 t−1 + t−1 y x
用ρ乘(a)式两端,得 Py-=PBo+pp,x+ pu-I (b (b)便得 y1-m11=B6(1-p)+B1x1-PBx1+(-p21) Bo+B,(x 于是有:y;=B+B1x+V(t=2)(c) 其中'o=B(1-p),y=y-my-1,x=x,-mx 由于ν满足全部OLS假定,故可对转换变量y·和x应用OLS 并获得BLUE 注:为减少数据损失,规定 y I=VI 2、一次差分法 (1)当p=1时广义差分方程(c)变化为一接差分方程如下: y1-y=B1(x1-x1)+(1-p11) B1(x,-x1)+v1 或 △y1=B1 (d) 其中 y=y1-y-1 △x=x-x-1 注意:一阶差分方程没有截距项,因而须用过原点回归模型来做(d) (2)当p=-1时,广义差分方程(c)将变为 y+y-1=2Bb+B1(x1+x-1)+v 或 2=B0+B1x+x+"(移动平均回归)(e) 3、p的估计方法
用 乘(a)式两端,得 t−1 = 0 + 1 t−1 + t−1 y x (b) (a)—(b)便得 t y (1 ) ( ) − t−1 = 0 − + 1 t − 1 t−1 + t − t−1 y x x = t t t 0 + 1 (x − x −1 ) + (c) 于是有: t y t = + x t + 0 1 (t=2) (c ) 其中 (1 ), 0 0 = − −1 t = t − t y y y , −1 t = t − t x x x 由于 t 满足全部 OLS 假定,故可对转换变量 Y 和 x 应用 OLS 并获得 BLUE。 注:为减少数据损失,规定 2 1 1 = 1− y y , 2 1 1 = 1− x x 2、一次差分法 (1)当 = 1 时广义差分方程(c)变化为一接差分方程如下: ( ) ( ) t − t−1 = 1 t − t−1 + t − t−1 y y x x t t t = 1 (x − x −1 ) + 或 t t t y = 1x + (d) 其中: , t = t − t−1 y y y t = t − t−1 x x x 注意:一阶差分方程没有截距项,因而须用过原点回归模型来做(d) (2)当 = −1 时,广义差分方程(c)将变为: t t t t t y + y −1 = 2 0 + 1 (x + x −1 ) + 或 2 2 2 1 0 1 t t 1 t t t y y x x + + = + + − − (移动平均回归) (e) 3、 的估计方法
(1)根据 Durbin- Watson d统计量估计ρ(大样本) d=2(1-p)→p (2 Cochrane-Orcutt迭代法 d以OLS估计模型并计算残差et 2利用残差作如下的回归 e, =petEr 利用上式所得做广义差分方程 y-mm1=B0(1-p)+B1(x1-m-1)+(1-p1-1) 或y=B0+B1x+E 以OLS估计做上述回归冰球的新的残差e 6现在估计回归 e t= pe I-1 t w 如此循环直到相继的ρ的估计值差的绝对值小于一个 事先给定的数(比如0001获0.0005)为止(一般3 到4次就可以了) (3) Cochrane-Orcutt两步法 (4) Durbin两步法先将广义差分方程(c)等价地写为 y,=Bo(I-p)+B,,x+p,+v 步骤:第一、以OIS估计(f),并把y得回归系数的估计值视为 p的一个估计值; 第二、求得后把变量转化为 y1=(,-py-D) xt=(x1-mx1-1)
(1)根据 Durbin —Watson d 统计量估计 (大样本) d = 2 ( 1- ˆ) 2 ˆ 1 d = − (2)Cochrane——Orcutt 迭代法 ○1 以 OLS 估计模型并计算残差 et ○2 利用残差作如下的回归 t t t e = e + −1 ˆ ○3 利用上式所得 ˆ 做广义差分方程 ˆ (1 ˆ) ( ˆ ) ( ˆ ) t − t−1 = 0 − + 1 t − t−1 + t − t−1 y y x x 或 y t x t t = + + 1 ˆ 0 ○4 以 OLS 估计做上述回归冰球的新的残差 e t ○5 现在估计回归 t e t = e t− + w 1 ˆ ˆ 如此循环直到相继的 的估计值差的绝对值小于一个 事先给定的数(比如 0.001 获 0.0005)为止(一般 3 到 4 次就可以了) (3)Cochrane——Orcutt 两步法 (4)Durbin 两步法先将广义差分方程(c)等价地写为: t t t t t y = 0 (1− ) + 1 x − 1 x −1 + y + (f) 步骤:第一、以 OLS 估计(f),并把 t−1 y 得回归系数的估计值视为 的一个估计值; 第二、求得 ˆ 后把变量转化为 ( ˆ ) −1 = t − t y t y y , ( ˆ ) −1 = t − t x t x x
然后如同(e)那样,对转换的变量做回归 评价:其第一步为估计p,第二步则估计回归系数 (5)其他方法 a)最大似然法 b) Hildreth-Lu扫描或搜寻法 c)可性的或估计的广义最小二乘法(EGLS) ) Thail- - Nagar小样本逼近法 例子:零工招聘指数(HWI)与失业率(U)的关系 年与季HW,1957~1959=100% U(5%) 1962-1 104.66 5.63 103.53 5.46 97.30 5.63 95.96 5.60 1963-1 9883 5.83 97.23 5.76 9906 5.56 113.66 5 1964-1 117.00 119.66 5.26 124.33 5.06 133.00 5.06 1965-1 143.33 4.83
然后如同 (c ) 那样,对转换的变量做回归 评价:其第一步为估计 ,第二步则估计回归系数 (5)其他方法 a) 最大似然法 b) Hildreth—Lu 扫描或搜寻法 c) 可性的或估计的广义最小二乘法(EGLS) e) Thail—Nagar 小样本逼近法 例子:零工招聘指数(HWI)与失业率(U)的关系 年与季 HWI,1957~1959=100% U(5%) 1962-1 104.66 5.63 -2 103.53 5.46 -3 97.30 5.63 -4 95.96 5.60 1963-1 98.83 5.83 -2 97.23 5.76 -3 99.06 5.56 -4 113.66 5.63 1964-1 117.00 5.46 -2 119.66 5.26 -3 124.33 5.06 -4 133.00 5.06 1965-1 143.33 4.83
144.66 4.73 152.33 4.46 178.33 4.20 1966-1 19200 3.83 186.00 3.90 188.00 3.86 193.33 3.70 1967-1 187.66 3.66 175.33 3.83 178.00 187.66 3.96 其中:HWI为零工招聘指数,U为失业率。 选做经验研究的回归模型为: In HW=Po+PnU+u 先验地预期B1是负的(为什么?) 假设所有的OLS假定均被满足,可的回归方程: hHW=7.3084-1.5375hU t=(65.825)(-21612)N=24 R2=0.9550 d=0.9109 对于24个观测值和一个解释变量,∝=5%,DW表给出d1=1.27, du=1.45,即 d=0.9108<1.27=d
-2 144.66 4.73 -3 152.33 4.46 -4 178.33 4.20 1966-1 192.00 3.83 -2 186.00 3.90 -3 188.00 3.86 -4 193.33 3.70 1967-1 187.66 3.66 -2 175.33 3.83 -3 178.00 3.93 -4 187.66 3.96 其中:HWI 为零工招聘指数,U 为失业率。 选做经验研究的回归模型为: HWI = + U + t ln 0 1 ln 先验地预期 1 是负的(为什么?) 假设所有的 OLS 假定均被满足,可的回归方程: t Ut HWI 7.3084 1.5375ln ˆ ln = − t =(65.825)(-21.612) N=24 R2=0.9550 d =0.9109 对于 24 个观测值和一个解释变量, = 5% ,D—W 表给出 dL=1.27, dU=1.45 ,即: d=0.9108<1.27=dL
表示有真的序列相关存在。为此先估计p 方法 值 Durbin-Watson 0.5446 Thail-Nagar 0.555 Cochrane-Orcutt步骤I 0.5471 迭代Ⅱ 0.57223 迭代Ⅲ 0.57836 迭代Ⅳ 0.57999 迭代Ⅴ 0.58040 Durbin两步法 0.79517 不妨取Thai- Nagar小样本逼近法 2(1-d/2)+k2 =0.5554 把数据变换如下 In HWTt=In HWl-0.5554In HWl-1 In=In(.-0.5554nU 且hHW1=lH1√1-0.5542,hU'1=hU√1-0.554从而 得:hHwf=3.1361-14800hU N=24 t=(35.583)(-11.045)R2=0.9684,d=1.83 d=1.83 du=145<1.83=d<2.55=4-du 表明已经没有一阶自回归形式的序列相关
表示有真的序列相关存在。为此先估计 方法 值 Durbin—Watson 0.5446 Thail—Nagar 0.5554 Cochrane—Orcutt 步骤 I 0.5471 迭代Ⅱ 0.57223 迭代Ⅲ 0.57836 迭代Ⅳ 0.57999 迭代Ⅴ 0.58040 Durbin 两步法 0.79517 不妨取 Thail—Nagar 小样本逼近法 2 2 2 2 (1 2) ˆ n k n d k − − + = =0.5554 把数据变换如下: 1 ln ln 0.5554ln − = t − t HWI t HWI HWI 1 ln ln 0.5554ln − = t − t U t U U 且 2 1 ln 1 = ln 1− 0.5554 HWI HWI , 2 1 ln 1 = ln 1− 0.5554 U U 从而 得: HWI t U t = 3.1361−1.4800ln ˆ ln N=24 t =(35.583) (-11.045) R2=0.9684 ,d=1.83 d=1.83 dU=1.45<1.83=d<2.55=4-dU 表明已经没有一阶自回归形式的序列相关
§28 多重共线性 多重共线性的性质 (一)概念及性质 1、概念:多重共线性( multicolinearity)一词由弗里希( Frisch) 引入,其原意为一个线性模型中的一些或全部解释变量之间存在一种 “完全”或准确的线性关系。而在计量经济学中系指解释变量之间的 完全和欠完全的线性关系。 为说明该定义,设计如下的数据 10 50 52 15 75 75 18 120 129 30 150 152 很明显,x21=3x1,即x与x2之间有完全的线性关系并且相关系数为1 变量x3不外是把随机数表的读数2,0,7,9,2加到x2上产生的,它 们之间不具有完全的线性关系,但确是高度相关的(相关系数为 0.9959) 2、性质:解释变量的样本之之间所表现出来的数据之间的相互依 存关系的线性关系 导致多重共线性的原因 1、数据采集所用的方法
§2.8 多重共线性 一、多重共线性的性质 (一)概念及性质 1、概念: 多重共线性(multicolinearity)一词由弗里希(Frisch) 引入,其原意为一个线性模型中的一些或全部解释变量之间存在一种 “完全”或准确的线性关系。而在计量经济学中系指解释变量之间的 完全和欠完全的线性关系。 为说明该定义,设计如下的数据: 1 x 2 x 3 x 10 50 52 15 75 75 18 90 97 24 120 129 30 150 152 很明显, i i x x 2 = 3 1 ,即 1 x 与 2 x 之间有完全的线性关系并且相关系数为 1; 变量 3 x 不外是把随机数表的读数 2,0,7,9,2 加到 2 x 上产生的,它 们之间不具有完全的线性关系,但确是高度相关的(相关系数为 0.9959)。 2、性质:解释变量的样本之之间所表现出来的数据之间的相互依 存关系的线性关系。 二、导致多重共线性的原因 1、 数据采集所用的方法