第八章单方程模型的几个问题 第一节模型的设定误差 在建立经济计量模型时,要设定模型的函数形式、模型中的解释变量、 随机项的构成及假定等,并希望设定的模型尽可能反映现实经济问题。如 果模型设定不当,可能引起设定误差。设定误差主要包括两种情况:遗漏 了必要的解释变量;包含了无关的解释变量 、遗漏了必要的解释变量 本来模型中应含有k-1个解释变量,如模型应为: Y=B+B2X2i+B3x3i+.+B Xk+u 但是在建模时,由于数据不易获得或其它原因,使模型中遗漏了一些变量, 如遗漏变量后的模型为: X=B1+B2X2+B3X3+…+BXm+v,i=1,2 rr< 此时,遗漏变量后的模型的随机误差项实际为 v;=B r+1(r+1)i +…+BkX+l12i=1,2,…k 这将对估计结果产生影响。为了分析这种影响,以“正确模型”包括两个 解释变量为例,把回归模型改写为离差形式进行分析: PRFy=B2x21+B3x3+l4和遗漏变量模型PRFy=B2x2+
第八章 单方程模型的几个问题 第一节 模型的设定误差 在建立经济计量模型时,要设定模型的函数形式、模型中的解释变量、 随机项的构成及假定等,并希望设定的模型尽可能反映现实经济问题。如 果模型设定不当,可能引起设定误差。设定误差主要包括两种情况:遗漏 了必要的解释变量;包含了无关的解释变量。 一、遗漏了必要的解释变量 本来模型中应含有k-1个解释变量,如模型应为: Yi = 1 + 2 X2i + 3 X3i ++ k Xki + ui 但是在建模时,由于数据不易获得或其它原因,使模型中遗漏了一些变量, 如遗漏变量后的模型为: , 1,2, , ( ) 1 2 2 3 3 Y X X X v i r r k i = + i + i ++ r r i + i = 此时,遗漏变量后的模型的随机误差项实际为: v X X u i k i r r i k ki i , 1,2, , = +1 ( +1) ++ + = 这将对估计结果产生影响。为了分析这种影响,以“正确模型”包括两个 解释变量为例,把回归模型改写为离差形式进行分析: i i i ui PRF y = 2 x2 + 3 x3 + i i i PRF y = x + v 2 2 ' 和遗漏变量模型
对PRF的估计值为: Xi 把PRF中的y带入,可得到: xx t> x u E(B2)=E( x21(B2x2+B3x3+l )=E 42「32213 ∑ 2 e(B,+B )=B2+B3 B2+B3 这说明遗漏变量模型的估计量是真实模型的有偏估计量,且偏误不随 样本容量的增大而消失。只有当遗漏变量与解释变量的相关系数为零时 偏误才会消失 而根据方差的估计公式,方差为 ∑ ∑ 2 ar( n-2 ∑x2(1 这说明方差的估计也是有偏误的。因此,据此作出的统计推断也是不 可信的
把PRF中的yi带入,可得到: == 2 2 ' i i i x x y 对PRF`的估计值为: 2 3 2 3 2 3 2 2 2 3 2 2 3 2 2 2 2 2 2 3 3 2 2 3 2 2 3 2 2 3 2 ( ) ) ( ) ( ) ( ' ) ( r x x x x x u x x x E x x x x x u E x x x x u E E i i i i i i i i i i i i i i i i i i i i = + = + + = + + + = + + = (1 ) ˆ ) ˆ ( ˆ ' ) ˆ ( 3 ˆ ˆ 2 ˆ ˆ 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 x r Var x Var n u n v i u i i v u i v − = = − = − = , , , 而根据方差的估计公式,方差为 这说明遗漏变量模型的估计量是真实模型的有偏估计量,且偏误不随 样本容量的增大而消失。只有当遗漏变量与解释变量的相关系数为零时, 偏误才会消失。 这说明方差的估计也是有偏误的。因此,据此作出的统计推断也是不 可信的
包含了不必要的解释变量。 假定真实模型为 Y=P,+B2X2i+B3 +BAk+ 但是在建模时,模型中增加了不必要的变量,如遗漏变量后的模型为 Y=B+B2X2i+B3x3i+.+BkXk+Bk 以双解释变量的模型为例,假定 PRFy=B2x2+v2和包含无需变量模型PRFy=B2x21+Bx3+ SRF中的参数OS估计量为: ∑x2y)∑x2)-C∑x2,yC∑x2x3) 2 ∑x2,)∑x2)-(∑ Xa. 带入SRF,可得到 B2=B2+ ∑x2,)∑ C∑x2,x3,)∑x211) ∑x2,)∑x2)-(∑xx3 E(B'2)=B2 Var(,) ⑧X22x,=xa Var(,)
二、包含了不必要的解释变量。 假定真实模型为: Yi = 1 + 2 X2i + 3 X3i ++ k Xki + ui 但是在建模时,模型中增加了不必要的变量,如遗漏变量后的模型为: i i i k ki k k i i Y = + X + X + + X + X + v 1 2 2 3 3 +1 ( +1) 以双解释变量的模型为例,假定 i i i i PRF y = x + x + u 2 2 3 3 ' i i i PRF y = x + v 2 2 和包含无需变量模型 SRF`中的参数OLS估计量为: = − = − = = − − = + − − = 2 2 2 2 2 3 2 2 2 2 3 2 2 2 3 2 2 2 2 2 2 3 2 2 2 2 3 2 2 2 2 2 2 3 2 2 2 2 3 2 2 2 2 2 3 2 2 3 2 2 3 2 ) ˆ ( ( )( ) ( ) (1 ) ' ) ˆ ( ( ' ) ( )( ) ( ) ( )( ) ( )( ) ' ( )( ) ( ) ( )( ) ( )( ) ' i i i i i i i i i i x Var x x x x x r x x Var E x x x x x x u x x x u SRF x x x x x y x x y x x u v i i i i v i i i i i i i i i i i i i i i i 带入 ,可得到
通过比较,可看出 (1)含不需要解释变量模型的估计是无偏的,但不具备最小方差性: Var(.) Var( 23 (2)样本方差σ的估计是正确的;假设检验程序仍然有效。 (3)含不需要解释变量模型的估计参数的方差增大,精度减少。 三、设定误差的检验 1、检验是否存在无需变量 根据回归参数的t检验值,对参数进行显著性检验。不显著的解释变量 可以从模型中删除 2、对遗漏变量和不正确函数形式的检验 各种检验指标(如判定系数)和残差分析
通过比较,可看出: (1)含不需要解释变量模型的估计是无偏的,但不具备最小方差性: 1 (1 ) 1 ) ˆ ( ) ˆ ( 2 23 ' 2 = − = Var r Var (2)样本方差σ的估计是正确的;假设检验程序仍然有效。 (3)含不需要解释变量模型的估计参数的方差增大,精度减少。 三、设定误差的检验 1、检验是否存在无需变量 根据回归参数的t检验值,对参数进行显著性检验。不显著的解释变量 可以从模型中删除。 2、对遗漏变量和不正确函数形式的检验 各种检验指标(如判定系数)和残差分析
第二节虚拟变量估计 、虚拟变量的引入 在经济分析中,某些特殊因素会影响到变量的取值,如季节对饮料需 求的影响,特定时期实施特殊政策对各宏观经济变量产生的影响等。而这 些因素属于“定性”的变量,可以通过赋予一个数量值,以虚拟变量(哑 变量 Dummy)的形式进入分析模型中 例如,消费函数模型: Ctbo+bTu Cbo+bY+b2D+u 、虚拟变量的不同形式 虚拟变量在模型中可代表对截距的影响,如: C=b+b1Y1+b2D2+u1(D在正常年份取1,反常年份取0) 可利用OLS估计得到估计结果 正常年份 b+b,y+bD 反常年份 在正常年份:C=(b+b2)+b1Y 在反常年份:C=b+b1Y 根据回归结果,正常年份的基本支出水平比 反常年份小,而边际支出倾向不变。 0
第二节 虚拟变量估计 一、虚拟变量的引入 在经济分析中,某些特殊因素会影响到变量的取值,如季节对饮料需 求的影响,特定时期实施特殊政策对各宏观经济变量产生的影响等。而这 些因素属于“定性”的变量,可以通过赋予一个数量值,以虚拟变量(哑 变量Dummy)的形式进入分析模型中。 例如,消费函数模型: Ct=b0+b1Yt+ut ====〉 Ct=b0+b1Yt+b2Dt+ut 二、虚拟变量的不同形式 虚拟变量在模型中可代表对截距的影响,如: Ct=b0+b1Yt +b2Dt +ut (Dt在正常年份取1,反常年份取0) 可利用OLS估计得到估计结果: t t t t t t t C b bY C b b bY C b bY b D 0 1 0 2 1 0 1 2 ˆ ˆ ˆ ˆ ) ˆ ˆ ( ˆ ˆ ˆ ˆ ˆ = + = + + = + + 在反常年份: 在正常年份: Ct 0 Yt 正常年份 反常年份 根据回归结果,正常年份的基本支出水平比 反常年份小,而边际支出倾向不变
虚拟变量在模型中也可以代表对和参数的全面影响,如: C(boI+ bo2D,)+(bu+ budY+u, 正常年份 该式可变为:C=bo1+ba2D1+b1DY1+b2D1Y2+u1C 如果得到估计方程: 反常年份 +bo2D+6 + budY 在正常年份:C,=(b1+b2)+(b1+B2) 在反常年份: bo1+buY 二、多个虚拟变量的引入及虚拟变量陷阱问题 Yt 在模型中,对于一个定性变量可能需要引入多个虚拟变量。典型的例 子是季节变化对商品销售的影响 假定销售方程为: CI=bo+6,X+b,x2+.+bkXk+ 由于季节变化对销售有重要影响,引入四个虚拟变量: i0其它季节 i=1.2.34 销售的季节模型可写为 CL=b+bxI t.+b,xk+aD+a2 D2+ D3,+a4D4,+u
虚拟变量在模型中也可以代表对和参数的全面影响,如: Ct=(b01+ b02Dt) + (b11 + b12Dt )Yt+ut 该式可变为: Ct=b01+ b02Dt + b11DtYt + b12DtYt+ut 如果得到估计方程: t t k kt t t t t t i i t t t t k kt t C b b X b X a D a D a D a D u D i C b b X b X b X u = + + + + + + + + = = = + + + + + 0 1 1 1 1 2 2 3 3 4 4 1 0 0 1 1 2 2 ˆ 1,2,3,4 ˆ : 销售的季节模型可写为 由于季节变化对销售有重要影响,引入四个虚拟变量: 假定销售方程为 第 季 其它季节 Ct 0 Yt 正常年份 反常年份 二、多个虚拟变量的引入及虚拟变量陷阱问题 在模型中,对于一个定性变量可能需要引入多个虚拟变量。典型的例 子是季节变化对商品销售的影响。 t t t t t t t t t C b b Y C b b b b Y C b b D b Y b DY 0 1 1 1 0 1 0 2 1 1 1 2 0 1 0 2 1 1 1 2 ˆ ˆ ˆ ) ˆ ˆ ) ( ˆ ˆ ( ˆ ˆ ˆ ˆ ˆ ˆ = + = + + + = + + + 在反常年份: 在正常年份:
在该季节模型: +6 +b,X tad tad.tadtad tu 中,有 D+D=ID=I-D-D-D 即解释变量间存在完全的共线性,因此模型无法估计。这就是虚拟变量陷阱。 为了解决这以问题,在引入虚拟变量时,对于一个有m种可能的定性变 量,只能引入m-1个虚拟变量。如前面的模型 销售方程为 C=bo+6,X1+b2x2+.+b,xk+u, 引入四个虚拟变量 第漆季 i0其它季节 i=2,3,4 销售的季节模型为 C1=b+bA1n+…+bk+a2D2+a3D3+a4D41+l1 该方程即可进行估计
1 2 3 4 1 1 2 3 4 D + D + D + D =1,D = − D − D − D Ct = b0 + b1 X1t ++ bk Xkt + a1 D1t + a2 D2t + a3 D3t + a4 D4t + ut 在该季节模型: 中,有 即解释变量间存在完全的共线性,因此模型无法估计。这就是虚拟变量陷阱。 为了解决这以问题,在引入虚拟变量时,对于一个有m种可能的定性变 量,只能引入m-1个虚拟变量。如前面的模型: 该方程即可进行估计。 销售的季节模型为 引入四个虚拟变量: 销售方程为 第 季 其它季节 t t k kt t t t t i i t t t t k kt t C b b X b X a D a D a D u D i C b b X b X b X u = + + + + + + + = = = + + + + + 0 1 1 2 2 3 3 4 4 1 0 0 1 1 2 2 ˆ 2,3,4 ˆ :
三、引入不同定性变量的多个虚拟变量 在模型中,如果有多个定性变量对因变量有影响,可同时把对应于各 定性变量的虚拟变量引入模型。如,季节变化和当年是否有重大事件发生 对商品的销售都有影响,销售回归方程可写为: Ct=bo+6,XI+.+bXk+C2+a2 D2+a3 D3i+a4D4+ur 其中,Q(取1获0)代表正常年份和反常年份,而D2~D4代表季节变化。 使用的原则,仍是对于任一个有m种可能的定性变量,只能引入m-1个 对应的虚拟变量。 第三节滞后变量 滞后变量 滞后变量是指在回归模型中,因变量与解释变量的时间滞后量。如 =a+b0X1+b1X1+…+b 和Y a0+boY,+bY ∴+LL 第一个模型称作外生滞后变量模型或分布滞后模型。第二个模型称为 内生滞后变量模型或自回归模型。 在很多经济分析中,把滞后变量引入模型中是必要的。这里先讨论分 布滞后模型
三、引入不同定性变量的多个虚拟变量 在模型中,如果有多个定性变量对因变量有影响,可同时把对应于各 定性变量的虚拟变量引入模型。如,季节变化和当年是否有重大事件发生 对商品的销售都有影响,销售回归方程可写为: t t k kt Qt a D t a D t a D t ut C = b0 + b1 X1 ++ b X + c1 + 2 2 + 3 3 + 4 4 + 其中,Qt (取1获0)代表正常年份和反常年份,而D2~D4代表季节变化。 使用的原则,仍是对于任一个有m种可能的定性变量,只能引入m-1个 对应的虚拟变量。 第三节 滞后变量 一、滞后变量 滞后变量是指在回归模型中,因变量与解释变量的时间滞后量。如: t t t t t t t s t s t Y a b Y bY u Y a b X b X b X u = + + + + = + + + + + − − − 0 0 1 1 0 0 1 1 和 第一个模型称作外生滞后变量模型或分布滞后模型。第二个模型称为 内生滞后变量模型或自回归模型。 在很多经济分析中,把滞后变量引入模型中是必要的。这里先讨论分 布滞后模型
分布滞后模型:Y=a+bX+bX1+b2X1-2+…+b,X1s+l1 包含了多时期的滞后变量,各时期的滞后变量之间往往存在多重共线性,因 此不能用OLS估计。此外,如果滞后变量较多而样本较小,不仅估计困难, 而且较小的自由度下也难以进行传统的拟和优度检验 基于以上原因,必须对模型进行变换,以减少被估计参数的数目。可以 考虑对滞后变量加以约束,把这些滞后变量组合成新的变量,方法有经验权 数法,阿尔蒙多项式法等 、经验权数法 根据经验为滞后变量制定权数,把滞后变量按权数线性组合成新变量。 1、递减滞后形式 假定解释变量的滞后期越长,对因变量的影响越小,滞后变量期数越大 则指定的权数越小。如,对于模型 X=a0+bX1+b1X1-1+b2X12+b3x1=3+b4X1-4+l1 指定递减权数: 则令新变量 246816 W==X1+X1-1+X1-2+X13+,X1 2 4 模型变为:Y=a+aW+2,可用OLS估计模型
分布滞后模型: 包含了多时期的滞后变量,各时期的滞后变量之间往往存在多重共线性,因 此不能用OLS估计。此外,如果滞后变量较多而样本较小,不仅估计困难, 而且较小的自由度下也难以进行传统的拟和优度检验。 基于以上原因,必须对模型进行变换,以减少被估计参数的数目。可以 考虑对滞后变量加以约束,把这些滞后变量组合成新的变量,方法有经验权 数法,阿尔蒙多项式法等。 二、经验权数法 根据经验为滞后变量制定权数,把滞后变量按权数线性组合成新变量。 1、递减滞后形式 假定解释变量的滞后期越长,对因变量的影响越小,滞后变量期数越大 则指定的权数越小。如,对于模型: 模型变为: 可用 估计模型。 指定递减权数:,,,, ,则令新变量 , OLS 16 1 8 1 6 1 4 1 2 1 16 1 8 1 6 1 4 1 2 1 0 1 1 2 3 4 0 0 1 1 2 2 3 3 4 4 t t t t t t t t t t t t t t t t Y a aW u W X X X X X Y a b X b X b X b X b X u = + + = + + + + = + + + + + + − − − − − − − − Yt = a0 + b0 Xt + b1 Xt−1 + b2 Xt−2 ++ bs Xt−s + ut
2、矩形滞后形式 假定所有滞后变量对因变量的影响相同,滞后变量的权数相等, 如,前面的模型中,新变量定义为: W=-X+-X +-X+X,+-X t-3 3、倒“V型滞后形式 假定所有滞后变量对因变量的影响岁滞后时间,先递增,再递减,滞 后变量的权数大小成倒“V型变化,如,前面的模型中,新变量定义为: W=,X1+X1+元X12+1-3+,X1=4 6 对经验权数模型进行回归后,根据显著性检验、标准差、样本决定系 数及DW检验等,选择最优的形式。 三、阿尔蒙多项式法 根据一个连续函数为滞后变量制定权数。对于模型: X=a+bX1+b1-1+b2H1=2+…+bX1s+l
三、阿尔蒙多项式法 根据一个连续函数为滞后变量制定权数。对于模型: 2、矩形滞后形式 假定所有滞后变量对因变量的影响相同,滞后变量的权数相等, 如,前面的模型中,新变量定义为: 1 2 3 4。 3 1 3 1 3 1 3 1 3 1 Wt = Xt + Xt − + Xt − + Xt − + Xt − 3、倒“V”型滞后形式 假定所有滞后变量对因变量的影响岁滞后时间,先递增,再递减,滞 后变量的权数大小成倒“V”型变化,如,前面的模型中,新变量定义为: 1 2 3 4。 12 1 7 1 4 1 6 1 10 1 Wt = Xt + Xt − + Xt − + Xt − + Xt − 对经验权数模型进行回归后,根据显著性检验、标准差、样本决定系 数及D-W检验等,选择最优的形式。 Yt = a + b0 Xt + b1 Xt−1 + b2 Xt−2 ++ bs Xt−s + ut