
第8章模型中的特殊解释变量8.1随机解释变量(一般性了解)8.2工具变量8.3滞后变量(一般性了解)(重点)8.4虚拟变量(其中分段线性回归不讲)8.5时间变量File:li-8-1File:li-8-3File:li-8-4File:li-8-5
第8章 模型中的特殊解释变量 8.1 随机解释变量(一般性了解) 8.2 工具变量 8.3 滞后变量(一般性了解) 8.4 虚拟变量(重点)(其中分段线性回归不讲) 8.5 时间变量 File:li-8-1 File:li-8-3 File:li-8-4 File:li-8-5

8.1随机解释变量(第4版教材第174页)假定条件(2)规定解释变量是非随机的且与随机误差项相互独立,即E(X'u)=0(1)如果模型中的解释变量是随机的,但具有平稳性且与误差项相互独立,模型其他假定条件都成立,的OLS估计量β仍具有无偏性Z(X, -X)u,Z(X,u,-Xu,)E(β)= β, + E= β, +E=βZ(X, -X)Z(X, -x)(2)如果模型中的解释变量X是随机的,与误差项u不独立,也不相关,模型其他假定条件都成立,β的OLS估计量具有一致性。plimβ=βT-→8(3)如果模型中的解释变量X是随机的,且与误差项u相关,Cov(X'u)¥0,模型其他假定条件都成立,的OLS估计量不具有无偏性,也不具有一致性
8.1随机解释变量 (第4版教材第174页) 假定条件⑵ 规定解释变量是非随机的且与随机误差项相互独立,即 E (X ' u ) = 0. (1)如果模型中的解释变量是随机的,但具有平稳性且与误差项相互独立, 模型其他假定条件都成立,的 OLS 估计量 ˆ 仍具有无偏性, 1 1 2 1 2 1 ( ) ( ) ( ) ( ) ) ˆ ( = − − = + − − = + X X X u Xu E X X X X u E E t t t t t t t (2)如果模型中的解释变量 X 是随机的,与误差项 u 不独立,也不相关, 模型其他假定条件都成立,的 OLS 估计量具有一致性。 = → ˆ p lim T (3)如果模型中的解释变量 X 是随机的,且与误差项 u 相关,Cov (X ' u ) 0, 模型其他假定条件都成立,的 OLS 估计量不具有无偏性,也不具有一致性

8.2工具变量法工具变量法是解决随机解释变量X与误差项u相关时,的OLS估计量不具有一致性的方法。假定有变量Z与X高度相关,但与误差项u不相关,则用Z替换X,估计回归参数β,这种估计方法称作工具变量法,Z称作工具变量。用Z替换X的公式表达是TT(--Bo-BiXi)=it=0(zt -2)(yt -y)ETi-1Bi(IV)=TZ(zt -z2)(xt - x)Z( -βo -βiX)Z,=i,Z,=0[i-1i-1β=(ZX)"ZY(第4版第177页)β的工具变量法估计量具有一致性。plimβiv=βT→80
(第4版第177页) 8.2 工具变量法 工具变量法是解决随机解释变量 X 与误差项 u 相关时,的 OLS 估计量 不具有一致性的方法。 假定有变量 Z 与 X 高度相关,但与误差项 u 不相关,则用 Z 替换 X,估 计回归参数,这种估计方法称作工具变量法,Z 称作工具变量。 用 Z 替换 X 的公式表达是 − − = = − − = = = = = = ) ˆ 0 ˆ ˆ ( ) ˆ 0 ˆ ˆ ( 1 1 0 1 1 1 0 1 T i t t t T i t t T i t T i t t Y X Z u Z Y X u 1( ) ˆ IV = − − − − ( )( ) ( )( ) z z x x z z y y t t t t ˆ = (Z'X) -1 Z'Y 的工具变量法估计量具有一致性。 = → IV T ˆ p lim

8.2 工具变量法例8.1用最终消费C1对国内生产总值Y回归。假定Y与误差项u相关,但资本总额K与误差项u不相关,用K作Y的工具变量。工具变量法的EVieWs操作:打开模型估计对话窗,选TSLS估计法。在方程设定区填入 C1 C Y在工具变量列写区填入CK,点击确定键。DependentVariable:C1Method:Two-Stage Least Squares(第4版第178页)Date:02/12/07Time:15:27Sample:19781998Includedobservations:21Instrument list:CKProb.VariableCoefficientStd. Errort-Statisticc628.25640.000094.566306.643555Y0.00000.5727000.002692212.7480R-squared0.99958214984.05Mean dependent var0.99956014470.05AdjustedR-squaredS.D. dependent varS.E. of regression303.61121751416.Sum squared residF-statistic45261.700.804629Durbin-Watson stat0.000000Prob(F-statistic)
例8.1 用最终消费C1对国内生产总值Y回归。假定Y与误差项u相关,但资 本总额K与误差项u不相关,用K作Y的工具变量。 工具变量法的EViews操作:打开模型估计对话窗,选TSLS估计法。在方 程设定区填入 C1 C Y 在工具变量列写区填入 C K, 点击确定键。 8.2 工具变量法 (第4版第178页)

8.3滞后变量(一般性了解)滞后的原因。如:消费行为的滞后,央行上调银行存款准备金率,投资、项目研发周期长,一项政策的执行有滞后。(1)分布滞后模型(权数法、阿尔蒙多项式法不讲)Yt = α + βo X, + βi Xt1 + ...+ βkXtk+ u可以用OLS法估计参数,但不具有有效性。容易引起多重共线性。最大滞后阶数由AIC、SC准则决定。(2)自回归模型(柯依克变换不讲)Y, = α+ βo X, + Yt1 + ...+ Ym Ytm+ ut可以用OLS法估计参数,为有偏、一致估计量。容易引起多重共线性。最大滞后阶数由AIC、SC准则决定。(3)自回归分布滞后模型Yt = α+ βo X,+ β, Xt-1 + ...+ βkXt-k+ i Yt-1 +...+ Ym Yt-m + ut如消费模型:Yt=α+BX,+βX-1+Y-1+ut
8.3 滞后变量(一般性了解) 滞后的原因。如:消费行为的滞后,央行上调银行存款准备金率,投资、 项目研发周期长,一项政策的执行有滞后。 (1)分布滞后模型(权数法、阿尔蒙多项式法不讲) Yt = + 0 Xt + 1 Xt-1 + .+ k Xt-k+ ut 可以用 OLS 法估计参数,但不具有有效性。容易引起多重共线性。最大滞后 阶数由 AIC、SC 准则决定。 (2)自回归模型(柯依克变换不讲) Yt = + 0 Xt + 1 Yt-1 + .+ m Yt-m+ ut 可以用 OLS 法估计参数,为有偏、一致估计量。容易引起多重共线性。最大 滞后阶数由 AIC、SC 准则决定。 (3)自回归分布滞后模型 Yt = + 0 Xt + 1 Xt-1 + .+ k Xt-k+ 1 Yt-1 + .+ m Yt-m + ut 如消费模型:Yt = + 0 Xt + 1 Xt-1 + 1 Yt-1 + ut

注意:自回归模型和自回归分布滞后模型都属于动态模型。即被解释变量滞后项作解释变量的模型。最简单的形式是一阶自回归模型Y=βY-1+ut回归系数的估计量为有偏、一致估计量。这样的模型避免用小样本估计参数以真值=0.8为例,Y=0.8Yt1+ut,用蒙特卡罗方法研究β的OLS估计量的分布。样本容量分别为T=20,50,100时,各模拟2万次结果如下:B1F3B1F1B1F2(File:dynamicmodel)6-5-T=2004-MethodSeries names3-yfForecast name:DynamicforecastT=50Staticforecast2-S.E. (optional):Structural(ignoreARMA)1-GARCH(optional):CoefuncertaintyinS.E.calcT=200--0.4-0.20.00.20.40.60.81.01.21.4对于动态模型预测时有两种方法。一种称作静态预测,一种称作动态预测。静态预测是指Y-用实际发生值(样本值)代入预测式所做的预测。动态预测是指解释变量Y除了Y用实际发生值(样本值),而对于Y2...,Yr-1.都用模型前一期的预测值代入预测式所做的预测
注意:自回归模型和自回归分布滞后模型都属于动态模型。即被解释变量滞后项作解释变量 的模型。最简单的形式是一阶自回归模型。 Yt = 1 Yt-1 + ut 回归系数1的估计量为有偏、一致估计量。这样的模型避免用小样本估计参数。 以真值1 = 0.8 为例,Yt = 0.8 Yt-1 + ut,用蒙特卡罗方法研究1的 OLS 估计量的分布。 样本容量分别为 T=20,50,100 时,各模拟 2 万次结果如下: 0 1 2 3 4 5 6 7 -0.4 -0.2 0.0 0.2 0.4 0.6 0.8 1.0 1.2 1.4 B1F1 B1F2 B1F3 T=20 T=50 T=200 对于动态模型预测时有两种方法。一种称作静态预测,一种称作动态预测。 静态预测是指 Yt-1用实际发生值(样本值)代入预测式所做的预测。 动态预测是指解释变量 Yt-1 除了 Y1用实际发生值(样本值),而对于 Y2,., YT-1,都用模型前一 期的预测值代入预测式所做的预测

模型的设定误差与变量测量误差(1)当模型中丢失重要解释变量时,回归系数估计量是有偏的、不一致的。(2)当模型中包括非重要解释变量时,主要是影响回归系数估计量的有效性:但不会影响估计量的无偏性和一致性。(3)当被解释变量、解释变量同时存在测量误差时,或者仅解释变量存在测量误差时,将导致回归系数OLS估计量丧失无偏性和一致性
模型的设定误差与变量测量误差 (1)当模型中丢失重要解释变量时,回归系数估计量是有偏的、不一致的。 (2)当模型中包括非重要解释变量时,主要是影响回归系数估计量的有效性, 但不会影响估计量的无偏性和一致性。 (3)当被解释变量、解释变量同时存在测量误差时,或者仅解释变量存在测 量误差时,将导致回归系数 OLS 估计量丧失无偏性和一致性

8.4虚拟变量(重点掌握)在实际建模过程中,被解释变量不但受定量变量影响,同时还受定性变量影响。例如需要考虑性别、民族、不同历史时期、季节差异、企业所有制性质不同等因素的影响。由于定性变量通常表示的是某种特征的有和无,所以量化方法可采用取值为1或0。这种变量称作虚拟变量(dummyvariable),用D表示。虚拟变量应用于模型中,对其回归系数的估计与检验方法和定量变量相同。(同意),【1,(某种性质存在)[1,(某个时期),D:D=D=(反对)100,(某种性质不存在)[0,(另一段时期)(第4版第187页)
(第4版第187页) 8.4 虚拟变量(重点掌握) 在实际建模过程中,被解释变量不但受定量变量影响,同时还受 定性变量影响。例如需要考虑性别、民族、不同历史时期、季节 差异、企业所有制性质不同等因素的影响。 由于定性变量通常表示的是某种特征的有和无,所以量化方法可 采用取值为 1 或 0。这种变量称作虚拟变量(dummy variable), 用 D 表示。虚拟变量应用于模型中,对其回归系数的估计与检验 方法和定量变量相同。 = ,(反对) ,(同意) 0 1 D , = ,(某种性质不存在) ,(某种性质存在) 0 1 D , = ,(另一段时期) ,(某个时期) 0 1 D

8.4虚拟变量(第4版第188页)注意:(1)当定性变量含有m个类别时,最多只能引入m-1个虚拟变量,否则当模型中存在截距项时就会产生完全多重共线性,无法估计回归参数。比如,对于季节数据引入4个虚拟变量,数据如下表,DiD2D3tD4X,000111995.1Xi0001995.21X201995.300-1X301995.40110x41X1kXu..Xij..001996.1110Xs1X21... X2j...X2k0001996.21X610010..1996.31......X7.0011101996.4XT1...XTjX8i.. XTk JTx(k+1)110001997.1Xg则必然会有,截距项对应的单位向量等于(D+Dz+D3+D4)。这意味着虚拟变量之间存在完全多重共线性
8.4 虚拟变量 (第4版第188页) 注意: (1)当定性变量含有 m 个类别时,最多只能引入 m -1 个虚拟变量,否则当模型 中存在截距项时就会产生完全多重共线性,无法估计回归参数。比如,对于季 节数据引入 4 个虚拟变量,数据如下表, t xt D1 D2 D3 D4 1995.1 1 x1 1 0 0 0 1995.2 1 x2 0 1 0 0 1995.3 1 x3 0 0 1 0 1995.4 1 x4 0 0 0 1 1996.1 1 x5 1 0 0 0 1996.2 1 x6 0 1 0 0 1996.3 1 x7 0 0 1 0 1996.4 1 x8 0 0 0 1 1997.1 1 x9 1 0 0 0 则必然会有,截距项对应的单位向量等于 (D1+ D2+ D3+ D4 ) 。这意味着虚拟变量 之间存在完全多重共线性。 ( 1) 1 2 1 2 2 1 1 1 1 1 1 1 + T k T Tj T k j k j k X X X X X X X X X

8.4 虚拟变量(第4版第188页)(2)把虚拟变量取值为0所对应的类别称作基础类别。例如,按上面对“学历”的赋值方法,“无学历”为基础类别。(3当定性变量含有m个类别时,不能把虚拟变量的值设成如下形式。0,第1个类别2第2个类别1D=m-1,第m个类别这种赋值法在一般情形下与虚拟变量赋值是完全不同的两回事。(4)回归模型可以只用虚拟变量作解释变量,也可以用定量变量和虚拟变量一起做解释变量
8.4 虚拟变量 (第4版第188页) (2)把虚拟变量取值为 0 所对应的类别称作基础类别。例如,按上面对 “学历”的赋值方法,“无学历”为基础类别。 (3)当定性变量含有 m 个类别时,不能把虚拟变量的值设成如下形式。 − = 第 个类别 第 个类别 第 个类别 m m D 1 , , 1 , 2 0 , 1 这种赋值法在一般情形下与虚拟变量赋值是完全不同的两回事。 (4)回归模型可以只用虚拟变量作解释变量,也可以用定量变量和虚拟 变量一起做解释变量