第四章非线性模型 因变量和解释变量之间的线性关系,包括参数线性和解释变量线性两 种。前面的分析假定总体回归函数的形式为 PRF X=B1+B2X2+B3k3+…+BkXk+l12i=1,2,…k 但是根据经济现实或经济理论,变量之间不一定存在这种形式的线性关系 如参数线性形式的回归函数: , =B,+B,+ 或参数、变量均为非线性形式的函数关系,如C-D生产函数: Y=ALPIKP2e 对于这些不符合线性假定的模型进行参数估计,必须加以适当的变换 以后,才能用OLS方法估计模型参数
第四章 非线性模型 PRF Y X X X u i k i i i k ki i : , 1,2, , = 1 + 2 2 + 3 3 ++ + = 因变量和解释变量之间的线性关系,包括参数线性和解释变量线性两 种。前面的分析假定总体回归函数的形式为: 但是根据经济现实或经济理论,变量之间不一定存在这种形式的线性关系。 如参数线性形式的回归函数: i i i u X Y = + + 1 1 2 或参数、变量均为非线性形式的函数关系,如C-D生产函数: u Y AL K e 1 2 = 对于这些不符合线性假定的模型进行参数估计,必须加以适当的变换 以后,才能用OLS方法估计模型参数
对于参数线性的模型,可以采用变量的直接代换,转化为参数、变量 均为线性的形式进行估计。 、倒数模型: 函数形式为: B,+B2+u X 令变昌y*_1 ,则回归函数可变为: B+B2X+u 根据解释变量的观测值,计算出X*的之后进行OLS估计,得到 B+B2X 因此可得到原模型的估计方程: Y =B,+B
对于参数线性的模型,可以采用变量的直接代换,转化为参数、变量 均为线性的形式进行估计。 一、倒数模型: 函数形式为: i i i u X Y = + + 1 1 2 令变量 ,则回归函数可变为: i i X X * 1 = Yi X ui i = + + * 1 2 根据解释变量的观测值,计算出X*i 的之后进行OLS估计,得到: * 1 2 ˆ ˆ i Yi = + X 因此可得到原模型的估计方程: i i X Y 1 ˆ ˆ = 1 + 2
对数线性模型 通过对原模型的对数变换,函数形式可变为: In Y=I+B2In X2i+B2In x3i+u 令变量Y=h2X=hXk,则回归函数可变为 Y=B,+B,X+B,x+ 根据解释变量的观测值,进行OLS估计,得到 r=B,+B2x +B,x 因此可得到原模型的估计方程 In Y=B+B2In x2itb2n X3 例如,估计CD函数:Y=ADKe,两边取对数后: In K=hn A+B2In L +Bhn K+u 得到原模型的估计方程:hY=B1+B2nL+B2hK1 因此,CD函数的估计形式为:Y=eBL2K
二、对数线性模型: 通过对原模型的对数变换,函数形式可变为: Yi = 1 + 2 X2i + 2 X3i +ui ln ln ln 令变量 Y i ln Yi , X ki ln Xki ,则回归函数可变为: * * = = Y X X ui i i i = + + + * 2 * 1 2 * 2 3 根据解释变量的观测值,进行OLS估计,得到: 因此可得到原模型的估计方程: * 2 * 1 2 * 2 3 ˆ ˆ ˆ ˆ ˆ i i i Y = + X + X Yi 1 2 X2i 2 X3i ln ˆ ln ˆ ˆ ˆ ln = + + 例如,估计C-D 函数: u Y AL K e 1 2 = ,两边取对数后: Ki = A+ Li + Ki +ui ln ln 2 ln 2 ln 得到原模型的估计方程: Y Li Ki ln ˆ ln ˆ ˆ ˆ ln = 1 + 2 + 2 因此,C-D 函数的估计形式为: 1 2 3 ˆ ˆ ˆ ˆ Y = e L K
半对数线性模型: 模型的函数形式可变为: B+B2X+u 或Y=B1+B2lhX1+ Y=B,+B2X+u E y=B,+B2x+u 根据解释变量的观测值,进行OLS估计,得到 B+B2X1或Y=B1+B2X 因此可得到原模型的估计方程 B1+B,X 或Y=B1+B2hH 、多项式模型 模型的函数为: Bo+BX+B, +BkX+l1,i=1,2,…k 令变量X=Xk,同样可以进行参数的OLS估计
二、半对数线性模型: 模型的函数形式可变为: i i i i i i Y X u Y X u = + + = + + ln ln 1 2 1 2 或 令变量 ,同样可以进行参数的OLS估计。 k Xki = Xki * Y Xi ui Yi Xi ui i = + + = + + * 1 2 1 2 * 或 根据解释变量的观测值,进行OLS估计,得到: 因此可得到原模型的估计方程: * 1 2 1 2 ˆ * ˆ ˆ ˆ ˆ ˆ i i i Y = + Xi 或 Y = + X i i X Yi e Y X i ln ˆ ˆ ˆ ˆ 1 2 ˆ ˆ 1 2 = = + + 或 三、多项式模型: 模型的函数为: Y X X X u i k i k i i k i ki , 1,2, , 2 = 0 + 1 1 + 2 2 ++ + =
第五章多重共线性 第一节违背古典假定的估计问题 我们关于经典线性回归模型(CLRM)有如下假定: 假定1:回归模型对参数是线性的 假定2:在重复抽样中X的值是固定的(非随机) 假定3:干扰项的均值为零。即,E(uX)=0 假定4:同方差性或u的方差相等。即 Var(u, X)=ELu-E(u)X12=E(u xi12=02 假定5:各个干扰项无自相关。即 Cov(u, u X Xi=Elu E(uiX( Xi]=EquilXqui Xi =0 假定6:u和X的协方差为零。即 Covlui X =elui-EquillXi-E(XD]=Elui (X-E(XD) equ, X, -e(u e(X =equi Xi=0 假定7:观测次数必须大于待估计的参数个数 假定8:解释变量X的只要有变异性。即一个样本中,Ⅹ不能完全相同 假定9:模型没有设定误差。 假定10:没有完全的多重共线性,即解释变量之间没有完全的线性关系 在现实中,以上假定不一定得到满足。本章讨论某些假定不成立时的估 计问题
我们关于经典线性回归模型(CLRM)有如下假定: 假定1:回归模型对参数是线性的 假定2:在重复抽样中X的值是固定的(非随机) 假定3:干扰项的均值为零。即,E(ui |Xi )=0 假定4:同方差性或ui的方差相等。即 Var(ui |Xi )=E[ui -E(ui )|Xi ] 2 = E(ui 2 |Xi ] 2 = 2 假定5:各个干扰项无自相关。即 Cov(ui ,uj |Xi ,Xj )=E[ui -E(ui |Xi ) ][uj -E(uj |Xj )] = E(ui |Xi )(uj |Xj ) = 0 假定6:ui和Xi的协方差为零。即 Cov(ui ,Xi ) = E[ui – E(ui )][Xi – E(Xi )] = E[ui (Xi – E(Xi ))] =E(ui Xi ) – E(ui )E(Xi) = E(ui Xi ) = 0 假定7:观测次数必须大于待估计的参数个数。 假定8:解释变量X的只要有变异性。即一个样本中,Xi不能完全相同。 假定9:模型没有设定误差。 假定10:没有完全的多重共线性,即解释变量之间没有完全的线性关系。 在现实中,以上假定不一定得到满足。本章讨论某些假定不成立时的估 计问题。 第五章 多重共线性 第一节 违背古典假定的估计问题
第二节多重共线性( multi-collinearity) 如果假定10不成立,即在解释变量X1,X2,…,Ⅹ中,存在线性关系 解释变量间的确定线系关系存在时,存在不全为零的常数λ1,2,…孔,使 入1X1+22X2 设1<>0,则 X1=X+3X3+ 这种关系为完全多重共线性,变量间的相关系数为1。实际上更多的情 况是,解释变量间有不完全的线性关系:存在不全为零的数:,2…,使 A1X1+入2X21+…AkX+v1=0 假定λ1>0 X,;+3X2+ 入1 了 其中ⅴ为随机项。我们把这种解释变量间存在的完全或不完全的线性关系 称为多重共线性。由于经济变量自身的性质,它们之间这种多重共线性或 强或弱,普遍存在的
第二节 多重共线性(multi-collinearity) 如果假定10不成立,即在解释变量X1,X2,…,Xk中,存在线性关系。 解释变量间的确定线系关系存在时,存在不全为零的常数 1 X1i + 2 X2i +k Xki = 0 1 ,2 , k,使 ki k X i X i X i X 1 3 1 3 2 1 2 1 1 0, = + + 设 则 这种关系为完全多重共线性,变量间的相关系数为1。实际上更多的情 况是,解释变量间有不完全的线性关系:存在不全为零的数: 1 X1i + 2 X2i +k Xki + vi = 0 1 ,2 , k,使 其中vi 为随机项。我们把这种解释变量间存在的完全或不完全的线性关系 称为多重共线性。由于经济变量自身的性质,它们之间这种多重共线性或 强或弱,普遍存在的。 1 1 3 1 3 2 1 2 1 i ki k i i i v X = X + X + X + 假定λ1<>0
第三节多重共线性的影响 完全多重共线性 以两个解释变量的回归模型为例,假定回归模型为: 1+B2X2+B3X3+ 如果采用OLS估计,则有: B1=Y-B2X2-B33 mIn ∑2=2(y-A-B2X2-BX3)2 ∑(y-/2x2-B3x3)2 根据最小平方和原则,并求解正规方程组,可得到 ∑yx2)∑x2,)-∑yx3)∑ Xiii x2,)(>x2) 2i-3i ∑x2)∑x2)-(∑nx2)∑ B 2t+3t ∑x2,)∑x2)-C∑x2x3)2
第三节 多重共线性的影响 一、完全多重共线性 以两个解释变量的回归模型为例,假定回归模型为: Yi = 1 + 2 X2 + 3 X3 +ui 如果采用OLS估计,则有: 2 2 2 3 3 2 1 2 2 3 3 2 1 2 2 3 3 ) ˆ ˆ ( ) ˆ ˆ ˆ min ˆ ( ˆ ˆ ˆ y x x u Y X X Y X X i i i = − − = − − − = − − 根据最小平方和原则,并求解正规方程组,可得到: 2 2 3 2 2 3 2 3 2 2 2 ( )( ) ( ) ( )( ) ( )( ) ˆ 2 3 3 − − = i i i i i i i i x x x x y x x y x x x i i i 2 2 3 2 2 2 2 3 2 2 3 ( )( ) ( ) ( )( ) ( )( ) ˆ 2 3 2 − − = i i i i i i i i x x x x y x x y x x x i i i
如果Ⅹ2与X3存在完全共线性,即x2=Ax3则: ∑yx21)∑x2)-(∑yx)∑x2x3;) ∑x 2 D.X 2 3 (∑yx3)∑x2)-C∑yx3)(∑x2) (花2∑ DI )∑x2)-(∑x2) 0 此时,B2是不确定的。同样也是不确定的。而方差 Var(B,) ∑ ∑x∑x2-∑x2x3 在x2=x时,Var(B2) 因此,存在完全共线性时,不能利用OLS估计参数,参数的方差变为无 限大
0 0 ( )( ) ( ) ( )( ) ( )( ) ( )( ) ( ) ( )( ) ( )( ) ˆ 2 2 3 2 2 2 2 3 2 3 2 2 3 2 2 3 2 3 2 2 2 3 3 3 3 2 3 3 = − − = − − = i i i i i i i i i i i i i x x x y x x y x x x x x x y x x y x x x i i i i i i i 如果X2与X3存在完全共线性,即 x2 = x3 则: 因此,存在完全共线性时,不能利用OLS估计参数,参数的方差变为无 限大。 = − = = − = 2 2 2 2 2 3 2 2 3 2 2 3 2 2 2 3 2 3 2 2 2 2 2 2 3 3 ) ˆ ( ) ˆ ( ˆ ˆ ( ) ( ) 在 时, ( ) 此时, 是不确定的。同样 也是不确定的。而方差 i x x x x x Var x x x x x Var i i i i i i i
二、不完全多重共线性 假定Ⅹ2,Ⅹ3间存在不完全多重共线性,以离差形式表示为x2=Ax3+ 其中v;为随机项。则 B_2y,331 +v 1(-*3 )2(x3 +v )x, 1 x2:+v x2;+1.)x 式中分母可化简为∑x2)∑v2)<0 此时,B2是可估计的的。同样β3也是可估计的。而方 Var(B,) ∑ 2 3i 2i 2i-3i ∑ ∑ 2i-3i (∑x2∑x2,) ∑x{1-n23)
二、不完全多重共线性 假定X2,X3 间存在不完全多重共线性,以离差形式表示为: 。 其中vi 为随机项。则 i x = x + v 2 3 式中分母可化简为( )( ) 0。 [ ( ) ]( ) [ ( ) ] [ ( )]( ) ( )[ ( ) ] ˆ 2 2 2 3 3 2 2 3 3 3 3 2 3 2 3 3 3 + − + + − + = i i i i i i i i i i i i i i x v x v x x v x y x v x y x x v x i i i − = − = − = − = {1 ) [1 /( )] / ) ˆ ( ˆ ˆ 2 3 2 3 2 2 2 2 2 2 3 2 3 2 2 2 2 3 2 3 2 2 3 2 3 2 2 2 2 2 2 3 x r x x x x x x x x x x x x x x Var i i i i i i i i i i i i i i i ( ) ( ) ( ) 此时, 是可估计的的。同样 也是可估计的。而方差
F(B2)= 23 显然,当解释变量X2、ⅹ3之间的相关系数r23的绝对值越大,共线性程 度就越高,参数估计值的方差就越大,越不准确,且随着相关系数的增大, 方差以更大的幅度增加。 多重共线性的影响 (1)参数估计值的方差增大,估计量的精度大大降低。影响预测结果(准 确度和置信区间) (2)参数估计值的标准差增大,使的t检验值变小,增大了接受H,舍弃 对因变量有显著影响的变量。 (3)尽管t检验不显著,但是R2仍可能非常高。 (4)OLS估计量对观测值的轻微变化相当敏感。 第三节多重共线性的探査和解决 、多重共线性的探查 由于多重共线性使一种普遍现象,而多重共线性的程度影响了参数估 计结果,因此我们关心的是共线性的程度,而不是共线性是否存在
− = (1 ) ) ˆ ( 2 2 3 2 2 3 x r Var i 显然,当解释变量X2、X3之间的相关系数 r23 的绝对值越大,共线性程 度就越高,参数估计值的方差就越大,越不准确,且随着相关系数的增大, 方差以更大的幅度增加。 三、多重共线性的影响 (1)参数估计值的方差增大,估计量的精度大大降低。影响预测结果(准 确度和置信区间)。 (2)参数估计值的标准差增大,使的t 检验值变小,增大了接受H0,舍弃 对因变量有显著影响的变量。 (3)尽管t 检验不显著,但是R2仍可能非常高。 (4)OLS估计量对观测值的轻微变化相当敏感。 一、多重共线性的探查 由于多重共线性使一种普遍现象,而多重共线性的程度影响了参数估 计结果,因此我们关心的是共线性的程度,而不是共线性是否存在。 第三节 多重共线性的探查和解决