第七次上机练习题 2007年12月6日 姓名 班级 学号 实验目的:模型选择 实验要求:根据题目要求完成操作 题一 根据附件No7-1.xs中提供的数据,选择一个模型来描述 (1) 画y对x的散点图,描述y随x变化的变动趋势,如何理解这一趋势? 30 340 320 300- 2 3000400050006000700080009000 x为产量,y为平均成本。当产量处在较低水平时,平均成本随着产量增加而递减。这主要 是由于固定成本被摊薄带来的。 (2) 选择一种模型描述y和x之间的关系,给出回归分析结果,并说明为什么你选用这 一模型而不是其它模型。 Dependent Variable:Y Method:Least Squares Date:12/09/07 Time:20:43 Sample:1 16 Included observations:16 Variable Coefficient Std.Error t-Statistic Prob. C -548.8768 653.7147 -0.839627 0.4175 1/X 1959165 1224099 1.600495 0.1355 X 0.127440 0.113206 1.125734 0.2823 XA2 -6.52E-06 6.38E-06 -1.022061 0.3269 R-squared 0.885596 Mean dependent var 312.3081 Adjusted R-squared 0.856994 S.D.dependent var 14.62250 S.E.of regression 5.529655 Akaike info criterion 6.470446 Sum squared resid 366.9250 Schwarz criterion 6.663593 Log likelihood -47.76357 F-statistic 30.96368 Durbin-Watson stat 1.462251 Prob(F-statistic) 0.000006
第七次上机练习题 2007 年 12 月 6 日 姓名 班级 学号 实验目的:模型选择 实验要求:根据题目要求完成操作 题一 根据附件 No7-1.xls 中提供的数据,选择一个模型来描述 (1) 画 y 对 x 的散点图,描述 y 随 x 变化的变动趋势,如何理解这一趋势? 280 300 320 340 360 3000 4000 5000 6000 7000 8000 9000 X Y x 为产量,y 为平均成本。当产量处在较低水平时,平均成本随着产量增加而递减。这主要 是由于固定成本被摊薄带来的。 (2) 选择一种模型描述 y 和 x 之间的关系,给出回归分析结果,并说明为什么你选用这 一模型而不是其它模型。 Dependent Variable: Y Method: Least Squares Date: 12/09/07 Time: 20:43 Sample: 1 16 Included observations: 16 Variable Coefficient Std. Error t-Statistic Prob. C -548.8768 653.7147 -0.839627 0.4175 1/X 1959165. 1224099. 1.600495 0.1355 X 0.127440 0.113206 1.125734 0.2823 X^2 -6.52E-06 6.38E-06 -1.022061 0.3269 R-squared 0.885596 Mean dependent var 312.3081 Adjusted R-squared 0.856994 S.D. dependent var 14.62250 S.E. of regression 5.529655 Akaike info criterion 6.470446 Sum squared resid 366.9250 Schwarz criterion 6.663593 Log likelihood -47.76357 F-statistic 30.96368 Durbin-Watson stat 1.462251 Prob(F-statistic) 0.000006
可以利用总成本函数直接得到平均成本函数的形式,但是回归元系数均不显著,从这点来 看,这个模型并不好。这往往是由于回归元的多重共线性引起的。为了解决多重共线性问 题,简单的办法是直接将与其它解释变量有高度共线性关系的回归元去掉。 Dependent Variable:Y Method:Least Squares Date:12/09/07 Time:20:47 Sample:116 Included observations:16 Variable Coefficient Std.Error t-Statistic Prob Q 115.5999 68.44703 1.688895 0.1151 1/X 723021.4 189061.3 3.824270 0.0021 十 0.011898 0.005995 1.984612 0.0687 R-squared 0.875637 Mean dependent var 312.3081 Adjusted R-squared 0.856504 S.D.dependent var 14.62250 S.E.of regression 5.539134 Akaike info criterion 6.428914 Sum squared resid 398.8661 Schwarz criterion 6.573774 Log likelihood -48.43131 F-statistic 45.76618 Durbin-Watson stat 1.122835 Prob(F-statistic) 0.000001 题二: 模型M,:Y,=A+AX+y,模型Mm:Y=B1+B2X2+BX+4,。模型M,可以 看作是对模型M,中的回归参数施加某种形式的约束条件(即B,=0)后得到的模型,称 为受限回归模型。如果模型M优于模型M,表明模型M,存在遗漏变量。进行以下假设 检验: H。:棋型M与模型M,无差异 H,:模型M,优于模型M,(即模型M,存在遗漏变量问题) (R2-R2)/m -F(m,n-K) (1-R)/(n-K) 其中m为约束条件个数,K为模型M中的待估参数个数。R2为模型M的拟合优度,R2 为模型M,的拟合优度。根据台湾地区1958年至1972年实际总产出、劳动投入、实际资本 投入的数据(见附件No7-2.xs),其中=实际总产出(单位:百万新台币);X2=劳动投入 (千人):X3=实际资本投入(百万新台币):X=时间趋势变量 (1)由于某种原因,在开始的时候人们无法获得实际资本投入的数据,进行了以下模型的 回归:lnY=A+AlnX2:+y,。如果该模型为此遗漏掉了重要的变量X3,那么参数估 计值α,是上偏估计量还是下偏估计量?为什么?请给出具体分析过程。 根据理论分析结果(见教材第11章式11-3),遗漏变量情况下,α,平均来看是真实参数B
可以利用总成本函数直接得到平均成本函数的形式,但是回归元系数均不显著,从这点来 看,这个模型并不好。这往往是由于回归元的多重共线性引起的。为了解决多重共线性问 题,简单的办法是直接将与其它解释变量有高度共线性关系的回归元去掉。 Dependent Variable: Y Method: Least Squares Date: 12/09/07 Time: 20:47 Sample: 1 16 Included observations: 16 Variable Coefficient Std. Error t-Statistic Prob. C 115.5999 68.44703 1.688895 0.1151 1/X 723021.4 189061.3 3.824270 0.0021 X 0.011898 0.005995 1.984612 0.0687 R-squared 0.875637 Mean dependent var 312.3081 Adjusted R-squared 0.856504 S.D. dependent var 14.62250 S.E. of regression 5.539134 Akaike info criterion 6.428914 Sum squared resid 398.8661 Schwarz criterion 6.573774 Log likelihood -48.43131 F-statistic 45.76618 Durbin-Watson stat 1.122835 Prob(F-statistic) 0.000001 题二: 模型 Mr : i i i Y = A + A X + v 1 2 2 ,模型 Mur :Yi = B1 + B2X2i + B3X3i + ui 。模型 Mr 可以 看作是对模型 Mur 中的回归参数施加某种形式的约束条件(即 B3 = 0 )后得到的模型,称 为受限回归模型。如果模型 Mur 优于模型 Mr ,表明模型 Mr 存在遗漏变量。进行以下假设 检验: : H0 模型 Mur 与模型 Mr 无差异 : H1 模型 Mur 优于模型 Mr (即模型 Mr 存在遗漏变量问题) ( ) ( ) ( ) ( ) 2 2 2 / , 1 / − − − − ~ ur r ur R Rm F mn K R nK 其中 m 为约束条件个数,K 为模型 Mur 中的待估参数个数。 2 Rur 为模型 Mur 的拟合优度, 2 Rr 为模型 Mr 的拟合优度。根据台湾地区 1958 年至 1972 年实际总产出、劳动投入、实际资本 投入的数据(见附件 No7-2.xls),其中 Y=实际总产出(单位:百万新台币);X2=劳动投入 (千人);X3=实际资本投入(百万新台币);X4=时间趋势变量 (1)由于某种原因,在开始的时候人们无法获得实际资本投入的数据,进行了以下模型的 回归: i i i Y = A + A X + v 1 2 2 ln ln 。如果该模型为此遗漏掉了重要的变量 X3 ,那么参数估 计值 2 a 是上偏估计量还是下偏估计量?为什么?请给出具体分析过程。 根据理论分析结果(见教材第 11 章式 11-3),遗漏变量情况下, 2 a 平均来看是真实参数 B2
的上偏还是下偏估计量,取决于B,C2的符号。从理论上看,B,和C2通常都是正号,因此 a2平均来看是真实参数B,的上偏估计量。 (2)利用以上统计量检验模型lnY,=A,+4 In X2+,是否遗漏了变量lnX,。请给出 EViews命令和计算结果。 (R-R)/m 1-r)/(n-K) -F(m,n-K) (0.983712-0.964907)/1 ~F(1,15-3) (1-0.983712)/(15-3) 将以下回归方程命名为eq01 Dependent Variable:LOG(Y) Method:Least Squares Date:12/04/07 Time:20:41 Sample:19581972 Included observations:15 Variable Coefficient Std.Error t-Statistic Prob. C 2.069560 0.417743 4.954143 0.0003 LOG(X2) 1.257567 0.066516 18.90615 0.0000 R-squared 0.964907 Mean dependent var 9.949171 Adjusted R-squared 0.962207 S.D.dependent var 0.566287 S.E.of regression 0.110088 Akaike info criterion -1.451508 Sum squared resid 0.157552 Schwarz criterion -1.357101 Log likelihood 12.88631 F-statistic 357.4424 Durbin-Watson stat 1.146262 Prob(F-statistic) 0.000000 将以下方程命名为cq02 Dependent Variable:LOG(Y) Method:Least Squares Date:12/09/07 Time:20:32 Sample:19581972 Included observations:15 Variable Coefficient Std.Error t-Statistic Prob. C -7.843851 2.679836 -2.926989 0.0127 LOG(X2) 0.714779 0.153268 4.663602 0.0005 LOG(X3) 1.113474 0.299154 3.722069 0.0029 R-squared 0.983712 Mean dependent var 9.949171 Adjusted R-squared 0.980997 S.D.dependent var 0.566287
的上偏还是下偏估计量,取决于 3 32 B c 的符号。从理论上看, B3 和 32 c 通常都是正号,因此 2 a 平均来看是真实参数 B2 的上偏估计量。 (2)利用以上统计量检验模型 i i i Y = A + A X + v 1 2 2 ln ln 是否遗漏了变量 3 ln X 。请给出 EViews 命令和计算结果。 ( ) ( ) ( ) ( ) 2 2 2 / , 1 / − − − − ~ ur r ur R Rm F mn K R nK ( ) ( )( ) ( ) 0.983712 0.964907 /1 1,15 3 1 0.983712 / 15 3 − − − − ~F 将以下回归方程命名为 eq01 Dependent Variable: LOG(Y) Method: Least Squares Date: 12/04/07 Time: 20:41 Sample: 1958 1972 Included observations: 15 Variable Coefficient Std. Error t-Statistic Prob. C 2.069560 0.417743 4.954143 0.0003 LOG(X2) 1.257567 0.066516 18.90615 0.0000 R-squared 0.964907 Mean dependent var 9.949171 Adjusted R-squared 0.962207 S.D. dependent var 0.566287 S.E. of regression 0.110088 Akaike info criterion -1.451508 Sum squared resid 0.157552 Schwarz criterion -1.357101 Log likelihood 12.88631 F-statistic 357.4424 Durbin-Watson stat 1.146262 Prob(F-statistic) 0.000000 将以下方程命名为 eq02 Dependent Variable: LOG(Y) Method: Least Squares Date: 12/09/07 Time: 20:32 Sample: 1958 1972 Included observations: 15 Variable Coefficient Std. Error t-Statistic Prob. C -7.843851 2.679836 -2.926989 0.0127 LOG(X2) 0.714779 0.153268 4.663602 0.0005 LOG(X3) 1.113474 0.299154 3.722069 0.0029 R-squared 0.983712 Mean dependent var 9.949171 Adjusted R-squared 0.980997 S.D. dependent var 0.566287
S.E.of regression 0.078064 Akaike info criterion -2.085725 Sum squared resid 0.073127 Schwarz criterion -1.944115 Log likelihood 18.64294 F-statistic 362.3594 Durbin-Watson stat 1.416754 Prob(F-statistic) 0.000000 相应的EViews命令为 Scalar fstat=(eq02.@r2-eq01.@r2)/1/(1-eq02.@r2)*(eq02.@regobs-eq02.@ncoef) 计算结果fstat-=13.85380, 计算相伴概率 scalar fthres=1-@cfdist(fstat,1.eq02.@regobs-eq02.@ncoef) 计算结果为0.002916 所以拒绝原假设,有遗漏。 (3)利用以上统计量检验模型lnY=A+A,lnX,+y,是否同时遗漏了变量lnX,和变量 X4。请给出EViews命令和计算结果。 将以下方程命名为eq03 Dependent Variable:LOG(Y) Method:Least Squares Date:12/09/07 Time:20:35 Sample:19581972 Included observations:15 Variable Coefficient Std.Error t-Statistic Prob. C 4.944253 4.024478 1.228545 0.2449 LOG(X2) -0.121815 0.256302 -0.475277 0.6439 LOG(X3) 0.403372 0.289219 1.394693 0.1906 X4 0.118107 0.032786 3.602328 0.0042 R-squared 0.992527 Mean dependent var 9.949171 Adjusted R-squared 0.990489 S.D.dependent var 0.566287 S.E.of regression 0.055226 Akaike info criterion -2.731582 Sum squared resid 0.033549 Schwarz criterion -2.542769 Log likelihood 24.48687 F-statistic 487.0038 Durbin-Watson stat 1.496272 Prob(F-statistic) 0.000000 相应的EViews命令为 Scalarfstat2=(eq03.@r2-eq01.@r2)/2/(1-eq03.@r2)*(eq03.@regobs-eq03.@ncoef) 计算结果fstat2=20.3288, 计算相伴概率 scalar fthres2=1-@cfdist(fstat2,2,eq03.@regobs-eq03.@ncoef) 计算结果为0.000202 所以拒绝原假设,有遗漏变量。 题三: 利用附件No7-3.xs中提供的数据,完成以下练习
S.E. of regression 0.078064 Akaike info criterion -2.085725 Sum squared resid 0.073127 Schwarz criterion -1.944115 Log likelihood 18.64294 F-statistic 362.3594 Durbin-Watson stat 1.416754 Prob(F-statistic) 0.000000 相应的 EViews 命令为 Scalar fstat=(eq02.@r2-eq01.@r2)/1/(1-eq02.@r2)*(eq02.@regobs-eq02.@ncoef) 计算结果 fstat=13.85380, 计算相伴概率 scalar fthres=1-@cfdist(fstat,1,eq02.@regobs-eq02.@ncoef) 计算结果为 0.002916 所以拒绝原假设,有遗漏。 (3)利用以上统计量检验模型 i i i Y = A + A X + v 1 2 2 ln ln 是否同时遗漏了变量 3 ln X 和变量 X4 。请给出 EViews 命令和计算结果。 将以下方程命名为 eq03 Dependent Variable: LOG(Y) Method: Least Squares Date: 12/09/07 Time: 20:35 Sample: 1958 1972 Included observations: 15 Variable Coefficient Std. Error t-Statistic Prob. C 4.944253 4.024478 1.228545 0.2449 LOG(X2) -0.121815 0.256302 -0.475277 0.6439 LOG(X3) 0.403372 0.289219 1.394693 0.1906 X4 0.118107 0.032786 3.602328 0.0042 R-squared 0.992527 Mean dependent var 9.949171 Adjusted R-squared 0.990489 S.D. dependent var 0.566287 S.E. of regression 0.055226 Akaike info criterion -2.731582 Sum squared resid 0.033549 Schwarz criterion -2.542769 Log likelihood 24.48687 F-statistic 487.0038 Durbin-Watson stat 1.496272 Prob(F-statistic) 0.000000 相应的 EViews 命令为 Scalar fstat2=(eq03.@r2-eq01.@r2)/2/(1-eq03.@r2)*(eq03.@regobs-eq03.@ncoef) 计算结果 fstat2=20.3288, 计算相伴概率 scalar fthres2=1-@cfdist(fstat2,2,eq03.@regobs-eq03.@ncoef) 计算结果为 0.000202 所以拒绝原假设,有遗漏变量。 题三: 利用附件 No7-3.xls 中提供的数据,完成以下练习
(1)估计=B+B,X+4 Dependent Variable:1/Y Method:Least Squares Date:12/04/07 Time:21:16 Sample:1 10 Included observations:10 Variable Coefficient Std.Error t-Statistic Prob. C 0.013032 0.000757 17.20586 0.0000 X 8.33E-05 1.47E-05 5.683060 0.0005 R-squared 0.801475 Mean dependent var 0.016273 Adjusted R-squared 0.776659 S.D.dependent var 0.003335 S.E.of regression 0.001576 Akaike info criterion -9.890749 Sum squared resid 1.99-05 Schwarz criterion -9.830232 Log likelihood 51.45375 F-statistic 32.29717 Durbin-Watson stat 0.853162 Prob(F-statistic) 0.000463 将以上方程命名为cq01 (2)求Y对X的变化率(给出数学表达式和完成计算所需EViews命令) =B+B,X,求得 1 dr =-B,Y2 根据样本函数估计结果,可以由下式估算心 =-b,2,相应EViews命令为 dx Series d1=-eq01.@coefs(2)*(1/(eq01.@coefs(1)+eq01.@coefs(2)*x)^2) (3)求Y对X的弹性(给出数学表达式和完成计算所需EViews命令) =B+B,X,求得X=-B,Y dX/X 根据样本函数估计结果,可以由下式估算 I定-h,X灯,相应的EViews命令为 dX/X Series d2=-eq01.@coefs(1)*x*(1/(eq01.@coefs(1)+eq01.@coefs(2)*x)) (4)估计Y=B+B,X + Dependent Variable:Y Method:Least Squares Date:12/04/07Time:21:16 Sample:110 Included observations:10 Variable Coefficient Std.Error t-Statistic Prob
(1)估计 i i i B B X u Y = 1 + 2 + 1 Dependent Variable: 1/Y Method: Least Squares Date: 12/04/07 Time: 21:16 Sample: 1 10 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob. C 0.013032 0.000757 17.20586 0.0000 X 8.33E-05 1.47E-05 5.683060 0.0005 R-squared 0.801475 Mean dependent var 0.016273 Adjusted R-squared 0.776659 S.D. dependent var 0.003335 S.E. of regression 0.001576 Akaike info criterion -9.890749 Sum squared resid 1.99E-05 Schwarz criterion -9.830232 Log likelihood 51.45375 F-statistic 32.29717 Durbin-Watson stat 0.853162 Prob(F-statistic) 0.000463 将以上方程命名为 eq01 (2)求Y 对 X 的变化率(给出数学表达式和完成计算所需 EViews 命令) B B X Y 1 2 1 = + ,求得 2 B2Y dX dY = − 根据样本函数估计结果,可以由下式估算 2 2 ˆ ˆ b Y dX dY = − ,相应 EViews 命令为 Series d1=-eq01.@coefs(2)*(1/(eq01.@coefs(1)+eq01.@coefs(2)*x)^2) (3)求Y 对 X 的弹性(给出数学表达式和完成计算所需 EViews 命令) B B X Y 1 2 1 = + ,求得 B XY dX X dY Y 2 / / = − 根据样本函数估计结果,可以由下式估算 b XY dX X dY Y ˆ / ˆ / ˆ = − 2 ,相应的 EViews 命令为 Series d2=-eq01.@coefs(1)*x*(1/(eq01.@coefs(1)+eq01.@coefs(2)*x)) (4)估计 i i i u X Y = B + B + 1 1 2 Dependent Variable: Y Method: Least Squares Date: 12/04/07 Time: 21:16 Sample: 1 10 Included observations: 10 Variable Coefficient Std. Error t-Statistic Prob
Q 55.48718 3.187260 17.40905 0.0000 1/X 112.1797 26.42885 4.244593 0.0028 R-squared 0.692504 Mean dependent var 63.90000 Adjusted R-squared 0.654067 S.D.dependent var 13.42013 S.E.of regression 7.893200 Akaike info criterion 7.146737 Sum squared resid 498.4208 Schwarz criterion 7.207254 Log likelihood -33.73368 F-statistic 18.01657 Durbin-Watson stat 0.675585 Prob(F-statistic) 0.002820 将以上方程估计结果命名为eq02 (5)哪个模型对数据拟合得更好?为什么?请给出具体分析过程和计算结果。 利用eqOl,得到Y,相应EViews命令为 Series eq0lyhat=1/(eq01.@coefs(1)+eq01.@coefs(2)*x) 求 ∑2- (其中上标“1”表示第1个方程中得到的Y) Σg-Y 相应EViews命令为 Scalar eq01r2=@sumsq(eq0lyhat-@mean(eq0lyhat))/@sumsq(y-@mean(y))=0.5618 计算结果为0.5618 其次,计算方程2的拟合优度 相应EViews命令为 Scalar eq02r2=eq02.@r2 计算结果为0.69250 根据两个拟合优度对比结果来看,方程2的拟合效果更好
C 55.48718 3.187260 17.40905 0.0000 1/X 112.1797 26.42885 4.244593 0.0028 R-squared 0.692504 Mean dependent var 63.90000 Adjusted R-squared 0.654067 S.D. dependent var 13.42013 S.E. of regression 7.893200 Akaike info criterion 7.146737 Sum squared resid 498.4208 Schwarz criterion 7.207254 Log likelihood -33.73368 F-statistic 18.01657 Durbin-Watson stat 0.675585 Prob(F-statistic) 0.002820 将以上方程估计结果命名为 eq02 (5)哪个模型对数据拟合得更好?为什么?请给出具体分析过程和计算结果。 利用 eq01,得到Yˆ ,相应 EViews 命令为 Series eq01yhat=1/(eq01.@coefs(1)+eq01.@coefs(2)*x) 求 ( ) ∑( ) ∑ − − 2 2 1 1 ˆ ˆ Y Y Y Y i i (其中上标“1”表示第 1 个方程中得到的Yˆ ) 相应 EViews 命令为 Scalar eq01r2=@sumsq(eq01yhat-@mean(eq01yhat))/@sumsq(y-@mean(y))=0.5618 计算结果为 0.5618 其次,计算方程 2 的拟合优度 相应 EViews 命令为 Scalar eq02r2=eq02.@r2 计算结果为 0.69250 根据两个拟合优度对比结果来看,方程 2 的拟合效果更好