第六次上机 2007年11月22日 姓名 学号 班级 实验目的:多元线性回归模型的参数估计、抽样分布、假设检验:相关分析与 回归分析之间的联系 实验要求:根据题目要求完成操作 题一 根据文件名为hamburg.xls的文件中提供的关于汉堡销售的周数据完成以下练习,其中 TR表示每周的销售收入,P表示每周的汉堡价格,A表示每周的广告费用。 (1)对下列多元线性回归函数进行估计,TR,=b,+b2P,+bA,+e,,生成类型为 “Equation”对象,将该对象命名为hamburger,.请写出回归方程。 TR=104.7855136-6.641930069.P+2.984298953·A, (2) 完成以下假设检验H。:2B2+40B3=100。(提示根据b2和b3的分布,可以确定 2b2+40b3的分布,即可进行假设检验) 在基本假定满足的情况下, 2b2+40b,-100 -tn-3) √Var(2b,+40b,) Ho:2B2+4053=100H1:2B2+403≠100 计算t统计值的EViewsi命令如下: Scalar tstat=(2*hamburger.@coefs(2)+40*hamburger.@coefs(3)-100)/@sqrt(4*hamburger.@stderrs(2) 2+1600*hamburger.@stderrs(3)2+2*2*40*hamburger.@cov(2,3)) 计算结果为0.6953 计算95%双边检验的临界值,EViewst命令如下: Scalar tthres=@qtdist(0.975,hamburger.@regobs-3) 计算结果为2.0096
1 第六次上机 2007 年 11 月 22 日 姓名 学号 班级 实验目的:多元线性回归模型的参数估计、抽样分布、假设检验;相关分析与 回归分析之间的联系 实验要求:根据题目要求完成操作 题一 根据文件名为 hamburg.xls 的文件中提供的关于汉堡销售的周数据完成以下练习,其中 TR 表示每周的销售收入,p 表示每周的汉堡价格,A 表示每周的广告费用。 (1) 对下列多元线性回归函数进行估计, t t t t TR = b + b p + b A + e 1 2 3 ,生成类型为 “Equation”对象,将该对象命名为 hamburger,请写出回归方程。 mt 104.7855136 - 6.641930069 + 2.984298953 TR P A = ⋅⋅ t t (2) 完成以下假设检验 H0 : 2β 2 + 40β 3 =100 。(提示根据 b2 和 b3 的分布,可以确定 2b2 + 40b3 的分布,即可进行假设检验) 在基本假定满足的情况下, n 2 3 2 3 2b 40b 100 t(n 3) Var(2b 40b ) + − − + ∼ 02 3 12 3 H : 2 40 100 H : 2 40 100 β += +≠ β ββ 计算t统计值的EViews命令如下: Scalar tstat=(2*hamburger.@coefs(2)+40*hamburger.@coefs(3)-100)/@sqrt(4*hamburger.@stderrs(2)^ 2+1600*hamburger.@stderrs(3)^2+2*2*40*hamburger.@cov(2,3)) 计算结果为0.6953 计算95%双边检验的临界值,EViews命令如下: Scalar tthres=@qtdist(0.975,hamburger.@regobs-3) 计算结果为2.0096
t统计值没有超出临界值,没有充分理由拒绝原假设H 题二 根据文件名为woody3.xs的文件中提供的数据完成以下练习,其中Y:单位时间内餐馆的 用餐人数:X1:直径2英里范围内的直接市场竞争者数目:X2:直径3英里范围内的居住 人口;X3:直径3英里范围内居民平均家庭收入。 (1)写出Y、X1、X2、X3的相关系数矩阵。 察看多个序列之间的相关系数矩阵,可以通过组视图完成。以下即为四个序列(变量)的相 关系数矩阵,单位格中的数值为两两之间的样本简单相关系数值。 Y X1 X2 X3 Y 1 -0.1442246401950.392567733318 0.537022013732 X1 -0.144224640195 0.726250705094-0.0315340515943 X2 0.392567733318 0.726250705094 1 0.245197642473 X3 0.537022013732-0.03153405159430.245197642473 1 (2)计算控制X2的影响后,Y和X1的偏相关系数,2,并对该偏相关系数进行t检验 (统计量构造同简单相关系数显著性检验,偏相关系数和相应t值计算公式如下)。 ry-ry2'2 1,2= 5,2Vn-3 V-- 1= ~t(n-3) -玩 EViews命令如下: Scalar ry12-(@cor(y,x1)-@cor(y,x2)*@cor(x1,x2))/@sqrt((1-@cor(y,x2)2)*(1-@cor(x1,x2)2)) 计算得到偏回归系数广2=一0.6791 Ho:Pl,2=0,H1:Py1,2≠0 t=52n-3 V-2 Scalar t_ry12=r_y12*@sqrt(11)/@sqrt(1-r_y12^2) 计算结果得到t仁一5.0666 计算t检验95%双边临界值 Scalar tthres=@qtdist(0.975,@obs(y)-3) 计算结果为2.0423 t统计值超出临界值,因此拒绝总体偏相关系数P,2=0的原假设,即认为偏相关系数显著。 2
2 t统计值没有超出临界值,没有充分理由拒绝原假设H0 题二 根据文件名为 woody3.xls 的文件中提供的数据完成以下练习,其中 Y:单位时间内餐馆的 用餐人数;X1:直径 2 英里范围内的直接市场竞争者数目;X2:直径 3 英里范围内的居住 人口;X3:直径 3 英里范围内居民平均家庭收入。 (1) 写出 Y、X1、X2、X3 的相关系数矩阵。 察看多个序列之间的相关系数矩阵,可以通过组视图完成。以下即为四个序列(变量)的相 关系数矩阵,单位格中的数值为两两之间的样本简单相关系数值。 Y X1 X2 X3 Y 1 -0.144224640195 0.392567733318 0.537022013732 X1 -0.144224640195 1 0.726250705094 -0.0315340515943 X2 0.392567733318 0.726250705094 1 0.245197642473 X3 0.537022013732 -0.0315340515943 0.245197642473 1 (2) 计算控制 X2 的影响后,Y 和 X1 的偏相关系数 y1,2 r ,并对该偏相关系数进行 t 检验 (统计量构造同简单相关系数显著性检验,偏相关系数和相应 t 值计算公式如下)。 ( )( ) 2 12 2 2 1 2 12 1 2 1 r 1 r r r r r y y y y − − ⋅ = − , , ( ) 3 1 3 2 1,2 1,2 − − − = t n r r n t y y ~ EViews 命令如下: Scalar ry12=(@cor(y,x1)-@cor(y,x2)*@cor(x1,x2))/@sqrt((1-@cor(y,x2)^2)*(1-@cor(x1,x2)^2)) 计算得到偏回归系数 y1,2 r =-0.6791 H0: ρ y1,2 =0,H1: ρ y1,2 ≠0 2 1,2 1,2 1 3 y y r r n t − − = Scalar t_ry12=r_y12*@sqrt(11)/@sqrt(1-r_y12^2) 计算结果得到 t=-5.0666 计算 t 检验 95%双边临界值 Scalar tthres=@qtdist(0.975,@obs(y)-3) 计算结果为 2.0423 t 统计值超出临界值,因此拒绝总体偏相关系数 ρ y1,2 =0 的原假设,即认为偏相关系数显著
(3)Y对X1和X2回归,对X1的偏回归系数进行显著性检验,计算t统计值。 Dependent Variable:Y Method:Least Squares Date:11/24/07 Time:11:47 Sample:1 33 Included observations:33 Variable Coefficient Std.Error t-Statistic Prob. C 128403.0 6927.558 18.53511 0.0000 X1 -10605.13 2093.158 -5.066570 0.0000 X2 0.421898 0.071888 5.868858 0.0000 R-squared 0.544159 Mean dependent var 125634.6 Adjusted R-squared 0.513770 S.D.dependent var 22404.09 S.E.of regression 15622.42 Akaike info criterion 22.23731 Sum squared resid 7.32E+09 Schwarz criterion 22.37336 Log likelihood -363.9156 F-statistic 17.90622 Durbin-Watson stat 1.942901 Prob(F-statistic) 0.000008 从以上输出结果可知,X1的偏回归系数显著性检验计算得到t统计量为一5.0666。也可以通 过直接引用回归方程(将上述回归方程保存命名为cq01)中的计算结果,相关EViews命令 如下: Scalar xItstat=eq01.@tstat(2) 查看计算结果同样为一5.0666 (4)比较(2)和(3)中计算的t统计值,你有什么发现? 这两个t统计值计算结果完全一样。这说明从统计关系上看,相关分析中偏相关系数和回归 分析中的偏回归系数是完全一致的,两者同样度量了在一定控制条件下两个变量之间的线性 相关程度。在相关分析中对偏相关系数进行显著性检验,与在回归分析中对偏回归系数进行 显著性检验将得到完全一样的检验结论。 (5)Y对X1、X2和X3回归,对X1的偏回归系数进行显著性检验,计算t统计值。这 个t值与(2)和(3)中计算的t统计值一样吗?为什么? Y对X1、X2和X3回归,输出结果如下(方程保存并命名为eq02): Dependent Variable:Y Method:Least Squares Date:11/24/07 Time:11:57 Sample:1 33 Included observations:33 Variable Coefficient Std.Error t-Statistic Prob. C 102192.4 12799.83 7.983891 0.0000 X1 -9074.674 2052.674 -4.420904 0.0001 X2 0.354668 0.072681 4.879810 0.0000
3 (3) Y 对 X1 和 X2 回归,对 X1 的偏回归系数进行显著性检验,计算 t 统计值。 Dependent Variable: Y Method: Least Squares Date: 11/24/07 Time: 11:47 Sample: 1 33 Included observations: 33 Variable Coefficient Std. Error t-Statistic Prob. C 128403.0 6927.558 18.53511 0.0000 X1 -10605.13 2093.158 -5.066570 0.0000 X2 0.421898 0.071888 5.868858 0.0000 R-squared 0.544159 Mean dependent var 125634.6 Adjusted R-squared 0.513770 S.D. dependent var 22404.09 S.E. of regression 15622.42 Akaike info criterion 22.23731 Sum squared resid 7.32E+09 Schwarz criterion 22.37336 Log likelihood -363.9156 F-statistic 17.90622 Durbin-Watson stat 1.942901 Prob(F-statistic) 0.000008 从以上输出结果可知,X1 的偏回归系数显著性检验计算得到 t 统计量为-5.0666。也可以通 过直接引用回归方程(将上述回归方程保存命名为 eq01)中的计算结果,相关 EViews 命令 如下: Scalar x1tstat=eq01.@tstat(2) 查看计算结果同样为-5.0666 (4) 比较(2)和(3)中计算的 t 统计值,你有什么发现? 这两个 t 统计值计算结果完全一样。这说明从统计关系上看,相关分析中偏相关系数和回归 分析中的偏回归系数是完全一致的,两者同样度量了在一定控制条件下两个变量之间的线性 相关程度。在相关分析中对偏相关系数进行显著性检验,与在回归分析中对偏回归系数进行 显著性检验将得到完全一样的检验结论。 (5) Y 对 X1、X2 和 X3 回归,对 X1 的偏回归系数进行显著性检验,计算 t 统计值。这 个 t 值与(2)和(3)中计算的 t 统计值一样吗?为什么? Y 对 X1、X2 和 X3 回归,输出结果如下(方程保存并命名为 eq02): Dependent Variable: Y Method: Least Squares Date: 11/24/07 Time: 11:57 Sample: 1 33 Included observations: 33 Variable Coefficient Std. Error t-Statistic Prob. C 102192.4 12799.83 7.983891 0.0000 X1 -9074.674 2052.674 -4.420904 0.0001 X2 0.354668 0.072681 4.879810 0.0000
X3 1.287923 0.543294 2.370584 0.0246 R-squared 0.618154 Mean dependent var 125634.6 Adjusted R-squared 0.578653 S.D.dependent var 22404.09 S.E.of regression 14542.78 Akaike info criterion 22.12079 Sum squared resid 6.13E+09 Schwarz criterion 22.30218 Log likelihood -360.9930 F-statistic 15.64894 Durbin-Watson stat 1.758193 Prob(F-statistic) 0.000003 X1的偏回归系数的t统计值为一4.420904,显然不同于(2)和(3)中计算的t统计值。这 是因为前者同时控制了X2和X3的影响(它的t统计值应该和【123的t统计值相等),而后 者只控制了X2的影响,即在不同的前提条件下测算得到的统计关系,通常有不一样的结果。 (6)复相关系数是指所有变量X1、X2、X3的线性组合和Y的相关程度,样本复相关系 数即为Y和Y的样本简单相关系数。计算此例中所有变量X1、X2、X3的线性组 合和Y的复相关系数。 先计算被解释变量的估计值序列 Series yhat=eq02.@coefs(1)+eq02.@coefs(2)*x1+eq02.@coefs(3)*x2+eq02.@coefs(4)*x3 再计算被解释变量估计值序列和被解释变量实际观测值序列之间的样本简单相关系数,即为 样本复相关系数。 Scalar yhaty=@cor(yhat,y) 计算结果为0.7862,其平方值为0.618154 (7)写出(5)中方程的拟合优度。比较该拟和优度和(6)中的复相关系数的平方,你 有什么发现? (5)中方程的拟合优度为0.618154,它与(6)中的复相关系数的平方相等。这是因为这两 个统计量具有同样的统计含义,同样度量了一个变量(被解释变量)和多个变量(解释变量) 之间线性相关的程度。 题三 当两个模型的因变量不同时,不能直接比较这两个模型的拟合优度。但是按下列过程仍然可 以进行比较。以下述两个线性模型为例,根据文件名为data.xs文件提供的数据完成以下练 习: In y:Bo Bt+ur (1) y:=Bo+Bt+u (2) (1)对上述两个回归模型进行回归分析,写出回归结果和各自的拟合优度 回归模型(1)的估计结果,保存并命名为eq01 1n()=12.00708286+0.09463885275-1R2=0.982421
4 X3 1.287923 0.543294 2.370584 0.0246 R-squared 0.618154 Mean dependent var 125634.6 Adjusted R-squared 0.578653 S.D. dependent var 22404.09 S.E. of regression 14542.78 Akaike info criterion 22.12079 Sum squared resid 6.13E+09 Schwarz criterion 22.30218 Log likelihood -360.9930 F-statistic 15.64894 Durbin-Watson stat 1.758193 Prob(F-statistic) 0.000003 X1 的偏回归系数的 t 统计值为-4.420904,显然不同于(2)和(3)中计算的 t 统计值。这 是因为前者同时控制了 X2 和 X3 的影响(它的 t 统计值应该和 y1.23 r 的 t 统计值相等),而后 者只控制了 X2 的影响,即在不同的前提条件下测算得到的统计关系,通常有不一样的结果。 (6) 复相关系数是指所有变量 X1、X2、X3 的线性组合和 Y 的相关程度,样本复相关系 数即为 Y 和Yˆ 的样本简单相关系数。计算此例中所有变量 X1、X2、X3 的线性组 合和 Y 的复相关系数。 先计算被解释变量的估计值序列 Series yhat=eq02.@coefs(1)+ eq02.@coefs(2)*x1+ eq02.@coefs(3)*x2+ eq02.@coefs(4)*x3 再计算被解释变量估计值序列和被解释变量实际观测值序列之间的样本简单相关系数,即为 样本复相关系数。 Scalar yhaty=@cor(yhat,y) 计算结果为 0.7862,其平方值为 0.618154 (7) 写出(5)中方程的拟合优度。比较该拟和优度和(6)中的复相关系数的平方,你 有什么发现? (5)中方程的拟合优度为 0.618154,它与(6)中的复相关系数的平方相等。这是因为这两 个统计量具有同样的统计含义,同样度量了一个变量(被解释变量)和多个变量(解释变量) 之间线性相关的程度。 题三 当两个模型的因变量不同时,不能直接比较这两个模型的拟合优度。但是按下列过程仍然可 以进行比较。以下述两个线性模型为例,根据文件名为 data.xls 文件提供的数据完成以下练 习: t ut ln y = β 0 + β1t + (1) t ut y = β 0 + β1t + (2) (1) 对上述两个回归模型进行回归分析,写出回归结果和各自的拟合优度 回归模型(1)的估计结果,保存并命名为 eq01 ln 12.00708286 + 0.09463885275 n( ) Y t t = ⋅ 2 R = 0.982421
回归模型(2)的估计结果,保存并命名为eq02 ,=98084.2381+35288.92857·t,R2=0.936895 (2)根据式(1)求lny,写出相关EViews命令 Series Inyhat=eq01.@coefs(1)+eq01.@coefs(2)*(@trend+1) (3)根据上题得到的lny,求),,写出相关EViews命令 Series yhat1=exp(Inyhat) (4)根据拟合优度的定义,用(3)得到的),计算拟合优度,写出相关EViews命令 Scalar eq01r2=@sumsq(yhat1-@mean(yhat1))/@sumsq(y-@mean(y)) 计算结果为0.938159 (5)将(4)中得到的拟合优度与式(2)回归方程得到的拟合优度进行比较,是否相同? 在(1)中,由于被解释变量不相同,回归模型所解释的对象不同,因此不能直接将拟合优 度进行比较。如果希望评价模型的解释能力,需要在同样的被解释对象的基础上展开,因此 才有了上述几个步骤。比较下来,两个模型的解释能力是不同的,模型(1)的解释能力稍 微高于模型(2)的解释能力。 5
5 回归模型(2)的估计结果,保存并命名为 eq02 Y . . t t = 98084 2381 + 35288 92857 ⋅ ˆ , 2 R = 0.936895 (2) 根据式(1)求 t ln yˆ ,写出相关 EViews 命令 Series lnyhat=eq01.@coefs(1)+eq01.@coefs(2)*(@trend+1) (3) 根据上题得到的 t ln yˆ 求 t yˆ ,写出相关 EViews 命令 Series yhat1=exp(lnyhat) (4) 根据拟合优度的定义,用(3)得到的 t yˆ 计算拟合优度,写出相关 EViews 命令 Scalar eq01r2=@sumsq(yhat1-@mean(yhat1))/@sumsq(y-@mean(y)) 计算结果为 0.938159 (5) 将(4)中得到的拟合优度与式(2)回归方程得到的拟合优度进行比较,是否相同? 在(1)中,由于被解释变量不相同,回归模型所解释的对象不同,因此不能直接将拟合优 度进行比较。如果希望评价模型的解释能力,需要在同样的被解释对象的基础上展开,因此 才有了上述几个步骤。比较下来,两个模型的解释能力是不同的,模型(1)的解释能力稍 微高于模型(2)的解释能力