第八章练习题参考解答 练习题 81Sen和 Srivastava(1971)在研究贫富国之间期望寿命的差异时,利用101个国家 的数据,建立了如下的回归模型 =-240+9.39nx1-3.36((nX-7) (4.37)(0.857)(242) R2=0.752 其中:X是以美元计的人均收入 Y是以年计的期望寿命 Sen和 Srivastava认为人均收入的临界值为1097美元(ln1097=7),若人均收 入超过1097美元,则被认定为富国;若人均收入低于1097美元,被认定为贫穷国 括号内的数值为对应参数估计值的t-值。 (1)解释这些计算结果 (2)回归方程中引入D(nX1-7)的原因是什么?如何解释这个回归解释变量? (3)如何对贫穷国进行回归?又如何对富国进行回归? (4)从这个回归结果中可得到的一般结论是什么? 8.2表中给出1965-1970年美国制造业利润和销售额的季度数据。假定利润不仅与销 售额有关,而且和季度因素有关。要求: (1)如果认为季度影响使利润平均值发生变异,应如何引入虚拟变量? (2)如果认为季度影响使利润对销售额的变化率发生变异,应当如何引入虚拟变量? (3)如果认为上述两种情况都存在,又应当如何引入虚拟变量? (4)对上述三种情况分别估计利润模型,进行对比分析。 年份季度利润(Y)|销售额(X)年份季度利润(Y)销售额(X) 0503 l14862 1968-1 2539 123968 14849 153913 10834 123545 13203 12201 131917 14947 168409 1966-112245 129911 1969-1 14151 16278 14001 140976 15949 176057 312213 137828 234 14024 172419 12820 145465 14315 83327 1967- l1349 136989 1970-112381 145126 13991 l1014 141536 12174 176712 151776 10985 180370 83在统计学教材中,采用了方差分析方法分析了不同班次对劳动效率的影响,其样本 数据为 早班中班晚班
第八章练习题参考解答: 练习题 8.1 Sen 和 Srivastava(1971)在研究贫富国之间期望寿命的差异时,利用 101 个国家 的数据,建立了如下的回归模型: 2.40 9.39ln 3.36( (ln 7)) Y X D X i i i i = − + − − (4.37) (0.857) (2.42) R 2=0.752 其中:X 是以美元计的人均收入; Y 是以年计的期望寿命; Sen 和 Srivastava 认为人均收入的临界值为 1097 美元( ln1097 7 = ),若人均收 入超过 1097 美元,则被认定为富国;若人均收入低于 1097 美元,被认定为贫穷国。 括号内的数值为对应参数估计值的 t-值。 (1)解释这些计算结果。 (2)回归方程中引入 D X i i (ln 7 − ) 的原因是什么?如何解释这个回归解释变量? (3)如何对贫穷国进行回归?又如何对富国进行回归? (4)从这个回归结果中可得到的一般结论是什么? 8.2 表中给出 1965—1970 年美国制造业利润和销售额的季度数据。假定利润不仅与销 售额有关,而且和季度因素有关。要求: (1)如果认为季度影响使利润平均值发生变异,应如何引入虚拟变量? (2)如果认为季度影响使利润对销售额的变化率发生变异,应当如何引入虚拟变量? (3)如果认为上述两种情况都存在,又应当如何引入虚拟变量? (4)对上述三种情况分别估计利润模型,进行对比分析。 年份季度 利润(Y) 销售额(X) 年份季度 利润(Y) 销售额(X) 1965-1 10503 114862 1968-1 12539 148862 2 12092 123968 2 14849 153913 3 10834 123545 3 13203 155727 4 12201 131917 4 14947 168409 1966-1 12245 129911 1969-1 14151 162781 2 14001 140976 2 15949 176057 3 12213 137828 3 14024 172419 4 12820 145465 4 14315 183327 1967-1 11349 136989 1970-1 12381 170415 2 12615 145126 2 13991 181313 3 11014 141536 3 12174 176712 4 12730 151776 4 10985 180370 8.3 在统计学教材中,采用了方差分析方法分析了不同班次对劳动效率的影响,其样本 数据为 早班 中班 晚班
3 47 试采用虚拟解释变量回归的方法对上述数据进行方差分析 84 Joseph Cappelleri基于1961-1966年的200只Aa级和Ba级债券的数据(截面数 据和时间序列数据的合并数据),分别建立了LPM和 Logit模型: LPM Y=B,+B,X2+B3X3+BX4++Bsxs+u Logit Li=mn(D)=B1+月1x2+月1x3+B,X4++Bxs+n P 其中:=1债券信用等级为Aa(穆迪信用等级) Y=1债券信用等级为Ba(穆迪信用等级) X,=债券的资本化率,作为杠杆的测度(=长期债券的市值100 资本的市值 X1=利润率(=税后收入 总资产净值 x4=利润率的标准差,测度利润率的变异性 X=总资产净值,测度规模 上述模型中B2和B4事先期望为负值,而β3和β期望为正值(为什么) 对于LPM, Cappeleri经过异方差和一阶自相关校正,得到以下结果 =0.686000179X21+00486X3+0572X4+0.378×10-7×5i Se=(0.1775)(0.0024)0.0486)(0.0178)(0.039×10-8) R2=0.6933 对于 Logit模型, Cappeleri在没有对异方差进行弥补的情形下用ML得以下结果 P 1))=-1.662-0.3185X2+06248X3-0.9041X+0.92×10-X5 试解下列问题 (1)为什么要事先期望B2和B4为负值? (2)在LPM中,当B4>0是否合理?
34 49 39 37 47 40 35 51 42 33 48 39 33 50 41 35 51 42 36 51 40 试采用虚拟解释变量回归的方法对上述数据进行方差分析。 8.4 Joseph Cappelleri 基于 1961—1966 年的 200 只 Aa 级和 Baa 级债券的数据(截面数 据和时间序列数据的合并数据),分别建立了 LPM 和 Logit 模型: LPM Yi = + X i + 3X3i + 4X4i + + 5X5i + ui 2 1 1 2 Logit i i i i i i i X X X X u p p Li In = + + + + + + − = 3 3 4 4 5 5 2 1 1 2 ) 1 ( 其中: Yi =1 债券信用等级为 Aa(穆迪信用等级) Yi =1 债券信用等级为 Baa(穆迪信用等级) X2 =债券的资本化率,作为杠杆的测度( = 100 总资本的市值 长期债券的市值 ) X3 = 利润率( = 100 总资产净值 税后收入 ) X4 = 利润率的标准差,测度利润率的变异性 X5 = 总资产净值,测度规模 上述模型中 2 和 4 事先期望为负值,而 3 和 5 期望为正值(为什么)。 对于 LPM,Cappeleri 经过异方差和一阶自相关校正,得到以下结果: Yi ˆ =0.6860-0.0179 2 X 2i +0.0486 X3i +0.0572 X 4i +0.378×10-7×5i Se=(0.1775)(0.0024) (0.0486) (0.0178) (0.039×10-8 ) R 2=0.6933 对于 Logit 模型,Cappeleri 在没有对异方差进行弥补的情形下用 ML 得以下结果: i i i i i i X X X X p p In 5 6 3 4 2 ) 1.6622 0.3185 2 0.6248 0.9041 0.92 10 1 ( − = − − + − + − 试解下列问题: (1)为什么要事先期望 2 和 4 为负值? (2)在 LPM 中,当 4 >0 是否合理?
(3)对LPM的估计结果应做什么样的解释? (4)已知x2=967%,X3=777%,X4=0.5933%,X5=3429(千元,问债 券晋升Aa信用等级的概率有多大? 8.5 Greene在分析讲授某门经济学课程采用新的教学方法效应时,搜集了如下表所示的 数据,其中, Grade是学生在接受新教学方法(PSl,PSI 1接受新教学方法 0没有采用新方法后学习 成绩是否有所提高的虚拟变量, GRADE= ∫1有所提高 ,其他变量分别为平均级点GPA, 0没有提高 非期末考试成绩分数TUCE。试用Logt模型对此进行估计,并分析相应的边际效应 obs GRADE GPA TUCE SI obs GRADE GPA TUCE PSI 0.0000002.66000020.000000000000170.0000002.75000025000000.000000 20.0000002.89000022.000000.000000180.0000002.83000019000000.000000 0.0000003.28000024.000000000000190.0000003.12000023.000001.000000 0.000000292000012000000.000000201.0000003.16000025000001.000000 1.0000004000000210000000000002100000002.06000022000001000000 0.000000286000017000000000000221.000000362000028.000001.000000 0.0000002.76000017000000000000230.000000289000014.000001.000000 0.0000002.87000021.000000.000000240.0000003.51000026.000001.000000 90.0000003.03000025000000.000000251.0000003.54000024.000001.000000 1.0000003.920000290000000000002610000002.83000027.000001.000000 110.000000263000020000000000000271.0000003.39000017.000001.000000 120.00 3.32000023.000000.000000280.0000002.67000024000001.000000 0.00 3.57000023.00000000000029 141.0000003.26000025000000.000000301.0000004.00000023.000001.000000 150.0000003.53000026.000000000000310.0000003.10000021.000001.000000 160.0000002.74000019000000.000000321.0000002.3900001900000100000 8.6依据下列大型超市的调査数据,分析股份制因素是否对销售规模产生影响 销售 销售 销售 销售 性质 性质 性质 性质 性质 规模 规模 规模 规模 规模 1345非股份制1566非股份制2533股份制144非股份制1461非股份制 2435股份制187非股份制1602非股份制1566股份制|1433股份制 1715股份制1345非股份制|1839非股份制1496股份制2115非股份制 1461股份制 1345非股份制2218股份制1234非股份制1839股份制 1639股份制2167股份制1529非股份制1345非股份制1288股份制 1345非股份制1402股份制1461股份制1345非股份制1288非股份制 1602非股份制2115股份制3307股份制3389股份制1345非股份制 1839股份制2218股份制3833股份制981股份制1839非股份制 2365非股份制3575股份制1839股份制1345非股份制2613股份制
(3)对 LPM 的估计结果应做什么样的解释? (4)已知 9.67% 2 X2 = , X3 = 7.77%, X4 = 0.5933%, X5 = 3429 (千元),问债 券晋升 Aa 信用等级的概率有多大? 8.5 Greene 在分析讲授某门经济学课程采用新的教学方法效应时,搜集了如下表所示的 数据,其中,Grade 是学生在接受新教学方法(PSI, 1 0 PSI = 接受新教学方法 没有采用新方法 )后学习 成绩是否有所提高的虚拟变量, 1 0 GRADE = 有所提高 没有提高 ,其他变量分别为平均级点 GPA, 非期末考试成绩分数 TUCE。试用 Logit 模型对此进行估计,并分析相应的边际效应。 obs GRADE GPA TUCE PSI obs GRADE GPA TUCE PSI 1 0.000000 2.660000 20.00000 0.000000 17 0.000000 2.750000 25.00000 0.000000 2 0.000000 2.890000 22.00000 0.000000 18 0.000000 2.830000 19.00000 0.000000 3 0.000000 3.280000 24.00000 0.000000 19 0.000000 3.120000 23.00000 1.000000 4 0.000000 2.920000 12.00000 0.000000 20 1.000000 3.160000 25.00000 1.000000 5 1.000000 4.000000 21.00000 0.000000 21 0.000000 2.060000 22.00000 1.000000 6 0.000000 2.860000 17.00000 0.000000 22 1.000000 3.620000 28.00000 1.000000 7 0.000000 2.760000 17.00000 0.000000 23 0.000000 2.890000 14.00000 1.000000 8 0.000000 2.870000 21.00000 0.000000 24 0.000000 3.510000 26.00000 1.000000 9 0.000000 3.030000 25.00000 0.000000 25 1.000000 3.540000 24.00000 1.000000 10 1.000000 3.920000 29.00000 0.000000 26 1.000000 2.830000 27.00000 1.000000 11 0.000000 2.630000 20.00000 0.000000 27 1.000000 3.390000 17.00000 1.000000 12 0.000000 3.320000 23.00000 0.000000 28 0.000000 2.670000 24.00000 1.000000 13 0.000000 3.570000 23.00000 0.000000 29 1.000000 3.650000 21.00000 1.000000 14 1.000000 3.260000 25.00000 0.000000 30 1.000000 4.000000 23.00000 1.000000 15 0.000000 3.530000 26.00000 0.000000 31 0.000000 3.100000 21.00000 1.000000 16 0.000000 2.740000 19.00000 0.000000 32 1.000000 2.390000 19.00000 1.000000 8.6 依据下列大型超市的调查数据,分析股份制因素是否对销售规模产生影响。 销 售 规模 性质 销 售 规模 性质 销 售 规模 性质 销 售 规模 性质 销 售 规模 性质 1345 非股份制 1566 非股份制 2533 股份制 1144 非股份制 1461 非股份制 2435 股份制 1187 非股份制 1602 非股份制 1566 股份制 1433 股份制 1715 股份制 1345 非股份制 1839 非股份制 1496 股份制 2115 非股份制 1461 股份制 1345 非股份制 2218 股份制 1234 非股份制 1839 股份制 1639 股份制 2167 股份制 1529 非股份制 1345 非股份制 1288 股份制 1345 非股份制 1402 股份制 1461 股份制 1345 非股份制 1288 非股份制 1602 非股份制 2115 股份制 3307 股份制 3389 股份制 1345 非股份制 1839 股份制 2218 股份制 3833 股份制 981 股份制 1839 非股份制 2365 非股份制 3575 股份制 1839 股份制 1345 非股份制 2613 股份制
1234非股份制1972股份制1926股份制2165非股份制 练习题参考解答 练习题8.1参考解答 (1)由lX=1→X=27183,也就是说,人均收入每增加1.7183倍,平均意义上各 国的期望寿命会增加939岁。若当为富国时,D=1,则平均意义上,富国的人均收入每增 加1.7183倍,其期望寿命就会减少3.36岁,但其截距项的水平会增加23.52,达到21.12的 水平。但从统计检验结果看,对数人均收入lnX对期望寿命Y的影响并不显著。方程的拟 合情况良好,可进一步进行多重共线性等其他计量经济学的检验 (2)若D=1代表富国,则引入D(nX-7)的原因是想从截距和斜率两个方面考证富国 的影响,其中,富国的截距为(-240+336×7=2112),斜率为(939-336=603) 因此,当富国的人均收入每增加1.7183倍,其期望寿命会增加603岁 (3)对于贫穷国,设定D={1若为贫穷国 0若为富国·则引入的虚拟解释变量的形式为 D(7-lnX);对于富国,回归模型形式不变 练习题83参考解答 考虑到班次有三个属性,故在有截距项的回归方程中只能引入两个虚拟变量,按加法形 式引入,模型设定形式为 =B1+B2D1+B3D2+ 10其他’2=1中班 其中,为产出,=早班 l0其他 在 Eviews中按下列格式录入数据: 34.00000 1.000000 0.000000 37.00000 l.000000 0.000000 35.00000 l.000000 0.000000 33.00000 l.000000 33.00000 1.000000 35.00000 1.000000 36.00000 l.000000 0.000000 49.00000 0.000000 L000000 47.00000 0.000000 51.00000 48.00000 0.000000 5000000 0.000000 L000000
1234 非股份制 1972 股份制 1926 股份制 2165 非股份制 练习题参考解答 练习题 8.1 参考解答: (1)由 ln 1 2.7183 X X = = ,也就是说,人均收入每增加 1.7183 倍,平均意义上各 国的期望寿命会增加 9.39 岁。若当为富国时, Di =1 ,则平均意义上,富国的人均收入每增 加 1.7183 倍,其期望寿命就会减少 3.36 岁,但其截距项的水平会增加 23.52,达到 21.12 的 水平。但从统计检验结果看,对数人均收入 lnX 对期望寿命 Y 的影响并不显著。方程的拟 合情况良好,可进一步进行多重共线性等其他计量经济学的检验。 (2)若 Di =1 代表富国,则引入 D X i i (ln 7 − ) 的原因是想从截距和斜率两个方面考证富国 的影响,其中,富国的截距为 (− + = 2.40 3.36 7 21.12) ,斜率为 (9.39 3.36 6.03 − = ) , 因此,当富国的人均收入每增加 1.7183 倍,其期望寿命会增加 6.03 岁。 (3) 对于 贫穷 国, 设定 1 0 Di = 若为贫穷国 若为富国 ,则 引入 的虚 拟解 释变 量的 形式为 ( (7 ln )) D X i i − ;对于富国,回归模型形式不变。 练习题 8.3 参考解答: 考虑到班次有三个属性,故在有截距项的回归方程中只能引入两个虚拟变量,按加法形 式引入,模型设定形式为: Y D D u i i = + + + 1 2 1 3 2 其中, Yi 为产出, 1 1 0 D = 早班 其他 , 2 1 0 D = 中班 其他 。 在 Eviews 中按下列格式录入数据: obs Y D1 D2 1 34.00000 1.000000 0.000000 2 37.00000 1.000000 0.000000 3 35.00000 1.000000 0.000000 4 33.00000 1.000000 0.000000 5 33.00000 1.000000 0.000000 6 35.00000 1.000000 0.000000 7 36.00000 1.000000 0.000000 8 49.00000 0.000000 1.000000 9 47.00000 0.000000 1.000000 10 51.00000 0.000000 1.000000 11 48.00000 0.000000 1.000000 12 50.00000 0.000000 1.000000
51.0000 51.00000 0.000000 39.00000 0.000000 40.00000 0.000000 42.00000 0o0 0.000000 41.00000 0.000000 40.00000 0.00000 输入命令: Is y cd1d2,则有如下结果 Method: Least Squares Sample: 1 21 Included observations: 21 Variable Coefficient std error t-statistic Prob 40.428570.55532972.801150.0000 D1 860.785353-7.2760690.0000 D2 9.1428570.78535311.64171 0000 0. 952909 Mean dependent var 41.57143 Adjusted R-squared 0.947676 S.D.dependent var 6423 ession 1. 469262 Akaike info criterion Sum squared resid 38. 85714 Schwarz criterion 3.888178 36. 25909 F-statistic 182.1176 Durbin-Watson stat 2. 331933 Prob(F-statistic) 0.000000 表中的红字表示在方差分析中需要用到的数据。 依据上述数据,有 7SS=6423172×(21-1)=8251427708, RSS=38.85714 ESS=TSS-RSS=825.1427708-3885714=786.2856 F=182.1176 与如下表所示的结果(《统计学》表5-4,pp167(第2版))相比较,结果完全一致。 方差来源 离差平方和自由度方差F值 组间 786.286 2|393.143 182.118 组内 38.857 2.158 总和 825.143 练习题85参考解答 在 Eviews中按照给定数据进行录入,点击 Quick,录入 grade c gpa tuce psi,点击 method
13 51.00000 0.000000 1.000000 14 51.00000 0.000000 1.000000 15 39.00000 0.000000 0.000000 16 40.00000 0.000000 0.000000 17 42.00000 0.000000 0.000000 18 39.00000 0.000000 0.000000 19 41.00000 0.000000 0.000000 20 42.00000 0.000000 0.000000 21 40.00000 0.000000 0.000000 输入命令:ls y c d1 d2,则有如下结果 Dependent Variable: Y Method: Least Squares Date: 06/29/05 Time: 16:56 Sample: 1 21 Included observations: 21 Variable Coefficient Std. Error t-Statistic Prob. C 40.42857 0.555329 72.80115 0.0000 D1 -5.714286 0.785353 -7.276069 0.0000 D2 9.142857 0.785353 11.64171 0.0000 R-squared 0.952909 Mean dependent var 41.57143 Adjusted R-squared 0.947676 S.D. dependent var 6.423172 S.E. of regression 1.469262 Akaike info criterion 3.738961 Sum squared resid 38.85714 Schwarz criterion 3.888178 Log likelihood -36.25909 F-statistic 182.1176 Durbin-Watson stat 2.331933 Prob(F-statistic) 0.000000 表中的红字表示在方差分析中需要用到的数据。 依据上述数据,有: ( ) 2 TSS = − = 6.423172 21 1 825.1427708, RSS = 38.85714 ESS TSS RSS = − = − = 825.1427708 38.85714 786.2856 F =182.1176 与如下表所示的结果(《统计学》表 5-4,pp167(第 2 版))相比较,结果完全一致。 方差来源 离差平方和 自由度 方差 F 值 组间 786.286 2 393.143 182.118 组内 38.857 18 2.158 总和 825.143 20 练习题 8.5 参考解答 在 Eviews 中按照给定数据进行录入,点击 Quick,录入 grade c gpa tuce psi,点击 method
在下拉菜单中,选择 binary Wew Proc cb'ect Prink Name Freeze Estmate Forecast at Equation Estination nast vars all. followed by litt af Rimary estination Probi G Lori- Extreme raly es SHLS d AF) Censored wy truncated data (tobit 并选择 logit Estimation Bimary estination r tebi F Log f Extre val Artists om settinG二 hotbed: PFISART-Binary choice doat, abit, extreme value). 则有: ble- GRADE thod: ML- Binary Logit( Quadratic hill climbing) Date:06/29/05Time:17:44 Included observations: 32 Convergenceachieved after 5 iterations Covariance matrix computed using second derivatives Variable Coefficient Std. error z-Statistic 4.931324 640537 GPA 2.826l13 2.237723 TUCE 0.095158 0.141554 0.672235 0.5014 2.378688 1064564 2.234424 0.02 Mean dependent var 0. 343750 S D dependent var S E. of regression 0.384716 Akaike info criterion 4. 144 171 Schwarz criterion 1238819 Loglikelihood 12.88963 Hannan-Quinncriter. 1.116333
在下拉菜单中,选择 binary: 并选择 logit, 则有: Dependent Variable: GRADE Method: ML - Binary Logit (Quadratic hill climbing) Date: 06/29/05 Time: 17:44 Sample: 1 32 Included observations: 32 Convergence achieved after 5 iterations Covariance matrix computed using second derivatives Variable Coefficient Std. Error z-Statistic Prob. C -13.02135 4.931324 -2.640537 0.0083 GPA 2.826113 1.262941 2.237723 0.0252 TUCE 0.095158 0.141554 0.672235 0.5014 PSI 2.378688 1.064564 2.234424 0.0255 Mean dependent var 0.343750 S.D. dependent var 0.482559 S.E. of regression 0.384716 Akaike info criterion 1.055602 Sum squared resid 4.144171 Schwarz criterion 1.238819 Log likelihood -12.88963 Hannan-Quinn criter. 1.116333
Restr. loglikelihood -20.59173 Avg loglikelihood 15.40419 McFadden R-squared 0.374038 Probability(LR stat) Obs with Dep=0 21 Total obs Obs with Dep=l lI 2.826)(0.534 边际效应等于f(x)=018910050018 2379(0499 13.02135+2.8261×3.1172+0.0952×21.9375+2.3787×0.4375 其中,f()= 1+e 1+e 13.02135+2.8261×3.1172+0.0952×21.9375+2.3787×0.4375 0.3387 =0.188988746≈0.189 (1+0.3387) TUCE Mean 3.ll7188 3.065000 22.50000 0.000000 Maximum 4.000000 29.00000 000000 Minimum 12.00000 Std Dev 0.466713 0.504016 0.122657 0.251976 2.570068 3.048305 1.473728 5.338708 0.849296 0.478612 0.069297 Sum 99.75000 702.0000 14.00000 Sum Sq Dev 6.752447 471.8750
Restr. log likelihood -20.59173 Avg. log likelihood -0.402801 LR statistic (3 df) 15.40419 McFadden R-squared 0.374038 Probability(LR stat) 0.001502 Obs with Dep=0 21 Total obs 32 Obs with Dep=1 11 边际效应等于 ( ) 2.826 0.534 0.189 0.095 0.018 2.379 0.499 f = = Xβ β 其中, ( ) ( ) ( ) 13.02135 2.8261 3.1172 0.0952 21.9375 2.3787 0.4375 2 2 13.02135 2.8261 3.1172 0.0952 21.9375 2.3787 0.4375 1 1 e e f e e − + + + − + + + = = + + Xβ Xβ Xβ ( ) 2 0.3387 0.188988746 0.189 1 0.3387 = = + GPA TUCE PSI Mean 3.117188 21.93750 0.437500 Median 3.065000 22.50000 0.000000 Maximum 4.000000 29.00000 1.000000 Minimum 2.060000 12.00000 0.000000 Std. Dev. 0.466713 3.901509 0.504016 Skewness 0.122657 -0.525110 0.251976 Kurtosis 2.570068 3.048305 1.063492 Jarque-Bera 0.326695 1.473728 5.338708 Probability 0.849296 0.478612 0.069297 Sum 99.75000 702.0000 14.00000 Sum Sq. Dev. 6.752447 471.8750 7.875000 Observations 32 32 32