第二次上机练习题答案 1.检验GDP增长率是否服从正态分布。给出相关统计量和检验过程 10 Series:GDPRATE Sample 1953 2006 Observations 54 Mean 0.115840 6 Median 0.112021 Maximm 0364070 Mnimm 0.162663 Std.Dev. 0.092917 Skewness 0.094712 Kurtosis 4.056345 Jarque-Bera 2591428 Probability 0.273702 0 -0.1 0.0 0.1 02 0.3 JB统计量计算为2.591428,相伴概率大于5%,没有理由拒绝GDP增长率服从正态分布的 原假设。从上图中GDP增长率的频数分布图来看,和正态分布的形状也比较接近。 2.计算pc的变异系数(序列的变异系数定义为OL.I00)。要求写出相关的EViews命令 Mx 和计算结果。 在命令行窗口中输入以下命令: Scalar v=@stdev(pc)/@mean(pc)*100 计算结果为153 3.利用1952年至2004年数据计算pc和gdp的简单相关系数(注意根据题目要求修改样本 区间)。先验地,你认为pc和gd即的简单相关系数的符号应该为正还是为负?为什么,请说 说你的理由。根据样本数据计算的简单相关系数的符号与先验知识一致吗? 在命令行窗口中输入以下命令: Scalar corpcgdp=@cor(pc,gdp) 计算结果为0.997。 先验地,居民消费总额与国内生产总值之间应该存在正相关关系,即简单相关系数的符号为 正。这是根据凯恩斯消费理论,消费与收入之间存在正相关关系。计算得到的结果与先验知 识一致。 4.已知两个序列的样本相关系数r,样本容量为n,在总体相关系数为0的原假设下,有
第二次上机练习题答案 1.检验 GDP 增长率是否服从正态分布。给出相关统计量和检验过程 0 2 4 6 8 10 -0.1 0.0 0.1 0.2 0.3 Series: GDPRATE Sample 1953 2006 Observations 54 Mean 0.115840 Median 0.112021 Maximum 0.364070 Minimum -0.162663 Std. Dev. 0.092917 Skewness -0.094712 Kurtosis 4.056345 Jarque-Bera 2.591428 Probability 0.273702 JB 统计量计算为 2.591428,相伴概率大于 5%,没有理由拒绝 GDP 增长率服从正态分布的 原假设。从上图中 GDP 增长率的频数分布图来看,和正态分布的形状也比较接近。 2.计算 pc 的变异系数(序列的变异系数定义为 ⋅100 X X μ σ )。要求写出相关的 EViews 命令 和计算结果。 在命令行窗口中输入以下命令: Scalar v=@stdev(pc)/@mean(pc)*100 计算结果为 153 3.利用 1952 年至 2004 年数据计算 pc 和 gdp 的简单相关系数(注意根据题目要求修改样本 区间)。先验地,你认为 pc 和 gdp 的简单相关系数的符号应该为正还是为负?为什么,请说 说你的理由。根据样本数据计算的简单相关系数的符号与先验知识一致吗? 在命令行窗口中输入以下命令: Scalar corpcgdp=@cor(pc,gdp) 计算结果为 0.997。 先验地,居民消费总额与国内生产总值之间应该存在正相关关系,即简单相关系数的符号为 正。这是根据凯恩斯消费理论,消费与收入之间存在正相关关系。计算得到的结果与先验知 识一致。 4.已知两个序列的样本相关系数 r,样本容量为 n,在总体相关系数为 0 的原假设下,有
r√n-2 V1-r2 ~-2),请对3中计算的样本相关系数进行假设检验,检验其总体相关系数是 否为O?请给出检验过程(包括完成计算所需执行的EViews语句)和计算结果。 Scalar t=@cor(pc,gdp)*(@obs(gdp)-2)0.5/(1-@cor(pc,gdp)2)0.5 计算结果为88.73 Scalar tprob=1-@ctdist(t,@obs(gdp)-2) 计算结果为0<5%,因此拒绝总体相关系数为零的原假设,即pc和gdp显著相关。 5.新建一个工作文件,数据频率为undated,.范围从1到l0,基于该工作文件,新建一段 程序文件,输入以下内容,并解释下面这段程序的含义 for !i=1 to 500 series a!i=@rtdist(10) 做500次循环,每次循环生成一个序列,总共10个样 本点(在新建工作文件时已经指定好),每个样本 点由函数生成一个随机数,满足自由度为10的t分 布。 next vector(500)mean 生成一个有500行的列向量,命名为mean for !i=1 to 500 做500次循环,每次循环将第个序列(已由以上三行 程序生成)的样本均值赋给列向量(已由以上第四 行程序生成)中的第个元素。 mean(!i)=@mean(a!i) next 6.按下列步骤完成操作(注意,本题与题5相关,即用到题5中的程序) (I)新建一个workfile,命名为workfile01,通过选择相关选项,使该工作文件中的 数据为截面数据,总共有10个样本点(题5中己要求完成)。 (2)在Eviews主窗口中点击File→New→Program,新建一个程序文件,命名为progr, 并在文件编辑窗口中输入以上题5中给出的程序语句(题5中己要求完成)。然 后点击程序文件窗口(Program窗口)中的run,即运行该程序。 (3)将计算结果mean输出到一个Excel文件中,该文件命名为meanl0。 (4)再新建一个workfile,命名为workfile0(2,选择workfile frequency为undated or irregular,.起始点和截止点分别为1和500(提示:用于保存向量对象mean中 的500个元素)。 (5)将meanl0.xs中的数据导入到workfile02中,将序列命名为meanl0
2 2 ~ ( 2) 1 r n t n r − − − ,请对 3 中计算的样本相关系数进行假设检验,检验其总体相关系数是 否为 0?请给出检验过程(包括完成计算所需执行的 EViews 语句)和计算结果。 Scalar t=@cor(pc,gdp)*(@obs(gdp)-2)^0.5/(1-@cor(pc,gdp)^2)^0.5 计算结果为 88.73 Scalar tprob=1-@ctdist(t,@obs(gdp)-2) 计算结果为 0<5%,因此拒绝总体相关系数为零的原假设,即 pc 和 gdp 显著相关。 5.新建一个工作文件,数据频率为 undated,范围从 1 到 10,基于该工作文件,新建一段 程序文件,输入以下内容,并解释下面这段程序的含义 for !i=1 to 500 series a!i=@rtdist(10) 做500次循环,每次循环生成一个序列,总共10个样 本点(在新建工作文件时已经指定好),每个样本 点由函数生成一个随机数,满足自由度为10的t分 布。 next vector(500) mean 生成一个有500行的列向量,命名为mean for !i=1 to 500 做500次循环,每次循环将第i个序列(已由以上三行 程序生成)的样本均值赋给列向量(已由以上第四 行程序生成)中的第i个元素。 mean(!i)=@mean(a!i) next 6.按下列步骤完成操作(注意,本题与题 5 相关,即用到题 5 中的程序) (1) 新建一个 workfile,命名为 workfile01,通过选择相关选项,使该工作文件中的 数据为截面数据,总共有 10 个样本点(题 5 中已要求完成)。 (2) 在Eviews主窗口中点击File→New→Program,新建一个程序文件,命名为progr, 并在文件编辑窗口中输入以上题 5 中给出的程序语句(题 5 中已要求完成)。然 后点击程序文件窗口(Program 窗口)中的 run,即运行该程序。 (3) 将计算结果 mean 输出到一个 Excel 文件中,该文件命名为 mean10。 (4) 再新建一个 workfile,命名为 workfile02,选择 workfile frequency 为 undated or irregular,起始点和截止点分别为 1 和 500(提示:用于保存向量对象 mean 中 的 500 个元素)。 (5) 将 mean10.xls 中的数据导入到 workfile02 中,将序列命名为 mean10
(6) 画出序列meanl0的直方图,并计算描述性统计值(在以下空白部分列出)。 60 Series:MEAN10 50 Sample 1500 Observations 500 40 Mean 0.011655 Median 0.002750 30 Maximum 0.997328 Minimum -1.647475 Std.Dev. 0.350784 20 Skewness 0.231426 Kurtosis 3.561717 10 Jarque Bera 11.03660 Probability 0.004013 0 國圆恩圈 -1.5 -1.0 -0.5 0.0 0.5 1.0 根据Jarque-Bera检验,拒绝正态分布的原假设 (7)改变workfile01中的样本区间,使样本容量变为100(提示:依次点击workfile 窗口中的Procs/Change wrokfile range和Procs/Sample进行修改。并且注意相应 的excel文件命名为meanl00,workfile02中的序列命名为mean100),重复以上 (1)(6)过程。 60 Series:MEAN100 Sample 1 500 50 Observations 500 40 Mean 0.007504 Median 0.010143 Maximum 0.310389 30 Minimum -0.286969 Std.Dev. 0.104244 20 Skewness 0.118327 Kurtosis 2864191 10 Jarque-Bera 1.551022 Probability 0.460468 0 -0.3 -02 -0.1 0.0 0.1 0.2 0.3 根据Jarque-Bera检验,没有充分的理由拒绝正态分布的原假设,接受原假设。其实当 样本容量超过30,样本均值已经比较接近正态分布了,这里我们考虑的样本容量为100。 (8)改变workfile01中的样本区间,使样本容量变为2000,重复以上(1)(6)过程 (excel文件命名为mean2000,workfile(02中的序列命名为mean2000)
(6) 画出序列 mean10 的直方图,并计算描述性统计值(在以下空白部分列出)。 0 10 20 30 40 50 60 -1.5 -1.0 -0.5 0.0 0.5 1.0 Series: MEAN10 Sample 1 500 Observations 500 Mean -0.011655 Median -0.002750 Maximum 0.997328 Minimum -1.647475 Std. Dev. 0.350784 Skewness -0.231426 Kurtosis 3.561717 Jarque-Bera 11.03660 Probability 0.004013 根据 Jarque-Bera 检验,拒绝正态分布的原假设 (7) 改变 workfile01 中的样本区间,使样本容量变为 100(提示:依次点击 workfile 窗口中的 Procs/Change wrokfile range 和 Procs/Sample 进行修改。并且注意相应 的 excel 文件命名为 mean100,workfile02 中的序列命名为 mean100),重复以上 (1)~(6)过程。 0 10 20 30 40 50 60 -0.3 -0.2 -0.1 0.0 0.1 0.2 0.3 Series: MEAN100 Sample 1 500 Observations 500 Mean 0.007504 Median 0.010143 Maximum 0.310389 Minimum -0.286969 Std. Dev. 0.104244 Skewness -0.118327 Kurtosis 2.864191 Jarque-Bera 1.551022 Probability 0.460468 根据 Jarque-Bera 检验,没有充分的理由拒绝正态分布的原假设,接受原假设。其实当 样本容量超过 30,样本均值已经比较接近正态分布了,这里我们考虑的样本容量为 100。 (8) 改变 workfile01 中的样本区间,使样本容量变为 2000,重复以上(1)~(6)过程 (excel 文件命名为 mean2000,workfile02 中的序列命名为 mean2000)
50 Series:MEAN2000 Sample 1 500 40 Observations 500 Mean 0.001616 30 Median 0.001452 Maximum 0.081544 Minimum 0.088879 20 Std.Dev. 0.025901 Skewness -0.116033 Kurtosis 2.955873 10 Jarque Bera 1.162535 图 Probability 0.559189 0+ -0.075-0.050-0.0250.0000.0250.0500.075 同样,根据Jarque-Bera检验,接受样本均值服从正态分布原假设,并且此时的JB统计 量比(7)中的小。 (9)至此,你已经分别得到样本容量为10、100和2000的样本均值(每种情况下都 可以计算得到500个样本均值),这些样本是来自于一个自由度为10的t分布, 通过对比三种情况下的直方图和描述性统计值,你得到什么规律?这个规律可 用课堂上讲授的统计学知识解释吗?如果可以,请解释。 总结上述三种不同样本容量计算得到的样本均值的分布,可以验证中心极限定理。 随着样本容量n由10增加到100,再增加到2000,根据中心极限定理(见教材64页), 来自于任一总体的样本,随着样本容量的增大,其样本均值的分布会趋于一个正态分 布
0 10 20 30 40 50 -0.075-0.050-0.025 0.000 0.025 0.050 0.075 Series: MEAN2000 Sample 1 500 Observations 500 Mean 0.001616 Median 0.001452 Maximum 0.081544 Minimum -0.088879 Std. Dev. 0.025901 Skewness -0.116033 Kurtosis 2.955873 Jarque-Bera 1.162535 Probability 0.559189 同样,根据 Jarque-Bera 检验,接受样本均值服从正态分布原假设,并且此时的 JB 统计 量比(7)中的小。 (9) 至此,你已经分别得到样本容量为 10、100 和 2000 的样本均值(每种情况下都 可以计算得到 500 个样本均值),这些样本是来自于一个自由度为 10 的 t 分布, 通过对比三种情况下的直方图和描述性统计值,你得到什么规律?这个规律可 用课堂上讲授的统计学知识解释吗?如果可以,请解释。 总结上述三种不同样本容量计算得到的样本均值的分布,可以验证中心极限定理。 随着样本容量 n 由 10 增加到 100,再增加到 2000,根据中心极限定理(见教材 64 页), 来自于任一总体的样本,随着样本容量 n 的增大,其样本均值的分布会趋于一个正态分 布