《统计学》精品课程文件之五 《统计学》 实 验 指 导 书 重庆工商大学统计学院
《统计学》精品课程文件之五 13-1 《统计学》 实 验 指 导 书 重庆工商大学统计学院
《统计学》精品课程文件之五 2006-5-15
《统计学》精品课程文件之五 13-2 2006-5-15
第一章前言 1.1背景 1.2适用范围 第二章运行环境 2.1硬件环境 2.2软件环境 第三章实验目的和任务 6 3.1实验的目的… 3.2实验的任务 错误!未定义书签。 第四章实验内容 …错误!未定义书签。 4.1实验一直方图工具 错误!未定义书签。 4.2实验二季节变动时间序列的分解分析 错误!未定义书签 4.3实验三线性回归分析… 错误!未定义书签
13-3 第一章 前言...................................................................................................... 4 1.1 背景................................................................................................................... 4 1.2 适用范围......................................................................................................... 4 第二章 运行环境.......................................................................................... 5 2.1 硬件环境......................................................................................................... 5 2.2 软件环境......................................................................................................... 5 第三章 实验目的和任务........................................................................ 6 3.1 实验的目的..................................................................................................... 6 3.2 实验的任务.........................................................................错误!未定义书签。 第四章 实验内容...............................................................错误!未定义书签。 4.1 实验一 直方图工具.........................................................错误!未定义书签。 4.2 实验二 季节变动时间序列的分解分析...................错误!未定义书签。 4.3 实验三 线性回归分析...................................................错误!未定义书签
第一章前言 1.1背景 自20世纪60年代以后,统计学的发展有三个明显的趋势:第一,随着数学的发展,统 计学依赖和吸收的数学方法越来越多;第二,向其他学科领域渗透,或者说以统计学为基础 的边缘学科不断形成。2003年度诺贝尔经济学奖授予两位著名计量经济学家罗伯特恩格尔 ( Robert. Engle)和克莱夫格兰杰( Clivegranger)。20世纪80年代两位获奖者发明了新的统 计方法来处理许多经济时间数列中两个关键属性:时变性time- varyingvolatility)和非平稳性 ( nonstationarity),恩格尔硏究方向主要是利率、汇率和期权的金融计量分析,提出谱分析回 归等创新性统计方法:格兰杰的研究涉及统计和经济计量学,特别是时间序列分析、预测、 金融、人口统计学、方法论等领域。这足以证明统计方法应用的领域越来越广泛,可以应用 于各行各业的数据分析,使统计学成了一门“万能”的方法论学科。美国 SCIENCFY有 篇文章列出近百年来最有用的科学,统计高居前十名。 随着统计学应用日益广泛和深人,由于受计算机和新兴科学的影响,使统计学越来越依 赖于计算技术,成为数量分析的方法论科学。这一时期统计学的研究和应用范围越来越广。 比如海洋学中水面的高程,电磁能(特别是无线电波)的流量,工业过程的状态,生物的状 态,都能用计算机收集;没有计算机这些是不实际或不可能的。计算机节省了大量人力,特 别是在同样输出的重复计算上,例如在计算多元分析的相关系数和其它检验统计量时。由于 计算机软件SPSS和SAS可用于所有通常的检验,特别是关于方差分析,则节省更多时间 而且随着统计学发展的越来越快,它与计算机科学结合也就越紧密,也就会带来更大的社会 效益。因此,在高等学校尤其是财经、经贸、商业类高校的《统计学》教学中为了使学生能 够对所学知识和方法有更好地掌握,必须做好试验方面的教学。 1.2适用范围 我院设计的统计实验以及开发的实验环境主要用于统计、国际贸易、电子商务、企业管 理与信息系统、旅游管理、行政管理等专业本科《统计学》课程的辅助教学。另外,此套实 验也适用于统计机构、市场调查公司进行基础培训
13-4 第一章 前言 1.1 背景 自 20 世纪 60 年代以后,统计学的发展有三个明显的趋势:第一,随着数学的发展,统 计学依赖和吸收的数学方法越来越多;第二,向其他学科领域渗透,或者说以统计学为基础 的边缘学科不断形成。2003 年度诺贝尔经济学奖授予两位著名计量经济学家罗伯特·恩格尔 (RobertF.Engle)和克莱夫·格兰杰(CliveGranger)。20 世纪 80 年代两位获奖者发明了新的统 计方法来处理许多经济时间数列中两个关键属性:时变性(time-varyingvolatility)和非平稳性 (nonstationarity),恩格尔研究方向主要是利率、汇率和期权的金融计量分析,提出谱分析回 归等创新性统计方法;格兰杰的研究涉及统计和经济计量学,特别是时间序列分析、预测、 金融、人口统计学、方法论等领域。这足以证明统计方法应用的领域越来越广泛,可以应用 于各行各业的数据分析,使统计学成了一门“万能”的方法论学科。美国 SCIENCFY 有一 篇文章列出近百年来最有用的科学,统计高居前十名。 随着统计学应用日益广泛和深人,由于受计算机和新兴科学的影响,使统计学越来越依 赖于计算技术,成为数量分析的方法论科学。这一时期统计学的研究和应用范围越来越广。 比如海洋学中水面的高程,电磁能(特别是无线电波)的流量,工业过程的状态,生物的状 态,都能用计算机收集;没有计算机这些是不实际或不可能的。计算机节省了大量人力,特 别是在同样输出的重复计算上,例如在计算多元分析的相关系数和其它检验统计量时。由于 计算机软件 SPSS 和 SAS 可用于所有通常的检验,特别是关于方差分析,则节省更多时间。 而且随着统计学发展的越来越快,它与计算机科学结合也就越紧密,也就会带来更大的社会 效益。因此,在高等学校尤其是财经、经贸、商业类高校的《统计学》教学中为了使学生能 够对所学知识和方法有更好地掌握,必须做好试验方面的教学。 1.2 适用范围 我院设计的统计实验以及开发的实验环境主要用于统计、国际贸易、电子商务、企业管 理与信息系统、旅游管理、行政管理等专业本科《统计学》课程的辅助教学。另外,此套实 验也适用于统计机构、市场调查公司进行基础培训
第二章运行环境 2.1硬件环境 50个客户端同时在线时,本软件对服务器的要求: ◆CPU主频≥900MHZPⅢ及以上芯片 ◆内存 ◆硬盘转速≥7200转/分建议使用SCSI硬盘 100个客户端同时在线时,本软件对服务器的要求: CPU主频≥1.8GH缓存>1M至强系列芯片推荐使用双CPU ◆内存 1G ◆硬盘建议使用SCSI硬盘 另外,推荐服务器安装RAID卡,以保证数据的安全性 2.2软件环境 服务器端 ◆操作系统: Microsoft windows xi ◆数据库系统: Microsoft SQL Server2000 ◆运行平台:ⅡS5.0以上 客户端 ◆ Windows98及以上版本,正浏览器要求50以上, Microsoft word2000以 由于本软件为BS架构,维护较为方便,只需要保证服务器的正常运行就可以
13-5 第二章 运行环境 2.1 硬件环境 ➢ 50 个客户端同时在线时,本软件对服务器的要求: ◆ CPU 主频 ≥900MHZ PⅢ及以上芯片 ◆ 内存 ≥256M ◆ 硬盘 转速≥7200 转/分 建议使用 SCSI 硬盘 ➢ 100 个客户端同时在线时,本软件对服务器的要求: ◆ CPU 主频≥1.8GHZ 缓存>1M 至强系列芯片 推荐使用双 CPU ◆ 内存 ≥1G ◆ 硬盘 建议使用 SCSI 硬盘 ➢ 另外,推荐服务器安装 RAID 卡,以保证数据的安全性。 2.2 软件环境 ➢ 服务器端 ◆ 操作系统:Microsoft Windows XP ◆ 数据库系统:Microsoft SQL Server2000 ◆ 运行平台:IIS5.0 以上 ➢ 客户端: ◆ Windows 98 及以上版本,IE 浏览器要求 5.0 以上, Microsoft word 2000 以 上。 ➢ 由于本软件为 B/S 架构,维护较为方便,只需要保证服务器的正常运行就可以
第三章实验目的与任务 3.1实验目的 长期以来,我国高等教育中《统计学》课程的教学由于各种客观条件的限制只能以理论 教学为主,缺乏对于实践的操作。这种传统教学模式已不能适应新形式的需要。因为随着统 计学在经济、社会生活中更广泛和深入的应用以及市场调查分析方法的成熟与完善,脱离实 际的教学难以使学生对统计学有更深刻的感性认识,也难以使他们在今后的工作中熟练使用 统计的方法和软件。所以许多高校重视实践教学环节的开发和改革,希望能在教学中使用可 靠的实验系统,给学生提供一个高效的模拟实习环境。正是基于这种现实,我院在统计学实 验中设计的实验项目应使学生熟练掌握统计软件的基本操作,利用统计软件对简单的经济和 社会问题进行具体分析,激发他们学习统计学的兴趣,从感性层面更牢固地掌握统计学的知 识和方法,为他们将来在工作中熟练运用统计工具解决问题打下良好的基础。 3.2实验任务 《统计学》是一门基础课程,教学面向的学生也较多,因此本门课实验建议不使用难以 掌握的软件,一般使用 Microsoft excel作为实验教学软件。具体实验任务如下: 1.掌握 Excel的基本操作 2.掌握Exce的主要函数 2.掌握统计图表的编制,尤其要熟练掌握直方图的绘制方法 3.掌握一元线性回归的分析方法,了解t检验、F检验的内涵 4.掌握季节变动的分析方法
13-6 第三章 实验目的与任务 3.1 实验目的 长期以来,我国高等教育中《统计学》课程的教学由于各种客观条件的限制只能以理论 教学为主,缺乏对于实践的操作。这种传统教学模式已不能适应新形式的需要。因为随着统 计学在经济、社会生活中更广泛和深入的应用以及市场调查分析方法的成熟与完善,脱离实 际的教学难以使学生对统计学有更深刻的感性认识,也难以使他们在今后的工作中熟练使用 统计的方法和软件。所以许多高校重视实践教学环节的开发和改革,希望能在教学中使用可 靠的实验系统,给学生提供一个高效的模拟实习环境。正是基于这种现实,我院在统计学实 验中设计的实验项目应使学生熟练掌握统计软件的基本操作,利用统计软件对简单的经济和 社会问题进行具体分析,激发他们学习统计学的兴趣,从感性层面更牢固地掌握统计学的知 识和方法,为他们将来在工作中熟练运用统计工具解决问题打下良好的基础。 3.2 实验任务 《统计学》是一门基础课程,教学面向的学生也较多,因此本门课实验建议不使用难以 掌握的软件,一般使用 Microsoft Excel 作为实验教学软件。具体实验任务如下: 1.掌握 Excel 的基本操作; 2.掌握 Excel 的主要函数; 2.掌握统计图表的编制,尤其要熟练掌握直方图的绘制方法; 3.掌握一元线性回归的分析方法,了解 t 检验、F 检验的内涵; 4.掌握季节变动的分析方法
第四章实验内容 4.1直方图工具 (一)简介:直方图工具,用于在给定工作表中数据单元格区域和接收区 间的情况下,计算数据的个别和累积频率,可以统计有限集中某个数值元素的出现次数。例 如,在一个有50名学生的班级里,可以通过直方图确定考试成绩的分布情况,它会给出考 分出现在指定成绩区间的学生个数,而用户必须把存放分段区间的单元地址范围填写在在直 方图工具对话框中的“接收区域”框中 (二)操作步骤 1.用鼠标点击表中待分析数据的任一单元格。 2.选择“工具”菜单的“数据分析”子菜单。 3.用鼠标双击数据分析工具中的“直方图”选项。 4.出现“直方图”对话框,对话框内主要选项的含义如下: 输入区域:在此输入待分析数据区域的单元格范围。 接收区域(可选):在此输入接收区域的单元格范围,该区域应包含一组可选的用来计算频 数的边界值。这些值应当按升序排列。 只要存在的话, Excel将统计在各个相邻边界值之间的数据出现的次数。如果省略此处的接 收区域, Excel将在数据组的最小值和最大值之间创建一组平滑分布的接收区间 标志:如果输入区域的第一行或第一列中包含标志项,则选中此复选框:如果输入区域没有 标志项,则清除此该复选框, Excel将在输出表中生成适宜的数据标志。 输出区域:在此输入结果输出表的左上角单元格的地址。如果输出表将覆盖已有的数据, Excel会自动确定输出区域的大小并显示信息。 柏拉图:选中此复选框,可以在输出表中同时显示按降序排列频率数据。如果此复选框被清 除, Excel将只按升序来排列数据 累积百分比:选中此复选框,可以在输出结果中添加一列累积百分比数值,并同时在直方图 表中添加累积百分比折线。如果清除此选项,则会省略以上结果 图表输出:选中此复选框,可以在输出表中同时生成一个嵌入式直方图表 所选数据如图4-1所示
13-7 第四章 实验内容 4.1 直方图工具 (一)简介:直方图工具,用于在给定工作表中数据单元格区域和接收区 间的情况下,计算数据的个别和累积频率,可以统计有限集中某个数值元素的出现次数。例 如,在一个有 50 名学生的班级里,可以通过直方图确定考试成绩的分布情况,它会给出考 分出现在指定成绩区间的学生个数,而用户必须把存放分段区间的单元地址范围填写在在直 方图工具对话框中的“接收区域”框中。 (二)操作步骤: 1.用鼠标点击表中待分析数据的任一单元格。 2.选择“工具”菜单的“数据分析”子菜单。 3.用鼠标双击数据分析工具中的“直方图”选项 。 4.出现“直方图”对话框,对话框内主要选项的含义如下: 输入区域:在此输入待分析数据区域的单元格范围。 接收区域(可选):在此输入接收区域的单元格范围,该区域应包含一组可选的用来计算频 数的边界值。这些值应当按升序排列。 只要存在的话,Excel 将统计在各个相邻边界值之间的数据出现的次数。如果省略此处的接 收区域,Excel 将在数据组的最小值和最大值之间创建一组平滑分布的接收区间。 标志:如果输入区域的第一行或第一列中包含标志项,则选中此复选框;如果输入区域没有 标志项,则清除此该复选框,Excel 将在输出表中生成适宜的数据标志。 输出区域:在此输入结果输出表的左上角单元格的地址。如果输出表将覆盖已有的数据, Excel 会自动确定输出区域的大小并显示信息。 柏拉图:选中此复选框,可以在输出表中同时显示按降序排列频率数据。如果此复选框被清 除,Excel 将只按升序来排列数据。 累积百分比:选中此复选框,可以在输出结果中添加一列累积百分比数值,并同时在直方图 表中添加累积百分比折线。如果清除此选项,则会省略以上结果。 图表输出:选中此复选框,可以在输出表中同时生成一个嵌入式直方图表。 所选数据如图4—1所示
巴囟 入需要相的题 :12-1n1Ⅱ通国明萨,·A·昌 B C DEFG HIJKLy HA Sheet4入岛heet1/ Sheet2/shet3/ 5.按需要填写完“直方图”对话框之后,按“确定”按扭即可。 (三)结果说明:完整的结果通常包括三列和一个频率分布图,第一列是数值的区间范围, 第二列是数值分布的频数,第三列是频数分布的累积百分比。 输出结果如图4-2所示 文件Q)银①)视图Q拍入①)格式①工具①)数据①)窗口①帮动00 入需要枯动的阿题 8x·28 :1IⅡ课·△,△· GHI 累积% 直方图 频率 60.00·累积% SHEats/sheet1/ sheet2/sheet 13-8
13-8 图4—1 5.按需要填写完“直方图”对话框之后,按“确定”按扭即可。 (三)结果说明:完整的结果通常包括三列和一个频率分布图,第一列是数值的区间范围, 第二列是数值分布的频数,第三列是频数分布的累积百分比。 输出结果如图 4—2 所示。 图 4—2
4.2季节变动时间序列的分解分析 (一)简介:分解分析法是分析时间序列常用的统计方法。季节时间序列是趋势变动(T) 季节变动(S)、随杋变动(Ⅰ)综合影响的结果,分解过程要从原始序列中消除随机变动,然后 分别识别出季节变动和趋势变动的变化模式。下面结合具体例子介绍在 Excel中如何实现时 间序列的分解分析。如图4-3所示,表中A1至B13单元格是1996至1998年各季度某海滨 城市旅游人口数(千人),试预测1999年各季度旅游人口数 (二)操作步骤 1.计算一次移动平均,消除随机波动。在C3单元格填入公式“= AVERAGE(B2:B5)”,然后 用“填充柄”将公式复制到C4:C11单元格。 2.中心化移动平均数。在D4单元格输入公式“= AVERAGE(C3:C4)”,然后用“填充柄”将 公式复制到D5:D11单元格 3.计算各个季节指数。在E4单元格输入公式“=B4/E4”,然后用“填充柄”将公式复制 到E5:E11单元格。 4.计算平均季节指数。在F4单元格中输入公式“= AVERAGE(E4,E8)” 然后用“填充柄”将公式复制到F5:F7单元格。 季度人数一移动平均中心化移动平均季节指数平均节指数调整车节指教消除季节变动时司 2196177 0.67058843511482452721 19211514.75 0.87201625131.87827412 41993298157.7515251.9454186072831.8202726916377373 199415168.75163250.643190611271065122016480386 19:111 178 13750.65177065460.6705845168650672175 1992118425181.1250.87860817840.87201625182360486 81997.3335 11.re 1.820272369184.03839217 9199.4130201.5 197250.65906 0.6371223120404225388 1019981148210.25 2058750.71888 0.670588435220.70168879 19219321652133750.9045 0.872016252.3261471 12198.3370 1.82027289208266283811 13198415 0.637122931243281151212 141999 1 1519921 161993 111 11994 5.计算调整后的季节指数。为了让季节指数的总平均为1,必须对季节指数加以调整。在G4 单元格中输入公式“=F4/ AVERAGE(SF$4:$F$7)”,然后用“填充柄”将公式复制到G5:G7单 元格。G4:G7就是最终计算出的季节指数,按G4:G7给出的4个季度的季节指数,将季节指
13-9 4.2季节变动时间序列的分解分析 (一)简介:分解分析法是分析时间序列常用的统计方法。季节时间序列是趋势变动(T)、 季节变动(S)、随机变动(I)综合影响的结果,分解过程要从原始序列中消除随机变动,然后 分别识别出季节变动和趋势变动的变化模式。下面结合具体例子介绍在Excel 中如何实现时 间序列的分解分析。如图4—3 所示,表中A1 至B13 单元格是1996 至1998 年各季度某海滨 城市旅游人口数(千人),试预测1999 年各季度旅游人口数。 (二)操作步骤: 1.计算一次移动平均,消除随机波动。在C3 单元格填入公式“=AVERAGE(B2:B5)”,然后 用“填充柄”将公式复制到C4:C11 单元格。 2. 中心化移动平均数。在D4 单元格输入公式“=AVERAGE(C3:C4)”,然后用“填充柄”将 公式复制到D5:D11 单元格。 3. 计算各个季节指数。在E4 单元格输入公式“=B4/E4”,然后用“填充柄”将公式复制 到E5:E11 单元格。 4. 计算平均季节指数。在F4 单元格中输入公式“=AVERAGE(E4,E8)”, 然后用“填充柄”将公式复制到F5:F7 单元格。 图4—3 5. 计算调整后的季节指数。为了让季节指数的总平均为1,必须对季节指数加以调整。在G4 单元格中输入公式“=F4/AVERAGE($F$4:$F$7)”,然后用“填充柄”将公式复制到G5:G7 单 元格。G4:G7 就是最终计算出的季节指数,按G4:G7 给出的4 个季度的季节指数,将季节指
数填充到G2:G13的其它单元格 6.消除旅游人数序列中的季节变动。在H2单元格中输入“=B2/F2”, 然后用“填充柄”将公式复制到H3:H3单元格。则H列就是消除季节 变动之后的旅游人数时间序列。 7.对消除季节变动的旅游人数进行回归分析。在I列填入时间序号1至12,如图4-3所示 选择“工具”菜单的“数据分析”子菜单,双击“回归”选项,弹出回归分析对话框。按 图4一4所示的方式填写对话框。然后单击“确定”按扭,即可得到剔除了季节波动的时间序 列的线性趋势模型。估计结果如图4—5所示,其中B35单元格是线性趋势模型的截距,B36 单元格是斜率。 回归 输入 Y值输入区域( 1:H13写 匚确定 取消 X值输入区域(x): 1:1132 标志(L) 厂常数为零(2) 帮助(H 厂置信度(E 输出选项 G输出区域(): 3A19:136 C新工作表组(): C新工作薄(y) 残差 残差(R) 厂残差图(D) 标准残差(T 厂线性拟合图(D 正态分布 厂正态概率图(N 13-10
13-10 数填充到G2:G13 的其它单元格。 6. 消除旅游人数序列中的季节变动。在H2 单元格中输入“=B2/F2”, 然后用“填充柄”将公式复制到H3:H13 单元格。则H 列就是消除季节 变动之后的旅游人数时间序列。 7. 对消除季节变动的旅游人数进行回归分析。在I 列填入时间序号1至12,如图4—3 所示。 选择“工具”菜单的“数据分析”子菜单,双击“回归”选 项,弹出回归分析对话框。按 图4—4所示的方式填写对话框。然后单击“确定”按扭,即可得到剔除了季节波动的时间序 列的线性趋势模型。估计结果如图4—5 所示,其中B35 单元格是线性趋势模型的截距,B36 单元格是斜率。 图4—4