试卷代号:1318 座位号■■ 国家开放大学(中央广播电视大学)2015年秋季学期“开放本科”期末考试 社会统计学 试题(半开卷) 2016年1月 题 号 二 三 四 总 分 分 数 得 分 评卷人 一、单项选择题(每题只有一个正确答案,请将正确答案的字母填写 在括号内。每题2分,共20分)】 1.学校后勤集团想了解学校42000学生的每月生活费用,从中抽取3200名学生进行调 查,以推断所有学生的每月生活费用水平。这项研究的总体是()。 A.42000名学生 B.3200名学生 C.42000名学生的每月生活费用 D.3200名学生的每月生活费用 2.某地区20012010年人口总量(单位:万人)分别为98,102,103,106,108,109,110, 111,114,115,下列哪种图形最适合描述这些数据( )。 A.茎叶图 B.环形图 C.饼图 D.线图 3.某校期末考试,全校语文平均成绩为80分,标准差为3分,数学平均成绩为87分,标准 差为5分。某学生语文得了83分,数学得了97分,从相对名次的角度看,该生( )的成绩 考得更好。 A.数学 B.语文 C.两门课程一样 D.无法判断 4.正态分布中,均值相等时。值越小,则( )。 A.离散趋势越小 B.离散趋势越大 C.曲线越低平 D.变量值越分散 1155
试卷代号 :1318 座位号仁口 国家开放大学(中央广播电视大学 )2015 年秋季学期"开放本科"期末考试 社会统计学试题(半开卷) 2016 E |」才二[ |总分| 一、单项选择题{每题只有一个正确答案,请将正确答案的字母填写 在括号内。每题 分,共 20 分) 1.学校后勤集团想了解学校 42000 学生的每月生活费用,从中抽取 3200 名学生进行调 查,以推断所有学生的每月生活费用水平。这项研究的总体是( )。 A.42000 名学生 B.3200 名学生 C. 42000 名学生的每月生活费用 D.3200 名学生的每月生活费用 2. 某地区 2001 2010 年人口总量(单位:万人)分别为 98 102 103 106 108 109 110 11 1, 114 115 ,下列哪种图形最适合描述这些数据)。 A. 茎叶图 B. 环形图 c.饼图 D. 线图 3. 某校期末考试,全校语文平均成绩为 80 分,标准差为 分,数学平均成绩为 87 分,标准 差为 分。某学生语文得了 83 分,数学得了 97 分,从相对名次的角度看,该生( )的成绩 考得更好。 A. 数学 c.两门课程一样 4. 正态分布中,均值相等时 值越小,则( A. 离散趋势越小 C. 曲线越低平 B.语文 D.无法判断 B. 离散趋势越大 D.变量值越分散 1155
5.下表是某单位工作人员年龄分布表,该组数据的中位数出现在第( )组。 组别 按年龄分组(岁) 工作人员数(人) 1 20~24 6 2 25~29 14 3 30-34 24 7 3539 18 5 40~44 12 6 45~49 18 2 5054 14 d 5559 6 合计 112 A.第3组 B.第4组 C.第5组 D.第6组 6.离散系数的主要目的是()。 A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 7期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。如果学生的成绩是 正态分布,可以判断成绩在72分一88分之间的学生大约占总体的(·)。 A.95% B.68% C.89% D.90% 8.残差平方和(SSE)反映了y的总变差中()。 A.由于x与y之间的线性关系引起的y的变化部分 B.除了x对y的现有影响之外的其他因素对y变差的影响 C.由于x与y之间的非线性关系引起的y的变化部分 D.由于x与y之间的函数关系引起的y的变化部分 9.用于说明回归方程中拟合优度的统计量主要是()。 A.相关系数 B.离散系数 C.判定系数 D.回归系数 10.对消费的回归分析中,学历、年龄、户口、性别、收入都是自变量,其中收入的回归系数 为1.6,这表明()。 A.收人每增加1元,消费增加1.6元 B.消费每增加1元,收人增加1.6元 C.收入与消费的相关系数为1.6 D.收人对消费影响的显著性为1.6 1156
5. 下表是某单位工作人员年龄分布表,该组数据的中位数出现在第( )组。 A. C. 组别 1 2 3 4 5 6 7 8 按年龄分组(岁) 20~24 25~29 30~34 35~39 40~44 45~49 50~54 55~59 合计 工作人员数(人) B. D. 6 14 24 18 12 18 14 6 112 6. 离散系数的主要目的是( )。 A. 反映一组数据的平均水平 c.反映一组数据的离散程度 B. 比较多组数据的平均水平 D. 比较多组数据的离散程度 7. 期中考试中,某班级学生统计学平均成绩为 80 分,标准差为 分。如果学生的成绩是 正态分布,可以判断成绩在 72 分一部分之间的学生大约占总体的( )。 A.95% C.89% B.68% D.90% 8. 残差平方和 (SSE) 反映了 的总变差中( )。 A. 由于 之间的线性关系引起的 的变化部分 B. 除了 的现有影响之外的其他因素对 变差的影响 C. 由于 之间的非线性关系引起的 的变化部分 D. 由于 之间的函数关系引起的 的变化部分 9. 用于说明回归方程中拟合优度的统计量主要是)。 A. 相关系数 B. 离散系数 c.判定系数 D. 回归系数 10. 对消费的回归分析中,学历、年龄、户口、性别、收入都是自变量,其中收入的回归系数 为1. ,这表明( )。 1156 A. 收入每增加 元,消费增加1. 收入与消费的相关系数为1. B. 消费每增加 元,收入增加1. D. 收入对消费影响的显著性为1
得分 评卷人 二、名词解释(每小题5分,共20分) 11.虚无假设与替换假设 12.误差减少比例 13.整群抽样 14.置信水平 得分 评卷人 三、简答题(每题10分,共30分) 15.简述按照测量水平区分的四类变量,并举例说明。 16.简要说明如何对配对样本进行t检验。 17.简述什么是简单一元线性回归分析?其作用是什么? 被 分 评卷人 四、计算题(每题15分,共30分) 18.某农科院使用4种方法培育稻米,为确定哪种方法生产效率最高,随机划出40块试验 田,并指定每块试验田使用其中的一种方法。通过对每块试验田的产量进行分析得到下面的 方差分析表。请完成方差分析表并写出你的计算步骤。 变差来源 SS df MS F Sig. 组间 320 0.000 组内 6048 总计 39 1157
|得分|评卷人| | 二、名词解释{每小题 分,共 20 分) 1.虚无假设与替换假设 12. 误差减少比例 13. 整群抽样 14. 置信水平 |得分|评卷人| | 三、简答题{每题 10 分,共 30 分} 15. 简述按照测量水平区分的四类变量,并举例说明。 16. 简要说明如何对配对样本进行 检验。 17. 简述什么是简单一元线性回归分析?其作用是什么? |得分|评卷人| | 四、计算题{每题 15 分,共 30 分} 18. 某农科院使用 种方法培育稻米,为确定哪种方法生产效率最高,随机划出 40 块试验 田,并指定每块试验田使用其中的一种方法。通过对每块试验田的产量进行分析得到下面的 方差分析表。请完成方差分析表并写出你的计算步骤。 变差来源 SS df MS F Sig. 组间 320 0.000 卜一→一 组内 6048 总计 39 一一一一一一 1157
19.某行业管理局所属40个企业2011年产品销售额数据如下所示。 40个企业2011年产品销售额 企业编号 销售额 企业编号 销售额 企业编号 销售额 企业编号 销售额 1 152 11 105 21 103 31 136 2 105 12 123 22 103 32 146 3 117 13 116 23 137 33 127 4 97 14 115 24 138 34 135 5 124 15 110 25 91 35 117 6 119 16 115 26 118 36 113 7 108 17 100 27 120 37 104 8 88 18 87 28 112 38 125 9 129 19 107 29 95 39 108 10 115 20 119 30 142 40 126 要求: (1)对2011年销售额按由低到高进行排序,求出众数、中位数和平均数。 (2)如果按照规定,销售额在125万元以上的为先进企业,115万一125万之间的为良好企 业,105万一115万之间的为一般企业,105万以下的为落后企业,请按先进企业、良好企业、一 般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率。 1158
19. 某行业管理局所属 40 个企业 2011 年产品销售额数据如下所示。 40 个企业 2011 年产品销售额 企业编号 销售额 企业编号 销售额 企业编号 销售额 企业编号 销售额 1 152 11 105 21 103 31 136 2 105 12 123 22 103 32 146 3 117 13 116 23 137 33 127 4 97 14 115 24 138 34 135 D 124 15 110 25 91 35 117 6 119 16 115 26 118 36 113 7 108 17 100 27 120 37 104 8 88 18 87 28 112 38 125 9 129 19 107 29 95 39 108 10 115 20 119 30 142 40 126 要求: (1)对 2011 年销售额按由低到高进行排序,求出众数、中位数和平均数。 (2) 如果按照规定,销售额在 125 万元以上的为先进企业, 115 -125 万之间的为良好企 业, 105 115 万之间的为一般企业, 105 万以下的为落后企业,请按先进企业、良好企业、一 般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率。 1158
试卷代号:1318 国家开放大学(中央广播电视大学)2015年秋季学期“开放本科”期末考试 社会统计学 试题答案及评分标准(半开卷) (供参考) 2016年1月 一、单项选择题(每题2分,共20分) 1.A 2.D 3.A 4.A 5.B 6.D 7.A 8.B 9.C 10.A 二、名词解释(每小题5分,共20分) 11.虚无假设与替换假设:进行假设检验时,我们将需要通过样本信息来推断其正确与否 的命题称为虚无假设,也成为原假设或者零假设。(2分)如果虚无假设不成立,我们就拒绝虚 无假设,需要在另个一假设中进行选择,这就是替换假设。(3分) 12.误差减少比例:在预测变量Y的值时,知道变量X的值时所减少的误差(E1一E2)与总 误差E,的比值称为误差减少比例,简称PRE。(2分)PRE的取值范围为O一1,PRE值越大, 说明用变量X去预测变量Y时能够减少的误差所占的比例越大,即变量X与变量Y之间的 相关性越大:反之,PRE越小,说明变量X与变量Y之间的关系越弱。(3分) 13.整群抽样:先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取 些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。(5分) 14.置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数 真值的次数所占的比例。(5分) 三、简答题(每题10分,共30分) 15.简述按照测量水平区分的四类变量,并举例说明。(10分) (1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其 它特征时,这种变量称为定类变量。(2分)例如:性别(0.5分) (2)定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度 等序次差异时,这种变量称为定序变量。(2分)例如:学历(0.5分) (3)定距变量:当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同 类别之间的数量差别和间隔差距时,这样的变量称为定距变量。(2分)例如:智商(0.5分) (4)定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这 样的变量称为定比变量。与定距变量相比,定比变量中的“0”值有实际含义。(2分)例如:收 (0.5分) 16.简要说明如何对配对样本进行t检验。 配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本的t检验用于检 验两个相关的样本是否来自具有相同均值的总体。(2分) 在对配对样本进行t检验时,首先计算两个样本中每个对应变量之间的差值:(3分)然后 1159
试卷代号 :1318 国家开放大学(申央广播电视大学 )2015 年秋季学期"开放本科"期末考试 社会统计学 试题答案及评分标准(半开卷) (供参考) 2016 一、单项选择题{每题 分,共 20 分} 1. A 2. D 3. A 4. A 5. B 6.D 7.A 8.B 9.C 10.A 二、名词解释(每小题 分,共 20 分) 1.虚无假设与替换假设:进行假设检验时,我们将需要通过样本信息来推断其正确与否 的命题称为虚无假设,也成为原假设或者零假设。 (2 分)如果虚无假设不成立,我们就拒绝虚 无假设,需要在另个一假设中进行选择,这就是替换假设。 (3 分) 12. 误差减少比例:在预测变量 的值时,知道变量 的值时所减少的误差 (E -E 与总 误差 El 的比值称为误差减少比例,简称 PREo (2 )PRE 的取值范围为 0-1 PRE 值越大, 说明用变量 去预测变量 时能够减少的误差所占的比例越大,即变量 与变量 之间的 相关性越大;反之, PRE 越小,说明变量 与变量 之间的关系越弱。(3分) 13. 整群抽样:先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取 一些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。 (5 分) 11. 置信水平:置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数 真值的次数所占的比例。 (5 分) 三、简答题{每题 10 分,共 30 分) 15. 简述按照测量水平区分的四类变量,并举例说明。 00 分) (1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其 它特征时,这种变量称为定类变量。 (2 分)例如:性别 (0.5 分) (2) 定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度 等序次差异时,这种变量称为定序变量。 (2 分)例如:学历 (0.5 分) (3) 定距变量:当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同 类别之间的数量差别和间隔差距时,这样的变量称为定距变量。 (2 分)例如:智商 (0. 分) (4) 定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这 样的变量称为定比变量。与定距变量相比,定比变量中的 "0" 值有实际含义。 (2 分)例如:收 (0. 分) 16. 简要说明如何对配对样本进行 检验。 配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本的 检验用于检 验两个相关的样本是否来自具有相同均值的总体。 (2 分) 在对配对样本进行 检验时,首先计算两个样本中每个对应变量之间的差值 ;(3 分)然后 1159
再检验其差值的均值是否为零,(1分)如果差值的均值接近零(在给定的置信区间内),说明两 个总体均值在给定的置信水平上没有差异,(2分)如果差值的均值在置信区间外,则说明两个 总体均值在给定的置信水平上有差异。(2分) 17.什么是简单一元线性回归分析?其作用是什么? 简单回归分析是通过一定的数学表达式将两个变量间的线性关系进行描述,确定自变量 的变化对因变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关 系。(或者简单回归分析是对具有线性相关关系的两个变量之间(其中一个为自变量,另一个 为因变量)数量变化的一般关系进行分析,确定相应的数学关系式,以便进行估计或预测。) (4分) 其作用包括: (1)从已知数据出发,确定变量之间的数学关系式;(2分) (2)对变量间的关系式进行统计检验,考察自变量是否对因变量有显著影响;(2分) (3)利用所求出的关系式,根据自变量的取值估计或预测因变量的取值。(2分) 四、计算题(每题15分,共30分) 18.1.960(3分)、7008(2分)、3(3分)、36(2分)、168(3分)、1.90(2分) 变差来源 SS df MS F Sig. 组间 960 3 320 1.90 0.000 组内 6048 36 168 总计 7008 39 19.(1)销售额由低到高排序:(5分) 87、88、91、95、97、100、103、103、104、105、105、107、108、108、110、112、113、115、115、115、 116、117、117、118、119、119、120、123、124、125、126、127、129、135、136、137、138、142、146、152 众数:115 (1分) 中位数:115.5(1分) 平均数:又=X十X,+…Xy N =(152+146+…+88+87)÷40 =4647÷40 =116.175 (3分) (2)40个企业分组表(5分) 按销售额分组(万元) 企业个数 累计频数 频率(%) 累计频率 先进企业 11 11 27.5 27.5 良好企业 12 23 30 57.5 一般企业 8 31 20 77.5 落后企业 9 40 22.5 100 合计 40 100 1160
再检验其差值的均值是否为零,(1分〉如果差值的均值接近零(在给定的置信区间内) ,说明两 个总体均值在给定的置信水平上没有差异, <2 分)如果差值的均值在置信区间外,则说明两个 总体均值在给定的置信水平上有差异。 (2 分) 17. 什么是简单一元线性回归分析?其作用是什么? 简单回归分析是通过一定的数学表达式将两个变量间的线性关系进行描述,确定自变量 的变化对因变量的影响,是进行估计或预测的一种方法,侧重于考察变量之间的数量伴随关 系。(或者简单回归分析是对具有线性相关关系的两个变量之间(其中一个为自变量,另→个 为因变量)数量变化的→般关系进行分析,确定相应的数学关系式,以便进行估计或预测。) (4 分) 其作用包括: (1)从已知数据出发,确定变量之间的数学关系式 ;(2 分) (2) 对变量间的关系式进行统计检验,考察自变量是否对因变量有显著影响 ;(2 分) (3) 利用所求出的关系式,根据自变量的取值估计或预测因变量的取值。 (2 分〉 四、计算题{每题 15 分,共 30 分) 18. 1. 960(3 分)、 7008(2 分)、 3(3 分)、 36(2 分)、 168(3 分)、1. 90(2 分) 变差来源 SS df 1S F Sig. 组间 960 3 320 1. 90 0.000 组内 6048 36 168 总计 7008 39 19. (1)销售额由低到高排序 :(5 分) 87 88 91 95 97 100 103 103 104 105 105 107 108 108 110 112 113 115 115 115 116 117 117 118 119 119 120 123 124 125 126 127 129 135 136 137 138 142 146 152 众数: 115 (1分) 中位数 :115.5 (1分) ::-:: XI ,十… 平均数 :X=l k N =(1 52 146 十…… +88 87)-;-10 =4647-;-40 =116.175 (3 分) (2)40 个企业分组表(5 分) 按销售额分组(万兀) 企业个数 先进企业 11 良好企业 12 一般企业 8 落后企业 9 合计 40 1160 累计频数 频率<%) 累计频率 11 27.5 27.5 23 30 57.5 31 20 77. 5 40 22.5 100 100 1..._