试卷代号:1318 座位号■ 中央广播电视大学2013一2014学年度第一学期“开放本科”期末考试(半开卷) 社会统计学试题 2014年1月 题 号 一 二 三 四 总 分 分 数 得 分 评卷人 一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确 答案的序号,填写在题中的括号内。每小题2分,共20分) 1.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系 统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为() A.简单随机抽样 B.系统抽样 C.整群抽样 D.分层抽样 2.在频数分布表中,某一小组中数据个数占总数据个数的比例称为() A.频率 B.频数 C.频次 D.频谱 3.某专业共8名同学,他们的统计课成绩分别为86、77、97、94、82、90、83、92,那么该班考 试成绩的中位数是() A.86 B.77 C.90 D.88 4,经验法则表明,当一组数据正态分布时,在平均数加减2个标准差的范围之内大约有 ( ) A.50%的数据 B.68%的数据 C.95%的数据 D.99%的数据 5.残差平方和(SSE)反映了y的总变差中() A.由于x与y之间的线性关系引起的y的变化部分 B.除了x对y的现有影响之外的其他因素对y变差的影响 C,由于x与y之间的非线性关系引起的y的变化部分 D.由于x与y之间的函数关系引起的y的变化部分 1435
试卷代号 座位号IT] 中央广播电视大学 4学年度第一学期"开放本科"期未考试(半开卷) 社会统计学试题 2014 年1 一、单项选择题 i在各题的备选答案中,只有 1项是正确的,请将正确 答案的序号,填写在题中的括号内。每小题 2分,共 0分} 1.先将总体按某标志分为不同的类别或层次,然后在各个类别中采用简单随机抽样或系 统抽样的方式抽取子样本,最后将所有子样本合起来作为总样本,这样的抽样方式称为( ) A.简单随机抽样 .系统抽样 C. 样D. 层抽 2. 在频数分 一小组 个数 ) C. A. 次D. 率B. 3. 共8 为86 77 、97 、94 、82 、90 、83 、92 试成绩的中位数是( ) A. 86 B. 77 C. 90 D. 88 4. 一组 据正态 在平 减2 ( ) |题号|一|二|三|四|总分| |分数 I I I I I |得分|评卷人| I I I A.50% 据B.68% C.95% 据D.99% 5. 残差平 和(SSE) 变差 ) A. 线性 B. 现有影 之外 变差 C. 非线性 D. 于X 间 的 数关系 引 变化部分 1435
6,某项研究中欲分析受教育年限每增长一年,收人如何变化,下列哪种方法最合适() A.回归分析 B.方差分析 C.卡方检验 D.列联表分析 7.用样本统计量的值构造一个置信区间,作为总体参数的估计,这种方法称为( A。点估计 B.区间估计 C.有效估计 D.无偏估计 8.在假设检验中,虚无假设和备择假设( A,都有可能成立 B.都不可能成立 C.有且只有一个成立 D.备择假设一定成立,虚无假设不一定成立 9.方差分析的目的是() A,比较不同总体的方差是否相等 B.判断总体是否存在方差 C.分析各样本数据之间是否存在显著差异 D.研究各分类自变量对数值型因变量的影响是否显著 10.用于说明回归方程中拟合优度的统计量主要是() A.相关系数 B.离散系数 C.回归系数 D.判定系数 得 分 评卷人 二、名词解释(每题4分,共20分)】 11.概率抽样 12.普查 13.置信水平 14.离散系数 15.独立样本与配对样本 得 分 评卷人 三、简答题(每题10分,共30分】 16.按测度水平,变量可分为哪几类?举例说明。 17.举例简要说明社会研究过程。 18.一元线性回归模型中有哪些基本假定? 1436
6. 欲分 方法最 ) A. 析B.方差 C. 验D. 联表 7. 区间 体参数 方法称 ) A. 计B.区间 有效估计D. 8. 检验 无假设 备择 ) A. 有可能成立 B. C. 有一 成立 D. 择假 定成 元假 不一定成立 9. 方差 ) A.比较不同总体的方差是否相等 B. 判断 方差 C. 存在显 D. 究各分 10. ) A. 数B. C. 数D. |得分|评卷人| I I\| 二、各调解释{每题4分,共 0分} 11. 抽样 12. 13. 水平 14. 15. 独立样 配对样本 |得分|评卷人| I I I 三、简答题{每题 0分,共 0分} 16. 水平 为哪儿类 17. 社会研究过程 18. 一元 模型 基本假定 1436
得分 评卷人 四、计算题(每题15分,共30分) 19.某行业管理局所属40个企业2011年产品销售额数据如下所示。 40个企业2011年产品销售额 企业编号 销售额 企业编号 销售额 企业编号 销售额 企业编号 销售额 1 152 11 105 21 103 31 136 2 105 12 123 22 103 32 146 3 117 13 116 23 137 33 127 97 14 115 24 138 34 135 5, 124 15 110 25 91 35 117 6 119 16 115 26 118 36- 113 7 108 17 100 27 120 37 104 8 88 18 87 28 112 38 125 9 129 19 107 29 95 39 108 10 115 20 119 30 142 40 126 要求: (1)对2011年销售额按由低到高进行排序,求出众数、中位数和平均数。 (2)如果按照规定,销售额在125万元以上的为先进企业,115万一125万之间的为良好企 业,105万一115万之间的为一般企业,105万以下的为落后企业,请按先进企业、良好企业、一 般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率。 20.某单位为研究其商品的广告费用(x)对其销售量(y)的影响,收集了过去12年的有关 数据。通过分析得到以下结果: 方差分析表 变差来源 SS df MS F Sig. 回归 1602708.6 B D F 0.000 残差 40158.08 C E 总计 A 11 要求: (1)计算上面方差分析表中A、B、C、D、E、F处的值。 (2)商品销售量的变差中有多少是由广告费用的差异引起的? (3)销售量与广告费用之间的相关系数是多少? 1437
|得分|评卷人| I I I 四、计算题{每题 5分,共 0分} 19. 某行业 属40 个企业2011 年产 销售 40 业2011 销售 企业编号 销售额 企业编号 销售额 企业编号 销售额 企业编号 销售额 1 152 11 105 21 103 31 136 2 105 12 123 22 103 32 146 3 117 13 116 23 137 33 127 4 97 14 115 24 138 34 135 5 124 15 110 C'~5 91 35 117 6 119 16 115 26 118 36 113 7 108 17 100 27 120 37\ 104 8 88 18 87 28 112 38 125 9 129 19 107 29 95 39 108 10 115 20 119 30 142 40 126 要求 (1)对 11年销售额按由低到高进行排序,求出众数、中位数和平均数。 (2) 果按 销售 在125 进企业 ,115 万-125 间 的 业, 5万一11 5万之间的为一般企业, 5万以下的为落后企业,请按先进企业、良好企业、一 般企业、落后企业进行分组,编制频数分布表,并计算累积频数和累积频率。 20. 对其 收集 去12 数据。通过分析得到以下结果 方差分析表 变差来源 SS d£ MS F Sig. 回归 1602708.6 B D F 0.000 残差 40158.08 C f E 总计 A 11 要求 (1)计算上面方差分析表中 A、 B、 C、 D、 E、 F处的值。 (2) 销售 变差 费用 (3) 间 的 1437
试卷代号:1318 中央广播电视大学2013一2014学年度第一学期“开放本科”期末考试(半开卷) 社会统计学 试题答案及评分标准 (供参考) 2014年1月 一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中 的括号内。每小题2分,共20分) 1.D 2.A 3.D 4.C 5.B 6.A 7.B 8.C 9.D 10.D 二、名词解释(每题4分,共20分) 11.概率抽样 概率抽样就是按照随机原则进行的抽样,(2分)总体中每个个体都有一定的、非零的概率 人选样本,并且人选样本的概率都是已知的或可以计算的。(2分) 12.普查 普查是一种专门的调查,它是为了某种特定的目的而对总体中所有的个体进行的一次全 面调查。(2分)普查一般是一次性或周期性的,有统一的标准调查时点。普查具有信息全面、 完整的特点,可以为其它抽样调查提供依据。但是,普查比较耗时、费力,成本比较高,而且适 用范围比较窄,调查内容不深人,只适合调查一些基本的、一般的社会现象。(2分) 13.置信水平 置信水平就是将构造置信区间的步骤重复很多次,置信区间包含总体参数真值的次数所 占的比例。(4分) 14.离散系数 离散系数是一组数据的标准差与该数据均值之比,也称为变异系数。(4分) 15.独立样本与配对样本 独立样本是指我们得到的样本是相互独立的。(2分) 配对样本就是一个样本中的数据与另一个样本中的数据相对应的两个样本。(1分)配对 样本可以消除由于样本指定的不公平造成的差异。(1分) 三、简答题每题10分,共30分) 16.按测度水平,变量可分为哪几类?并举例说明。 按照测度水平,变量可以分为定类变量、定序变量、定距变量和定比变量四类。 (1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其 1438
试卷代号 中央广播电视大学 3一 4学年度第一学期"开放本科"期末考试{半开卷} 社会统计学试题答案及评分标准 〈供参考) 2014 年1 一、单项选择题{在各题的备选答案中.只有 1项是正确的,请将正确答冀的序号,填写在题申 的括号肉。每小题 2分,共 0分} 1. D 2.A 3.D 4. C 5.B 6. A 7. B 8. C 9. D 10. D 二、各调解释{每题 4分,共 0分} 1. 概率抽样 概率抽样就是按照随机原则进行的抽样, 2分〉总体中每个个体都有一定的、非零的概率 人选样本,并且人选样本的概率都是已知的或可以计算的. (2 12. 普查 普查是一种专门的调查,它是为了某种特定的目的而对总体中所有的个体进行的一次全 面调查. (2 普查 是一次性 统一 时点 普查 完整的特点,可以为其它抽样调查提供依据。但是,普查比较耗时、费力,成本比较高,而且适 用范围比较难,调查内容不深入,只适合调查一些基本的、一般的社会现象。 2分) 13. 水平 置信水平就是将构造置信区间的步骤重黯良多次,置信区间包含总体参数真值的次数所 占的比例。 4分) 14. 离散系数是一组数据的标准差与该数据均值之比,也称为变异系数。 4分〉 15. 独立样 独立样本是指我们得到的样本是相互独立的。 2分〉 配对样本就是一个样本中的数据与另一个样本中的数据相对应的两个样本。(l分)配对 样本可以消除由于样本指定的不公平造成的差异。(1分〉 三、简答题 t每题 0分,共 0分} 16. 度水 量可 并举 按照测度水平,变量可以分为定类变量、定序变量、定距变量和定比变量四类。 (1)定类变量 z当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其 1438
它特征时,这种变量称为定类变量。(1分)定类变量是最低层次的变量。例如性别可以分为 男、女两类。(1分) (2)定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度 等序次差异时,这种变量称为定序变量。(1分)受教育程度是定序变量,可以分为文盲、小学、 初中、高中、大专及以上等。(1分) (3)定距变量:当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同 类别之间的数量差别和间隔差距时,这样的变量称为定距变量。(1分)定距变量具有测量单 位,这些测量单位具有不变的相等区间的标准,使个体之间的比较更具客观性。(1分)智商、 温度等都是定距变量。(1分) (4)定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这 样的变量称为定比变量。(1分)定比变量是最高层次的变量。(1分)在社会调查中,很多情况 下我们使用的都是定比变量,例如身高、年龄、收人、一个地区的人口数、某产品的生产量等。 (1分) 17.简要说明社会研究过程。 一项系统、完整的社会研究通常遵循着比较固定的过程,一般包括五个主要过程:提出问 题:形成假设:收集数据:分析数据;检验假设。 (1)提出问题是社会研究的第一步,研究者应首先明确要做什么,或者说进行研究的目的 是什么。(2分) (2)研究问题往往是无法直接检验的,而是要把研究问题形成假设才可以进行检验。假设 是对两个变量间关系的陈述,是对它们关系的尝试性回答。假设中的变量是相对具体的,是可 以通过经验可测的。(2分) (3)收集数据是社会研究的关键步骤。这一阶段要确定收集的变量、收集的方法、收集的 总量等。这一阶段所需投入的人力、物力最多,遇到的问题也最多,因而需要进行很好的组织 和管理。(2分) (4)分析数据主要是对收集的原始数据进行系统的审核、整理、归类、统计和分析。我们既 要进行描述性统计,说明数据的总体情况,又要进行推断性统计,从收集的样本状况来推断研 究总体的状况。(2分) (5)完成对数据的统计分析后,我们要根据对数据的分析来检验我们之前的假设和理论。 当结果支持我们的假设时,我们就对研究问题得到了解释;当结果不支持我们的假设时,要回 过头来修改我们的问题和假设,开始新的一轮检验。(2分) 18.一元线性回归模型中有哪些基本假定? 一元线性回归模型的三个基本假定为: (1)误差项是一个期望值为0的随机变量;(3分) (2)对于所有的x值,误差项的方差都是相等的;(3分) 1439
它特征时,这种变量称为定类变量。(1分〉定类变量是最保层次的变量.例如性别可以分为 男、女两类 0分〉 (2) 定序变 义不仅表 体之 等序次差异时,这种变量称为定序变量。 o分)受教育程度是定序变量,可以分为文盲、小学、 初中、高中、大专及以上等。 o分〉 (3) 量值不仅可 将个 并进行 类别之间的数量差别和间隔差距时,这样的变量称为定距变量.(1分)定距变量具有测量单 位,这些测量单位具有不变的相等区间的标准,使个体之间的比较更具睿观性。(1分〉智商、 温度等都是定距变量。(l分〉 (4) 上述 变量 全部特征外 两个 间 的 样的变量称为定比变量。(1分〉定比变量是最高层次的变量.(1分〉在社会调查中,很多情况 下我们使用的都是定比变量,例如身高、年龄、收入、一个地区的人口数、某产品的生产量等. 17. 要说 会研 过程 一项系统、完整的社会研究通常遵循着比较固定的过程,一般包括五个主要过程 z提出问 z形成假设 收集数据 z分析数据 z检验假设. (1)提出问题是社会研究的第一步,研究者应首先明确要做什么,或者说进行研究的目的 是什么。 2分) (2) 研究 往是无 直接 要把 假设 行检 是对两个变量间关系的陈述,是对它们关系的尝试性回答。假设中的变量是相对具体的,是可 以通过经验可测的。 2分〉 (3) 据是社会研 关键 这一 阶 定 收 变量 收集 收集 总量等.这一阶段所需投人的人力、物力最多,遇到的问题也最多,因而需要进行很好的组织 和管理。 2分〉 (4) 据主要是对 始数据进 要进行描述性统计,说明数据的总体情况,又要进行推断性统计,从收集的样本状况来推断研 究总体的状况。 2分〉 (5) 成对 析后 我们 根据对数 之前 理论 当结果支持我们的假设时,我们就对研究问题得到了解释 s当结果不支持我们的假设时,要回 过头来修改我们的问题和假设,开始新的一轮检验。 2分〉 18. 线性 基本假定 一元线性回归模型的三个基本假定为 (1)误差项是一个期望值为 O的随机变量 3分) (2) 差都是 的;(3 1439
(3)误差项是一个服从正态分布的随机变量,相互独立,其余自变量x不相关。(4分) 四、计算题(每题15分,共30分) 19.(1)销售额由低到高排序:(5分) 87、88、91、95、97、100、103、103、104、105、105、107、108、108、110、112、113、115、115、115、 116、117、117、118、119、119、120、123、124、125、126、127、129、135、136、137、138、142、146、152 众数:115(1分) 中位数:115.5 (1分) 平均数又=X十X,十…十Xy N =(152+146+…+88+87)÷40 =4647÷40 =116.175 (3分) (2) 40个企业分组表 (5分) 按销售额分组(万元) 企业个数 频率(%) 先进企业 11 27.5 良好企业 12 30 一般企业 8 20 落后企业 ,9 22.5 合计 40 100 20.(1)方差分析表:(12分) 变差来源 SS df MS F Sig. 回归 1602708.6 1602708.6 399.1 0.000 残差 40158.08 10 4015.808 一 ÷ 总计 1642866.68 11 一 一 (2)R2= SSR_ 1602708.6 SST1642866.68 =0.9756 即商品销售量的变差中有97.56%是由广告费用引起的。 (2分) (3)销售量与广告费用之间的相关系数r=√R=√0.9756=0.9877 (1分) 1440
(3) 项是 服从 机变量 其余 (4 四、计算题{每题 19. (1)销售额由低到高排序 5分〉 87 、88 、91 、95 、97 、100 、103 、103 、104 、105 、105 、107 、108 、108 、110 、112 、113 、115 、115 、115 116 、117 、117 、118 、119 、119 、120 、123 、124 、125 、126 、127 、129 、135 、136 、137 、138 、142 、146 、152 众数 11 (1分〉 中位数: 115.5 (1分〉 十 … 平均数 = (1 · · · · 88 =4647+40 =116.175 (3 (2) 按销售额分组〈万元) 先进企业 良好企业 一般企业 落后企业 合计 20. (1)方盖分析表:(1 2分〉 40 业分组 企业个数 11 12 8 • 9 40 频率(%) 27.5 30 20 22.5 100 (5 变差来源 SS d£ MS F Sig. 回归 1602708.6 1 1602708.6 399. 1 0.000 -/ 残差 40158.08 10 4015.808 总计 1642866.68 11 • SSR 1602708.6 (2)R .~_v.v_~_._v'-~._v_ =0.9756 SST -1642866. 68 即商品销售量的变差中有 %是由广告费用引起的。 (3) 销售 广告 .jR2 .;o: =0. 9877 1440 (2 (l分〉