试卷代号:1318 座位号■■ 中央广播电视大学2012一2013学年度第二学期“开放本科”期末考试(半开卷) 社会统计学 试题 2013年7月 题 号 二 三 四 总 分 分 数 得分 评卷人 一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确 答案的序号,填写在题中的括号内。每小题2分,共20分) 1.从含有N个元素的总体中,抽取个元素作为样本,同时保证总体中每个元素都有相 同的机会入选样本,这样的抽样方式称为( )。 A.简单随机抽样 B.系统抽样 C.整群抽样 D.分层抽样 2.某地区2001一2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110, 111,114,115,下列哪种图形最适合描述这些数据()。 A.茎叶图 B.环形图 C.饼图 D.线图 3.如果一组数据中某一个数值的标准分值为一1.5,这表明该数值( A.是平均数的一1.5倍 B.比平均数少1.5 C.等于一1.5倍标准差 D.比平均数低1.5个标准差 4.某班级10名同学期末统计课考试分数分别为76、93、95、80、92、83、88、90、92、72,那么 该班考试成绩的中位数是( ) A.89 B.72 C.88 D.95 5.某班级学生期末英语考试平均成绩为75分,标准差为10分。如果已知这个班学生的 考试分数服从正态分布,可以判断成绩在65一85之间的学生大约占全班学生的()。 A.68% B.89% C.90% D.95% 1480
试卷代号 座位号rn 中央广播电视大学 3学年度第二学期"开放本科"期未考试(半开卷) 社会统计学试题 2013 年7 |题号 l一|二|三|四|总分| |分数 I I I I I 得分|评卷人 一、单项选择题{在各题的备选答案中,只有 1项是正确的,请将正确 答案的序号,填写在题中的括号内。每小题 2分,共 0分} 1.从含有 N个元素的总体中,抽取 n个元素作为样本,同时保证总体中每个元素都有相 同的机会人选样本,这样的抽样方式称为( )。 A. 样B. 统抽样 c.整群抽样 .分层抽样 2. 区2001 二2010 08 111 ,114 ,115 哪种 最适合描 )。 A. 图B. C. 图D. 3. 如果一组 某一个数 分值 1. )。 A.是平均数的一1. 5倍 .比平均数少1. C. 1.5 差D. 数低 1.5 4. 某班级10 名 同 未统 试分数分 为76 、93 、95 、80 、92 、83 、88 、90 、92 、72 该班考试成绩的中位数是( )。 A. 89 C. 88 B. 72 D. 95 5. 学生 末英 考试 成绩为75 准差 为10 考试分数服从正态分布,可以判断成绩在 5之间的学生大约占全班学生的( )。 A. 68% B. 89% c. 90% D. 95% 1480
6.已知某单位平均月收人为3500元,离散系数为0.2,那么他们月收入的标准差为()。 A.700 B.0.2 C.3500 D.175000 7.在假设检验中,不拒绝虚无假设意味着( )。 A.虚无假设是肯定正确的 B.虚无假设肯定是错误的 C.没有证据证明虚无假设是正确的 D.没有证据证明虚无假设是错误的 8.在因变量的总离差平方和中,如果回归平方和所占的比例越大,则两变量之间()。 A.相关程度越高 B.相关程度越低 C.完全相关 D.没有任何关系 9.从两个总体中各选取了6个观察值,得到组间平方和为234,组内平方和为484,则组 间方差和组内方差分别为()。 A.234,121 B.117,121 C.234,48.4 D.117,81 10.在回归方程中,若回归系数等于0,这表明( A.因变量y对自变量x的影响是不显著的 B.自变量x对因变量y的影响是不显著的 C.因变量y对自变量x的影响是显著的 D.自变量×对因变量y的影响是显著的 得分 评卷人 二、名词解释(每题4分,共20分)】 11.总体与样本 12.抽样分布 13.二维表 14.相关系数 15.组内均方 1481
6. 某单位平 为3500 为0.2 )。 A. 700 C. 3500 B. 0.2 D. 175000 7. 假设检验 无假设意味着 )。 A. 无假设 定正 B. 假设 错误 C. 无假设 D. 无假设 8. 变量 总离 平方 例越大 两变量 )。 A. 高B. 越低 C. D. 没有任何关 9. 了6 和 为 2 3 平方 和 为 4 8 4 间方差和组内方差分别为( )。 A. 234 ,121 C. 234 ,48.4 B. 117 ,121 D. 117 ,81 10. 方程 于0 这表 )。 A. 变量x 是不显 B. 是不显著 C. 变量 变量x D. 变量 变量 得分 l评卷人 二、名词解释{每题 1. 12. 抽样 13. 二维表 14. 15. 1481
得分 评卷人 三、简答题(每题10分,共30分) 16.简要说明社会研究过程。 17.按测度水平,变量可分为哪几类?并举例说明。 18.简要举例说明在分析双变量的关系时,T检验和卡方检验的主要区别。 得 分 评卷人 四、计算题(每题15分,共30分) 19.某公司招聘职员时,要求对职员进行两项基本能力测试。已知,A项测试中平均分数 为90分,标准差是12分;B项测试中平均分数为200分,标准差为25分。一位应试者在A项 测试中得了102分,在B项测试中得了215分。若两项测试的成绩均服从正态分布,该位应试 者哪一项测试更理想? 20.某公司欲了解广告费用x对销售量y的影响,收集了20个地区的数据,并对x、y进 行线性回归分析,得到:方程的截距为364,回归系数为1.42,回归平方和SSR=1602708.6,残 差平方和SSE=40158.07。要求: (1)写出广告费用x与销售量y之间的线性回归方程。 (2)假如广告费用投人50000元,根据回归方程估计商品销售量。 (3)计算判定系数R2,并解释它的意义。 1482
|得分|评卷人| I I I 三、简答题{每题 0分,共 0分} 16. 要说 社会研 过程 17. 水平 变量可 为哪几类 18. 双变 ,T 方检 主要 |得分|评卷人| I I I 四、计算题{每题 5分,共 0分) 19. 聘职 进行两 基本能力 测 ,A 平均 0分,标准差是 2分 B项测试中平均分数为 2 0 0分,标准差为 5分。一位应试者在 A项 测试中得了 2分,在 B项测试中得了 5分。若两项测试的成绩均服从正态分布,该位应试 者哪-项测试更理想? 20. 某公 解广告 用x 对销 收集 了20 对x 行线性回归分析,得到:方程的截距为 3 6 4,回归系数为1.钮,回归平方和 SS 6,残 差平方和 4 0 7。要求: (1)写出广告费用 x与销售量 y之间的线性回归方程。 (2) 费 用 入50000 根据 (3)计算判定系数配,并解释它的意义。 1482
试卷代号:1318 中央广播电视大学2012一2013学年度第二学期“开放本科”期末考试(半开卷) 社会统计学 试题答案及评分标准 (供参考) 2013年7月 一、单项选择题(每小题2分,共20分) 1.A 2.D 3.D 4.A 5.A 6.A 7.D 8.A 9.C 10.B 二、名词解释(每题4分,共20分) 11.总体与样本 总体是构成它的所有个体的集合,个体则是构成总体的最基本的单位。(2分) 样本就是从总体中按照一定方式抽取的一部分个体的集合。(2分) 12.抽样分布 抽样分布是指样本统计量的概率分布,它是在重复选取容量为的样本时,由每个样本计 算出来的统计量值的相对频数分布。(4分) 13.二维表 二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是 同属于两个变量的不同类的数据,也称为列联表。(4分) 14.相关系数 相关系数是对变量之间线性相关关系的程度和方向的度量。当研究两个变量之间的相关 关系时我们称之为简单相关系数。(2分)相关系数r的取值在一1~1之间。当r=1时,说明 两变量之间存在完全正相关;而当r=一1时,两变量之间完全负相关。当0<r<1时,两变量 之间存在正线性相关;而当一1<r<0时,两变量之间存在负线性相关。相关系数r=0时,只 能说变量之间不存在线性相关,而不能说它们之间一定不相关。(2分) 15.组内均方 均方是用各误差除以他们的自由度。(2分)组内均方记作MSE,就是用组内平方和除以 它的自由度,其自由度为全部观察值个数减去因素水平个数,即n一k。(1分)其计算公式为: MsE-组自蛋资和-。1分) 自由度 1483
试卷代号 中央广播电视大学 3学年度第二学期"开放本科"期末考试(半开卷) 社会统计学试题答案及评分标准 (供参考) 2013 年7 一、单项选择题{每小题 2分,共 0分} l. A 6.A 2.D 7.D 3. D 8.A 4.A 9. C 5. A 10. B 二、名词解释{每题 4分,共 0分} 1. 样本 总体是构成它的所有个体的集合,个体则是构成总体的最基本的单位。 2分) 样本就是从总体中按照一定方式抽取的一部分个体的集合。 2分〉 12. 抽样 抽样分布是指样本统计量的概率分布,它是在重复选取容量为 n的样本时,由每个样本计 算出来的统计量值的相对频数分布。 4分) 13. 二维表就是行列交叉的表格,将两个变量一个分行排放,一个分列排放,行列交叉处就是 同属于两个变量的不同类的数据,也称为列联表。 4分〉 14. 相关 相关系数是对变量之间线性相关关系的程度和方向的度量。当研究两个变量之间的相关 关系时我们称之为简单相关系数。 2分〉相关系数 r的取值在一 1之间。当 l时,说明 两变量之间存在完全正相关;而当 l时,两变量之间完全负相关。当 < 1时,两变量 之间存在正线性相关 F而当一 O时,两变量之间存在负线性相关。相关系数 O时,只 能说变量之间不存在线性相关,而不能说它们之间一定不相关。 2分) 15. 均方是用各误差除以他们的自由度。 2分)组内均方记作 E,就是用组内平方和除以 它的自由度,其自由度为全部观察值个数减去因素水平个数,即 (l分〉其计算公式为 MSE= = 旦 (1 自由度 1483
三、简答题(每题10分,共30分) 16.简要说明社会研究过程。 一项系统、完整的社会研究通常遵循着比较固定的过程,一般包括五个主要过程:提出问 题;形成假设;收集数据;分析数据,检验假设。 (1)提出问题是社会研究的第一步,研究者应首先明确要做什么,或者说进行研究的目的 是什么。(2分) (2)研究问题往往是无法直接检验的,而是要把研究问题形成假设才可以进行检验。假设 是对两个变量间关系的陈述,是对它们关系的尝试性回答。假设中的变量是相对具体的,是可 以通过经验可测的。(2分) (3)收集数据是社会研究的关键步骤。这一阶段要确定收集的变量、收集的方法、收集的 总量等。这一阶段所需投人的人力、物力最多,遇到的问题也最多,因而需要进行很好的组织 和管理。(2分) (4)分析数据主要是对收集的原始数据进行系统的审核、整理、归类、统计和分析。我们既 要进行描述性统计,说明数据的总体情况,又要进行推断性统计,从收集的样本状况来推断研 究总体的状况。(2分) (5)完成对数据的统计分析后,我们要根据对数据的分析来检验我们之前的假设和理论。 当结果支持我们的假设时,我们就对研究问题得到了解释;当结果不支持我们的假设时,要回 过头来修改我们的问题和假设,开始新的一轮检验。(2分) 17.按测度水平,变量可分为哪几类?并举例说明。 按照测度水平,变量可以分为定类变量、定序变量、定距变量和定比变量四类。 (1)定类变量:当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其 它特征时,这种变量称为定类变量。(1分)定类变量是最低层次的变量。例如性别可以分为 男、女两类。(1分) (2)定序变量:当变量值的含义不仅表示个体的不同类别,还可以区分个体之间大小、程度 等序次差异时,这种变量称为定序变量。(1分)受教育程度是定序变量,可以分为文盲、小学、 初中、高中、大专及以上等。(1分) (3)定距变量:当变量值不仅可以将个体区分为不同类型并进行排序,而且可以确定不同 类别之间的数量差别和间隔差距时,这样的变量称为定距变量。(1分)定距变量具有测量单 位,这些测量单位具有不变的相等区间的标准,使个体之间的比较更具客观性。(1分)智商、 温度等都是定距变量。(1分) 1484
三、简答题(每题 0分,共 0分} 16. 社会 一项系统、完整的社会研究通常遵循着比较固定的过程,一般包括五个主要过程:提出问 题;形成假设 收集数据 5分析数据 E检验假设。 (1)提出问题是社会研究的第一步,研究者应首先明确要做什么,或者说进行研究的目的 是什么。 2分〉 (2) 是无 接检 形成 检验 是对两个变量间关系的陈述,是对它们关系的尝试性回答。假设中的变量是相对具体的,是可 以通过经验可测的。 2分) (3) 是社会 步骤 这一 收集 收集 总量等。这一阶段所需投入的人力、物力最多,遇到的问题也最多,因而需要进行很好的组织 和管理。 2分) (4) 据主 是对 原始 进行 们 既 要进行描述性统计,说明数据的总体情况,又要进行推断性统计,从收集的样本状况来推断研 究总体的状况。 2分〉 (5) 完成对数 析后 我们要根据对数 检验 之前 当结果支持我们的假设时,我们就对研究问题得到了解释;当结果不支持我们的假设时,要回 过头来修改我们的问题和假设,开始新的一轮检验。 2分〉 17. 测度 并举 按照测度水平,变量可以分为定类变量、定序变量、定距变量和定比变量四类。 (1)定类变量 z当变量值的含义仅表示个体的不同类别,而不能说明个体的大小、程度等其 它特征时,这种变量称为定类变量。(l分〉定类变量是最低层次的变量。例如性别可以分为 男、女两类。(l分〉 (2) 定序变 义不仅表 个体 分个 等序次差异时,这种变量称为定序变量。(l分)受教育程度是定序变量,可以分为文盲、小学、 初中、高中、大专及以上等。(l分) (3) 将个体 而且 类别之间的数量差别和间隔差距时,这样的变量称为定距变量。(l分)定距变量具有测量单 位,这些测量单位具有不变的相等区间的标准,使个体之间的比较更具客观性。(l分〉智商、 温度等都是定距变量。(l分) 1484
(4)定比变量:除了上述三种变量的全部特征外,还可以计算两个变量值之间的比值时,这 样的变量称为定比变量。(1分)定比变量是最高层次的变量。(1分)在社会调查中,很多情况 下我们使用的都是定比变量,例如身高、年龄、收人、一个地区的人口数、某产品的生产量等。 (1分) 18.简要举例说明在分析双变量的关系时,T检验和卡方检验的主要区别。 分析双变量关系时,T检验和卡方检验都是主要用于检验这两个变量之间是否存在显著 关系。(2分)T检验主要用于对一个为数值型变量、另一个为分类变量且只有两个类别的变 量的双变量关系的统计显著性检验。(2分)卡方检验主要用于对两个分类变量之间的相关性 进行统计检验,判断变量之间是否存在显著关系。(2分)例如,我们想考察收入与性别是否存 在关系,或者两性的收人是否存在显著差异,可以用两独立样本T检验。(2分)如果我们想考 察职业与性别是否存在关系,而职业和性别都是分类变量,那么可以用卡方检验考察不同性别 之间职业是否存在显著差异。(2分) 四、计算题(每题15分,共30分】 19.Z=X4。-4=102290=1 (5分) SA 12 乙。=-。@=215200=0.6 25 (5分) 该测试者在A项考试中比平均分高出1个标准差,而在B项考试中比平均分高出0.6个 标准差。因而,可以说该测试者A项测试比较理想。(5分) 20.(1)y=364+1.42x (3分) (2)当x=50000时,y=364+1.42×50000=71364 (4分) SSR (3)RSSRSSE =1602708.6÷(1602708.6+40158.07) =1602708.6÷1642866.67 =0.97556 (5分) 表明在商品销售量的总变差中,有97.6%可以由回归方程解释,说明回归方程的拟合程 度很高。(3分) 1485
(4) 变量 全部 征外 的 比 样的变量称为定比变量。(1分)定比变量是最高层次的变量。(1分〉在社会调查中,很多情况 下我们使用的都是定比变量,例如身高、年龄、收入、一个地区的人口数、某产品的生产量等。 (1分) 18. 简要 析双 ,T 检验和 卡 检验 分析双变量关系时, T检验和卡方检验都是主要用于检验这两个变量之间是否存在显著 关系。 2分 T检验主要用于对一个为数值型变量、另一个为分类变量且只有两个类别的变 量的双变量关系的统计显著性检验。 2分)卡方检验主要用于对两个分类变量之间的相关性 进行统计检验,判断变量之间是否存在显著关系。 2分)例如,我们想考察收入与性别是否存 在关系,或者两性的收入是否存在显著差异,可以用两独立样本 T检验。 2分)如果我们想考 察职业与性别是否存在关系,而职业和性别都是分类变量,那么可以用卡方检验考察不同性别 之间职业是否存在显著差异。 2分〉 四、计算题{每题 5分,共 0分) 19. ZA =坠二主=旦旦二 =1 (5 SA 12 ZB= 该测试者在 A项考试中比平均分高出 1个标准差,而在 B项考试中比平均分高出 6个 标准差。因而,可以说该测试者 A项测试比较理想。 5分) 20. (1 ) y= 364+ 1. 42x (3 (2) 当x=50000 ,y=364+ 1. 42X50000=71364 (4 ? SSR (3)R2 =一-一一一 SSR+SSE =1602708.67 (1602708. 6+ 40158. 07) =1602708.671642866.67 =0.97556 (5 表明在商品销售量的总变差中,有9 7 %可以由回归方程解释,说明回归方程的拟合程 度很高。(3分) 1485