试卷代号:1318 座位■■ 中央广播电视大学2012一2013学年度第一学期“开放本科”期末考试(半开卷) 社会统计学 试题 2013年1月 题 号 二 三 四 总 分 分 数 得分 评卷人 一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确 答案的序号,填写在题中的括号内。每小题2分,共20分) 1.学校后勤集团想了解学校22000学生的每月生活费用,从中抽取2200名学生进行调 查,以推断所有学生的每月生活费用水平。这项研究的总体是() A.22000名学生 B.2200名学生 C.22000名学生的每月生活费用 D.2200名学生的每月生活费用 2.从变量分类看,下列变量属于定序变量的是() A.专业 B.性别 C.产品等级 D.收入 3.在频数分布表中,比率是指() A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.不同小组的频数之比 4.某地区2001-2010年人口总量(单位:万人)分别为98,102,103,106,108,109,110, 111,114,115,下列哪种图形最适合描述这些数据() A.茎叶图 B.环形图 C.饼图 D.线图 5.根据一个样本均值求出的90%的置信区间表明() A.总体均值一定落人该区间内 B.总体均值有90%的概率不会落人该区间内 C.总体均值有90%的概率会落人该区间内 D.总体均值有10%的概率会落入该区间内 1489
试卷代号 座位号 中央广播电视大学 2 0 3学年度第一学期"开放本科"期末考试(半开卷) 社会统计学试题 2013 年1 一、单项选择题{在各题的备选答案中,只有 1项是正确的,请将正确 答案的序号,填写在题中的括号内。每小题 2分,共 0分} 1.学校后勤集团想了解学校 0学生的每月生活费用,从中抽取 2 2 0名学生进行调 查,以推断所有学生的每月生活费用水平。这项研究的总体是( ) A. 22000 生B. 2200 学生 c. 22000 生活 用D. 2200 学生 费用 2. 变量 类看 变量 ) c. A. 业B. D. 收入 3. 数分布表 是指 ) A. 各组频数 频数 B. 组频数与下一组频 c.各组频数与总频数之比 D. 小组 4. 区2001-2010 为98 ,102 ,103 ,106 ,108 ,109 ,110 111 ,114 ,115 适合描述 些数 ) A. 图B. c.饼图 .线图 5. 一个样本 的90% 区 间 ) A. 一定落 区 间 B. 有90% 概率 c.总体均值有 %的概率会落入该区间内 D.总体均值有 %的概率会落入该区间内 |题号|一|二|三|四|总分| |分数 I I I I I |得分|评卷人| I I I 1489
6.判断下列哪一个不可能是相关系数() A.-0.89 B.0.34 C.1.32 D.0 7.期中考试中,某班级学生统计学平均成绩为80分,标准差为4分。如果学生的成绩是 正态分布,可以判断成绩在72分一88分之间的学生大约占总体的() A.95% B.68% C.89% D.90% 8.正态分布中,6值越小,则() A.离散趋势越小 B.离散趋势越大 C.曲线越低平 D.变量值越分散 9.下面哪一项不是方差分析中的假定( A.每个总体都服从正态分布 B.观察值是相互独立的 C.各总体的方差相等 D.各总体的方差等于O 10.对消费的回归分析中,学历、年龄、户口、性别、收人都是因变量,其中收人的回归系数 为0.8,这表明() A.收人每增加1元,消费增加0.8元 B.消费每增加1元,收人增加0.8元 C.收人与消费的相关系数为0.8 D.收入对消费影响的显著性为O.8 得分 评卷人 二、名词解释(每题4分,共20分】 11.抽样单位与抽样框 12.均值 13.散点图 14.抽样分布 15.虚无假设与替换假设 1490
6. 下列 ) A.一 B. 0.34 c. 1. 32 D. 0 7. 某班级学 学平均 为4 成绩是 正态分布,可以判断成绩在 2分 8分之间的学生大约占总体的( ) A. 95% B. 68% C. 89% D. 90% 8. 正态 越小 ) A. 小B. 趋势 c.曲线越低平 .变量值越分散 9. 一项不是 假定 ) A. 服从正态 布B. 察值是 C. 等D. 方差 于O 10. 年龄 性别 ) A. 每增加1 增加 B. 每增加1 增加 C. D. 显著 |得分|评卷人| I I I 二、名词解释{每题 4分,共 0分} 1 1. 样框 12. 13. 14. 15. 假设 假设 1490
得分 评卷人 三、简答题(每题10分,共30分) 16.等距分组和不等距分组有什么区别?请举例说明。 17.简述定类变量、定序变量和数值型变量集中趋势测量的方法。 18.如何对配对样本进行t检验。 得分 评卷人 四、计算题(每题15分,共30分) 19.甲单位人均月收入4500元,标准差1200元。乙单位月收入分布如下所示。 乙单位月收入分布表 按收人分组(元) 人数(个) 3000分以下 120 3000~4000 420 4000≈5000 540 50006000 420 6000以上 300 合计 1800 要求: (1)计算乙单位员工月收入的均值和标准差。 (2)比较甲单位和乙单位哪个单位员工月收人的离散程度更大?(提示:使用离散系数) 20.某汽车生产商欲了解广告费用(万元)对销售量(辆)的影响。他收集了过去12年的 有关数据,通过分析得到:方程的截距为363,回归系数为1.42,回归平方和SSR=1600,残差 平方和SSE=450。 要求: (1)写出销售量y与广告费用x之间的线性回归方程。 (2)假如明年计划投入广告费用为25万元,根据回归方程估计明年汽车销售量。 (3)计算判定系数R,并解释它的意义。 1491
|得分|评卷人| I I I 三、简答题{每题 0分,共 0分} 16. 不等距分 举例 17. 定类 数值 势测 18. 对配 进行 |得分|评卷人| I I I 四、计算题{每题 5分,共 0分} 19. 入4500 标准差1200 入分 入分 按收入分组(元〉 人数(个〉 3000 120 3000~4000 420 4000~5000 540 5000~6000 420 6000 300 合计 1800 要求 (1)计算乙单位员工月收入的均值和标准差。 (2) 位和 散程 (提示 z使用离散系数〉 20. 某汽车生 解广告 销 售 去12 有关数据,通过分析得到:方程的截距为 3,回归系数为1. 42 和SSR=1600 平方和 0。 要求: (1)写出销售量 y与广告费用 x之间的线性回归方程。 (2) 广告 为25 根据 年汽车 售量 (3) 数R 1491
试卷代号:1318 中央广播电视大学2012一2013学年度第一学期“开放本科”期末考试(半开卷) 社会统计学 试题答案及评分标准 (供参考) 2013年1月 一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中 的括号内。每小题2分,共20分】 1.A 2.C 3.D 4.D 5.C 6.C 7.A 8.B 9.D 10.A 二、名词解释(每题4分,共20分) 11.抽样单位与抽样框 抽样单位就是一次直接的抽样所使用的基本单位。(2分) 抽样框是指一次直接抽样时样本中所有抽样单位的名单。(2分) 12.均值 均值是集中趋势最主要的测量值。(1分)它是将全部数据进行加总然后除以数据总个 数,也称为算数平均数。(3分) 13.散点图 散点图是在坐标系中,用X轴表示自变量x,用Y轴表示因变量y,而变量组(x,y)则用坐 标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形 成的二维图就是散点图。(2分) 散点图是描述变量关系的一种直观方法,我们可以从散点图中直观的看出两个变量之间 是否存在相关关系、是正线性相关还是负线性相关,也可以大致看出变量之间关系强度如何。 (2分) 14.抽样分布 抽样分布是指样本统计量的概率分布,(2分)它是在重复选取容量为的样本时,由每个 样本计算出来的统计量值的相对频数分布。(2分) 15.虚无假设与替换假设 我们将需要通过样本信息来推断其正确与否的命题称为虚无假设,也称为原假设或零假 1492
试卷代号 中央广播电视大学 3学年度第一学期"开放本科"期未考试(半开卷) 社会统计学试题答案及评分标准 (供参考) 2013 年1 一、单项选择题{在各题的备选答案中,只有 1项是正确的,请将正确答案的序号,填写在题中 的括号肉。每小题 2分,共 0分) l. A 6.C 2. C 7.A 3. D 8. B 4.D 9.D 5. C 10.A 二、名词解释(每题4分,共 0分) 11. 单位与抽 抽样单位就是一次直接的抽样所使用的基本单位。2分) 抽样框是指一次直接抽样时样本中所有抽样单位的名单。2分) 12. 均值是集中趋势最主要的测量值。(l分)它是将全部数据进行加总然后除以数据总个 数,也称为算数平均数。(3分) 13. 散点图是在坐舔系中,用X轴表示自变量X,用 Y轴表示因变量y,而变量组 x, )则用坐 标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形 成的二维图就是散点图。 2分) 散点图是描述变量关系的一种直观方法,我们可以从散点图中直观的看出两个变量之间 是否存在相关关系、是正线性相关还是负线性相关,也可以大致看出变量之间关系强度如何。 (2 14. 抽样分布是指样本统计量的概率分布,2分)它是在重复选取容量为n的样本时,由每个 样本计算出来的统计量值的相对频数分布。 2分) 15. 虚无 替换假 我们将需要通过样本信息来推断其正确与否的命题称为虚无假设,也称为原假设或零假 1492
设。(2分) 如果虚无假设不成立,我们就拒绝虚无假设,需要在另一个假设中进行选择,这就是替换 假设。(2分) 三、简答题(每题10分,共30分) 16.等距分组和不等距分组有什么区别?请举例说明。 (1)在对数据进行分组时,如果各组组距相等,则称为等距分组。(2分)例如,分析某班同 学期末统计课成绩时,假如最低分为73分,最高分为98分,以5分为组距进行分组,分 为70-75分,75-80分,80—85分,85-90分,90一95分,95一100分。(3分) (2)如果各组组距不相等,则称为不等距分组。(2分)例如,在分析人口时,往往将人口分 为要幼儿组(0一6岁),少年儿童组(7一17岁),中青年组(18一59岁),老年人组(60岁及以 上),该分类中各组组距不相等,这就是不等距分组。(3分) 17.简述定类变量、定序变量和数值型变量集中趋势测量的方法。 定序变量是层次最低的变量,用众数作为其中心趋势的测量。(3分)定序变量主要使用 中位数、四分位数作为集中趋势的测量,同时也可以使用众数作为测量值,但是中位数和四分 位数利用序次关系,因而更多使用这两者。(3分)数值型数据(定距和定比数据)的集中趋势 测量指标是平均数,同样,数值型数据可以使用众数和中位数、四分位数作为中心趋势的测量, 但是更主要的是使用均值,因为均值利用所有数据信息。(4分) 18.如何对配对样本进行t检验。 配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本的t检验用于检 验两个相关的样本是否来自具有相同均值的总体。(2分)在对配对样本进行t检验时,首先 计算两个样本中每个对应变量之间的差值:(3分)然后再检验其差值的均值是否为零,(1分) 如果差值的均值接近零(在给定的置信区间内),(2分)说明两个总体均值在给定的置信水平 上没有差异,如果差值的均值在置信区间外,则说明两个总体均值在给定的置信水平上有差 异。(2分) 四、计算题(每题15分,共30分) 19.(1)均值: X=BX+F2X,+…+FX F1+F2+…+Fk =(2500×120+3500×420+4500×540+5500×420+6500×300)÷1800 =8460000÷1800 1493
设。 如果虚无假设不成立,我们就拒绝虚无假设,需要在另一个假设中进行选择,这就是替换 假设。 2分〉 三、简答题{每题 0分,共 0分} 16. 么 区 (1)在对数据进行分组时,如果各组组距相等,则称为等距分组。 2分〉例如,分析某班同 学期末统计课成绩时,假如最低分为 3分,最高分为 8分,以 5分为组距进行分组,分 5分, 0分, 5分, 0分, 5分, 5一 0分。 3分) (2) 各组组 不等距分 。(2 例如 往往将人 为婴幼儿组 6岁) ,少年儿童组 7岁) ,中青年组(1 9岁) ,老年人组 0岁及以 上) ,该分类中各组组距不相等,这就是不等距分组。 3分〉 17. 定类变量 数值型变量集 趋势 定序变量是层次最低的变量,用众数作为其中心趋势的测量。 3分)定序变量主要使用 中位数、四分位数作为集中趋势的测量,同时也可以使用众数作为测量值,但是中位数和四分 位数利用序次关系,因而更多使用这两者。 3分)数值型数据(定距和定比数据)的集中趋势 测量指标是平均数,同样,数值型数据可以使用众数和中位数、四分位数作为中心趋势的测量, 但是更主要的是使用均值,因为均值利用所有数据信息。 4分) 18. 何对 检验 配对样本检验主要是判断不同的处理或试验结果是否有差异。配对样本的 t检验用于检 验两个相关的样本是否来自具有相同均值的总体。 2分)在对配对样本进行 t检验时,首先 计算两个样本中每个对应变量之间的差值 3分)然后再检验其差值的均值是否为零,(1分) 如果差值的均值接近零(在给定的置信区间内), 2分)说明两个总体均值在给定的置信水平 上没有差异,如果差值的均值在置信区间外,则说明两个总体均值在给定的置信水平上有差 异。 四、计算题{每题 5分,共 0分) 19. (1)均值 n F1 +F2+…+Fk =(2500X120 十3500X420 十4500 X 540+5500 X 420+6500 X 300) -:-1800 = 8460000 -=-1800 1493
=4700 (4分) 方差: x- 2=过 N [(2500-4700)2×120+(3500-4700)2×420+(4500-4700)2×540 ÷1800 +(5500一4700)2×420+(6500-4700)2×300 =2448000000÷1800 =1360000 标准差: o=√/6=√/1360000=1166.19 (4分) (2)甲单位人均月收人的离散系数为: V= 里=1200÷4500=0.2667 甲 (3分) 乙单位人均月收人的离散系数为: vz=是=116.19÷4700=0.2481 (3分) Xz v甲>vz,所以说甲单位人均月收入的离散程度大于乙单位人均月收人。 (1分) 20.(1)回归方程为: y=363+1.42x (4分) (2)当x=25时, y=363+1.42X25=398.5(辆) (4分) (3)判定系数 R-SSR SSR SST-SSR+SSE =1600÷(1600+450) =0.7805 (4分) 表明在汽车销售量的总变差中,有78.05%可以由回归方程解释,说明回归方程的拟合程 度很高。 (3分) 1494
=4700 方差 (Xj -X)2Fi ri=i=l N 1(2500-4700)2 X 120 十(3500-4700)2 X 420+ (4500-4700)2 X 5401 I 171800 1+(5500-4100沪X420+(6500-4700)2X300 J = 2448000000 71800 = 1360000 标准差 n =';1360000 =1166.19 (2) 位人均 收人 0 0 0 0 2 6 6 乙单位人均月收入的离散系数为: (4 (4 (3 V7.- 11 6 6 4 70 0 (3 - 甲>V 单位人 散程 (1 20. (1)回归方程为: y=363+1. 42x (4 (2) 当x=2 y=363+1. 42><:25=398. 5( (4 (3) RZ =SE=SSR SST . --一 =16007 (1 0 0 =0.7805 (4 表明在汽车销售量的总变差中,有 %可以由回归方程解释,说明回归方程的拟合程 度很高。 1494