试卷代号:1318 座位号☐ 中央广播电视大学2011一2012学年度第二学期“开放本科”期末考试(半开卷) 社会统计学试题 2012年7月 题 号 三 四 总 分 分 数 得 分 评卷人 一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确 答案的序号,填写在题中的括号内。每小题2分,共20分) 1.某地区政府想了解全市332.1万户家庭年均收入水平,从中抽取3000户家庭进行调 查,以推断所有家庭的年均收入水平。这项研究的总体是()。 A.332.1万户家庭 B.3000户家庭 C.332.1户家庭的年均收人 D.3000户家庭的年均收入 2.下列变量属于数值型变量的是( )。 A.工资收入 B.产品等级 C.学生对考试改革的态度 D.企业的类型 3.如果用一个图形描述比较两个或多个样本或总体的结构性问题时,适合选用哪种图形 () A.环形图 B.饼图 C.直方图 D.条形图 4.在频数分布表中,频率是指()。 A.各组频数与上一组频数之比 B.各组频数与下一组频数之比 C.各组频数与总频数之比 D.各组频数与最大一组频数之比 5.两个定类变量之间的相关分析可以使用( )。 A.λ系数 B.p系数 C.r系数 D.Gamma系数 6.根据一个样本均值求出的90%的置信区间表明()。 A.总体均值一定落人该区间内 B.总体均值有90%的概率不会落人该区间内 C.总体均值有90%的概率会落人该区间内 D.总体均值有10%的概率会落入该区间内 1707
试卷代号 座位号 中央广播电视大学 0 11 2012 学年 开放本科 半开卷 社会统计学试题 2012 年7 题号 总分 分数 得分 l评卷人 一、单项选择题(在各题的备选答案中,只有 1项是正确的,请将正确 答案的序号,填写在题中的括号肉。每小题 2分,共 0分) 1.某地区政府想了解全市 3 3 取3000 查,以推断所有家庭的年均收入水平。这项研究的总体是( )。 A. 332. 家庭 B. 3000 C. 332. 年均收 3000 均收入 2. 变量属 于 变量 )。 A. 入B. c.学生对考试改革的态度 .企业的类型 3. 描述 个或 个样本 结构 适合选用 ( ) c.直方图 A. 环形 图B. .条形图 4. 布 表 )。 A. 各组频数 上 一组频数之 比B. 各组频数 组频数 c.各组频数与总频数之比 .各组频数与最大一组频数之比 5. 定类变量之 关分 )。 A.λ B. C. Gamma 6. 本均 区 间 )。 A. 区 间 B.总体均值有 %的概率不会落入该区间内 c.总体均值有 %的概率会落入该区间内 D.总体均值有 %的概率会落入该区间内 1707
7.已知某单位职工平均每月工资为3000元,标准差为500元。如果职工的月收人是正 态分布,可以判断月收入在2500元-一3500元之间的职工人数大约占总体的( )。 A.95% B.68% C.89% D.90% 8.方差分析的目的是()。 A.比较不同总体的方差是否相等 B.判断总体是否存在方差 C.分析各样本数据之间是否存在显著差异 D.研究各分类自变量对数值型因变量的影响是否显著 9.对于线性回归,在因变量的总离差平方和中,如果回归平方和所占比例越大,那么两个 变量之间()。 A.相关程度越大 B。相关程度越小 C.完全相关 D.完全不相关 10.正态分布中,σ值越小,则( )。 A.离散趋势越小 B.离散趋势越大 C.曲线越低平 D.变量值越分散 得 分 评卷人 二、名词解释(每题4分,共20分) 11.概率抽样 12.中位数 13.相关系数 14.区间估计 15.中心极限定理 得 分 评卷入 三、简答题(每题10分,共30分) 16.条形图和直方图有什么区别? 17.简述众数,中位数和平均数作为测量中心趋势的指标所适用的数据类型。 18.简要举例说明在分析双变量的关系时,T检验和卡方检验的主要区别。 1708
Eo相关程度越小 D. 完全 B. 势越 D.变量值越分散 7. 某单位职 为3000 为500 收 入 是 正 态分布,可以判断月收入在 0元 0元之间的职工人数大约占总体的( )。 A. 95% B. 68% c. 89% D. 90% 8. 方差 )。 A. 相等 B.判断总体是否存在方差 C. 各样本 著差 D. 究各分类 对数值 是否 9. 差 平 平方 变量之间( )。 A. 相 关 c.完全相关 10. 正态 )。 A. 趋势 c.曲线越低平 得分|评卷人 1. 抽样 12. 13. 14. 区 间 15. 得分!评卷入 二、名词解释{每题4分,共 0分} 三、简答题(每题 0分,共 0分) 16. 17. 述众 标所适 类 型 18. 简 要 析双变量 ,T 和 卡方检验 1708
得 分 评卷人 四、计算题(每题15分,共30分) 19.某校社会学专业共有两个班级。期末考试时,一班同学社会学理论平均成绩为86 分,标准差为12分。二班同学成绩如下所示。 二班同学社会学理论成绩分组数据表 按成绩分组(分) 入数(个) 60分以下 2 60~70 7 7080 9 8090 7 90≈100 5 合 计 30 要求: (1)计算二班同学考试成绩的均值和标准差。 (2)比较一班和二班哪个班成绩的离散程度更大?(提示:使用离散系数) 20.某调查公司研究出租司机每天收人(元)与行驶里程(公里)之间的关系。对30位出 租车司机进行调查,并根据每天的收入y、行驶里程x进行回归,得到:方程的截距为162,回归 系数为0.6,回归平方和SSR=2600,残差平方和SSE=513。 要求: (1)写出每天的收人y与行驶里程×之间的线性回归方程。 (2)假如某司机某天行驶了300公里,根据回归方程估计他该天的收人。 (3)计算判定系数R2,并解释它的意义。 1709
得分|评卷人 四、计算题(每题 5分,共 0分) 19. 某校社 学专 班 级 末 考 为86 分,标准差为 2分。二班同学成绩如下所示。 二班同学社会学理论成绩分组数据表 按成绩分组(分) 人数(个) 60 2 60~70 7 70'~80 9 80~·90 7 90~100 3 L 30 要求: (1)计算二班同学考试成绩的均值和标准差。 (2) 班成 的 离 程度 提示 用离 20. 查公 天 收 行驶 里 间 的 对30 租车司机进行调查,并根据每天的收入 y、行驶里程 x进行回归,得到:方程的截距为 2,回归 系数为 和SSR=2600 残差平方和SSE=513 要求: (1)写出每天的收入 y与行驶里程 x之间的线性回归方程。 (2) 了300 方程 计他 收入 (3) 判 定 数R 解释 的 意 1709
试卷代号:1318 中央广播电视大学2011一2012学年度第二学期“开放本科”期末考试(半开卷) 社会统计学 试题答案及评分标准 (供参考) 2012年7月 一、单项选择题(每小题2分,共20分) 1.A 2.A 3.A 4.C 5.A 6.C 7.B 8.D 9、A 10.A 二、名词解释(每题4分,共20分) 11.概率抽样 概率抽样就是按照随机原则进行的抽样,(2分)总体中每个个体都有一定的、非零的概率 入选样本,并且入选样本的概率都是已知的或可以计算的。(2分) 12.中位数 中位数是中心趋势的一种测量,是将一组数据排序后,处于中间位置的变量值。(2分)作 为中心趋势的测量指标,它适用于定序数据、定距数据和定比数据,且不受极端值的影响。 (2分) 13.相关系数 相关系数是对变量之间线性相关关系的程度和方向的度量。当研究两个变量之间的相关 关系时我们称之为简单相关系数。(2分)相关系数r的取值在一1~1之间。当r=1时,说明 两变量之间存在完全正相关;而当r=一1时,两变量之间完全负相关。当0<<1时,两变量 之间存在正线性相关;而当一1<r<0时,两变量之间存在负线性相关。(1分)相关系数r=0 时,只能说变量之间不存在线性相关,而不能说它们之间一定不相关。(1分) 14.区间估计 区间估计是对总体参数估计的一种方法,根据统计量的抽样分布的特点进行估计。(1 分)相对于点估计而言,区间估计是在估计总体参数时给出一个区间,同时给出总体参数落人 这一区间的可能性大小。(2分)区间估计是在点估计的基础上进行的,区间估计中的区间是 1710
试卷代号 中央广播电视大学 0 11 2012 二学 社会统计学试题答案及评分标准 (供参考) 2012 年7 -、单项选择题{每小题 2分,共 0分} 1. A 2. A 3. A 6. C 7. B 8. D 4. C 9. A 5. A 10. A 二、名词解释(每题 4分,共 0分) 1. 概率抽样就是按照随机原则进行的抽样, 2分)总体中每个个体都有一定的、非零的概率 入选样本,并且入选样本的概率都是已知的或可以计算的。 2分) 12. 中位数是中心趋势的一种测量,是将-组数据排序后,处于中间位置的变量值。 2分)作 为中心趋势的测量指标,它适用于定序数据、定距数据和定比数据,且不受极端值的影响。 (2 13. 相关系数是对变量之间线性相关关系的程度和方向的度量。当研究两个变量之间的相关 关系时我们称之为简单相关系数。 2分)相关系数 r的取值在一 1之间。当 1时,说明 两变量之间存在完全正相关;而当 1时,两变量之间完全负相关。当 1时,两变量 之间存在正线性相关;而当→ O时,两变量之间存在负线性相关。(l分)相关系数 时,只能说变量之间不存在线性相关,而不能说它们之间一定不相关。(1分) 14. 区 间 区间估计是对总体参数估计的一种方法,根据统计量的抽样分布的特点进行估计。(l 分)相对于点估计而言,区间估计是在估计总体参数时给出→个区间,同时给出总体参数落入 这一区间的可能性大小。 2分)区间估计是在点估计的基础上进行的,区间估计中的区间是 1710
根据样本统计量的抽样分布计算得到的,这样使得估计更加准确。(1分) 15.中心极限定理。 中心极限定理具体内容为:不论总体分布是否服从正态分布,(1分)从均值为4、方差为 。2的总体中,抽取容量为n的随机样本,(1分)当n充分大时(通常要求n≥30),样本均值的 抽样分布近似服从均值为μ、方差为。2/n的正态分布。(2分) 三、简答题(每题10分,共30分) 16.条形图和直方图有什么区别? (1)适用范围不同,条形图适用于所有类型数据,而直方图只适用于数值型数据。(3分) (2)条形图中条形的宽度是固定的,是用条形的长度(或高度)表示各类别频数的多少;(2 分)而直方图则是用矩形的面积表示各类别频数的多少,矩形的宽度和高度均有意义,宽度表 示组距,高度表示每一组的频数密度,而且宽度不一定是固定的,只有等距分组时宽度是固定 的。(2分) (3)条形图中各条形是分开排列的,而直方图中由于分组数据是连续的,因而直方图的矩 形通常是紧密排列的。(3分) 17.简述众数、中位数和平均数作为测量中心趋势的指标所适用的数据类型。 众数是对中心趋势最低层次的测量,是适用范围最大的一种测量方式,适用于任何类型的 数据,即定类、定序、定距和定比数据都可以用众数来测量其中心趋势。(3分)中位数适用于 除了定类数据外的所有其他类型数据,因为中位数是处于中间位置的变量值,而定类数据不存 在类别的先后次序或大小,因而中位数不适用于定类数据。(3分)平均数是集中趋势最主要 的测量指标,但是平均数仅适用于定距数据和定比数据,定类数据和定序数据计算平均数没有 意义。(3分)一般说来,定类数据的中心趋势测量指标是众数,定序数据的中心趋势测量指标 是中位数,而数值型数据(定距和定比数据)的中心趋势测量指标是平均数。(1分) 18.简要举例说明在分析双变量的关系时,T检验和卡方检验的主要区别。 分析双变量关系时,T检验和卡方检验都是主要用于检验这两个变量之间是否存在显著 关系。(2分)T检验主要用于对一个为数值型变量、另一个为分类变量且只有两个类别的变 量的双变量关系的统计显著性检验。(2分)卡方检验主要用于对两个分类变量之间的相关性 进行统计检验,判断变量之间是否存在显著关系。(2分)例如,我们想考察收人与性别是否存 在关系,或者两性的收入是否存在显著差异,可以用两独立样本T检验。(2分)如果我们想考 1711
根据样本统计量的抽样分布计算得到的,这样使得估计更加准确。(1分) 15. 中心极限定理具体内容为:不论总体分布是否服从正态分布,(1分)从均值为 μ、方差为 σ2 为n (1 当n 充分大 求n 抽样分布近似服从均值为 μ、方差为 In 正态 三、简答题{每题 0分,共 0分) 16. (1)适用范围不同,条形图适用于所有类型数据,而直方图只适用于数值型数据。 3分) (2) 宽度 长度 高 度 表示 各类 频 数 (2 分)而直方图则是用矩形的面积表示各类别频数的多少,矩形的宽度和高度均有意义,宽度表 示组距,高度表示每一组的频数密度,而且宽度不一定是固定的,只有等距分组时宽度是固定 的。 (3)条形图中各条形是分开排列的,而直方图中由于分组数据是连续的,因而直方图的矩 形通常是紧密排列的。 3分) 17. 述众 为 测 所适 众数是对中心趋势最低层次的测量,是适用范围最大的一种测量方式,适用于任何类型的 数据,即定类、定序、定距和定比数据都可以用众数来测量其中心趋势。(3分)中位数适用于 除了定类数据外的所有其他类型数据,因为中位数是处于中间位置的变量值,而定类数据不存 在类别的先后次序或大小,因而中位数不适用于定类数据。3分)平均数是集中趋势最主要 的测量指标,但是平均数仅适用于定距数据和定比数据,定类数据和定序数据计算平均数没有 意义 (3 定类 趋势 指标是众 数据 趋势 指 标 是中位数,而数值型数据(定距和定比数据)的中心趋势测量指标是平均数。(1分) 18. 变量 ,T 分析双变量关系时,T检验和卡方检验都是主要用于检验这两个变量之间是否存在显著 关系。 2分 T检验主要用于对一个为数值型变量、另一个为分类变量且只有两个类别的变 量的双变量关系的统计显著性检验。 2分)卡方检验主要用于对两个分类变量之间的相关性 进行统计检验,判断变量之间是否存在显著关系。 2分)例如,我们想考察收入与性别是否存 在关系,或者两性的收入是否存在显著差异,可以用两独立样本T检验。 2分)如果我们想考
察职业与性别是否存在关系,而职业和性别都是分类变量,那么可以用卡方检验考察不同性别 之间职业是否存在显著差异。(2分) 四、计算题(每题15分,共30分) 19.(1)均值: X=X十fX十+fX f1+f2十…+fk =(55×2+65×7+75×9+85×7+95×5)÷30 =2310÷30 =77 (4分) 方差: 2X-x4 2= N 「(55-77)2×2+(65-77)2×7+(75-77)2×9 ÷30 +(85-77)2×7+(95-77)2×5 =4080÷30 =136 标准差: 6=6=√/136≈11.6619 (4分) (2)一班考试成绩的离散系数为: V-班= S-题=12÷86=0.1395 Ⅹ班 (3分) 二班考试成绩的离散系数为: V二班= S==11.66÷77=0.1515 (3分) X二班 V班<v二,所以说一班成绩的离散程度小于二班。(1分) 20.(1)回归方程为: y=162+0.6x (4分) (2)当x=300时, 1712
察职业与性别是否存在关系,而职业和性别都是分类变量,那么可以用卡方检验考察不同性别 之间职业是否存在显著差异。 2分〉 四、计算题{每题 5分,共 0分) 19. (l)均值: +-f- ------ E· -EXlE4-P+a-1 ?'2--- r-- -x = (55 X 十65X7 十75X9 十85X7+95X5)-;-30 =2310-;-30 =77 (4 方差: x -x d N (55 一77)ZX2+(65 一77)2 X 7+ (75--77)2 X 91 ! -;-30 + (85-77)2 X 7+ (95 一77)2 X5 J =4080-;-30 =136 标准差: vT3 1. 6619 (4 (2) 工12-;-86=0.1395 (3 二班考试成绩的离散系数为: V1= 11. 66-;-77=0. 1515 (3 成绩 散程 于 二 (l 20. (l)回归方程为: y=162 6x (4 (2) 当x=300 1712
y=162+0.6×300=342(元) (4分)》 (3)判定系数 R:=SSR_ SSR SST SSR+SSE =2600÷(2600+513) =0.8352(4分) 表明在每天收入的总变差中,有83.52%可以由回归方程解释,说明回归方程的拟合程度 很高。(3分) 1713
y=162+0.6X300=342( (4 (3)判定系数 R2-SSR-SSR 一一一- SST SSR+SS = 2600 -7- (2600+513) =0.8352 (4 表明在每天收入的总变差中,有 %可以由回归方程解释,说明回归方程的拟合程度 很高。(3分) 1713