试卷代号:1318 座位■■ 中央广播电视大学2011一2012学年度第一学期“开放本科”期末考试(半开卷)》 社会统计学 试题 2012年1月 题 号 三 四 总分 分 数 得 分 评卷人 一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确 答案的序号,填写在题中的括号内。每小题2分,共20分) 1.某班级有60名男生,40名女生,为了了解学生购书支出,从男生中抽取12名学生,从 女生中抽取8名学生进行调查。这种调查方法属于( )。 A.简单随机抽样 B.整群抽样 C.分层抽样 D.系统抽样 2.某企业职工的月收人水平分为以下五组:(1)1500元及以下:(2)1500一2000元; (3)2000-2500元:(4)2500-3000元:(5)3000元及以上,则3000元及以上这一组的组中值 近似为( )。 A.3000元 B.3500元 C.2500元 D.3250元 3.对于右偏分布,平均数、中位数和众数之间的关系是()。 A.平均数>中位数>众数 B.中位数>平均数>众数 C.众数>中位数>平均数 D.众数>平均数>中位数 4.两组数据的平均数不相等,但是标准差相等。那么( )。 A.平均数小的,离散程度小 B.平均数大的,离散程度大 C.平均数大的,离散程度小 D.两组数据离散程度相同 5.在假设检验中,如果所计算出的P值越小,那么检验的结果( A.越显著 B.越不显著 C.越真实 D.越不真实 1710
试卷代号 座位号仁口 中央广播电视大学 11 2学年度第一学期"开放本科"期末考试(半开卷) 社会统计学试题 2012 年1 |题号 - |分数 I I I I I 得分|评卷人 一、单项选择题{在各题的备选答案中,只有 1项是正确的,请将正确 答案的序号,填写在题中的括号肉。每小题 2分,共 0分} 1.某班级有 6 0 名 男 4 0 女生中抽取 8名学生进行调查。这种调查方法属于( )。 A. 样B. C. D. 2. 某 企 业 职 平 分 (1) 1500 (2) 1500-2000 (3)2000一2500 元;(4)2500-3000元;(5)3000 元及 则3000 元及 上 这一组 近似为( )。 A. 3000 C. 2500 B. 3500 D. 3250 3. 右偏 众数之 )。 A. 位数〉 B. 众数 c.众数〉中位数〉平均数D.众数〉平均数〉中位数 4. 但是标准差相 )。 A. 数小 小B. 均数大 c.平均数大的,离散程度小D.两组数据离散程度相同 5. 果所计算 的P 检验 结果 )。 A. 著B. C. 真实 D. 不真实 1710
6.如果物价与销售量之间的线性相关系数为一0.87,而且二者之间具有统计显著性,那 么二者之间存在着( A.高度相关 B.中度相关 C.低度相关 D.极弱相关 7.回归平方和(SSR)反映了y的总变差中()。 A.由于x与y之间的线性关系引起的y的变化部分 B.除了x对y的现有影响之外的其他因素对y变差的影响 C.由于x与y之间的非线性关系引起的y的变化部分 D.由于x与y之间的函数关系引起的y的变化部分 8.根据一个具体的样本求出的总体均值90%的置信区间()。 A.以90%的概率包含总体均值 B.绝对包含总体均值 C.10%的可能性包含总体均值 D.绝对不包含总体均值 9.在假设检验中,虚无假设和备择假设( )。 A.都有可能成立 B.都不可能成立 C.有且只有一个成立 D.备择假设一定成立,虚无假设不一定成立 10.在方差分析中,某一水平下样本数据之间的误差称为()。 A.组内误差 B.组间误差 C.组内平方 D.组间平方 得分 评卷人 二、名词解释(每题4分,共20分) 11.普查 12.误差诚少比例 13.散点图 14.正态分布 15.最小二乘法 1711
6. 销售 间 的 一0.87 且二 有 统 著性 么二者之间存在着( )。 A. 度相关B. 度相 c.低度相关 .极弱相关 7. 'U(SSR) )。 A. 间 的 性关 B. 现有影 其他 变差 C. 性关 D. 的 函 部分 8. 个具体 值90% 置信 )。 A. 包含 值B. 对包 C. %的可能性包含总体均值D.绝对不包含总体均值 9. 设检 无假设 备择假设 )。 A. 有可能成立 B. 都不 成立 C.有且只有一个成立 D. 备择 无假设不一 10. 在方 一水平下 据之 )。 A. 差B. C.组内平方 .组间平方 |得分|评卷人 l I I 1. 普查 12. 差减 13. 14. 15. 最小二 二、名词解释(每题 4分,共 0分) 1711
得 分 评卷人 三、简答题(每题10分,共30分】 16.等距分组和不等距分组有什么区别?请举例说明。 17.举例说明什么是自变量和因变量,二者之间是什么关系? 18.简要说明卡方的拟合优度检验和独立性检验的含义。 得 分 评卷人 四、计算题(每题15分,共30分) 19.为估计每个网络用户每天上网的平均时间是多少,抽取了225个网络用户的简单随 机样本,得到样本均值为6.5个小时,样本标准差为2.5个小时。 (1)试用95%的置信水平,计算网络用户每天平均上网时间的置信区间。 (2)在所调查的225个网络用户中,年龄在20岁以下的用户为90个。以95%的置信水 平,计算年龄在20岁以下的网络用户比例的置信区间。 注:Z.25=1.96 20.某企业使用3种方法组装-一种新的产品,为确定哪种方法生产效率最高,随机抽取30 名工人,并指定每人使用其中的-一种方法。通过对每个工人生产的产品数进行分析得到下面 的方差分析表。请完成方差分析表。 变差来源 SS df MS F Sig. 组间 210 0.000 组内 3836 一 总计 29 一 1712
得分|评卷人 三、简答题{每题 0分,共 0分} 16. 距分 不 等距分 么 区 17. 是什 18. 检验 独立性检 主主 if; 四、计算题{每题 5分,共 0分} 19. 络用 网 的 了225 络用 户 的 机样本,得到样本均值为 5个小时,样本标准差为 5个小时。 (1)试用 %的置信水平,计算网络用户每天平均上网时间的置信区间。 (2) 在所调 的225 户 中 在20 为90 以95% 信水 平,计算年龄在 0岁以下的网络用户比例的置信区间。 =1. 96 20. 业使用3 种 新 产效 取30 名工人.并指定每人使用具-中的一科I方法。通过对每个工人生产的产品数进行分析得到下面 的方差分析表。请完成方差分析表。 变差来源 5S MS F Sig. 组间 210 0.000 组内 3836 总计 29 J. 1712
试卷代号:1318 中央广播电视大学2011一2012学年度第一学期“开放本科”期末考试(半开卷) 社会统计学 试题答案及评分标准 (供参考) 2012年1月 一、单项选择题(每小题2分,共20分) 1.C 2.D 3.A 4.C 5.A 6.A 7.A 8.A 9.C 10.A 二、名词解释(每题4分,共20分) 11.普查 普查是一种专门的调查,它是为了某种特定的目的而对总体中所有的个体进行的一次全 面调查。(2分)普查一般是一次性或周期性的,有统一的标准调查时点。普查具有信息全面、 完整的特点,可以为其它抽样调查提供依据。但是,普查比较耗时、费力,成本比较高,而且适 用范围比较窄,调查内容不深入,只适合调查一些基本的、一般的社会现象。(2分) 12.误差减少比例 将在预测变量Y的值时,知道变量X的值时所减少的误差(E,一E2)与总误差E,的比值 称为误差减少比例,简称PRE。(2分)PRE的取值范围为0一1,PRE值越大,说明用变量X 去预测变量Y是能够减少的误差所占的比例越大,即变量X与变量Y之间的相关性越大:反 之,PRE越小,说明变量X与变量Y之间的关系越小。(2分) 13.散点图 散点图是在坐标系中,用X轴表示自变量x,用Y轴表示因变量y,而变量组(x,y)则用坐 标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形 成的二维图就是散点图。(2分) 散点图是描述变量关系的一种直观方法,我们可以从散点图中直观的看出两个变量之间 是否存在相关关系、是正线性相关还是负线性相关,也可以大致看出变量之间关系强度如何。 (2分) 1713
试卷代号 中央广播电视大学 11 2学年度第一学期"开放本科"期末考试(半开卷) 社会统计学试题答案及评分标准 (供参考) 2012 年1 一、单项选择题{每小题 2分,共 0分) I. C 6. A 2. D 7.A 3.A 8.A 4. C 9. C 5. A 10. A 二、名词解释(每题 4分,共 0分} 1 1. 普查是一种专门的调查,它是为了某种特定的目的而对总体中所有的个体进行的一次全 面调查。 2分)普查·般是一次性或周期性的,有统一的标准调查时点。普查具有信息全面、 完整的特点,可以为其它抽样调查提供依据。但是,普查比较耗时、费力,成本比较高,而且适 用范围比较窄,调查内容不深入,只适合调查一些基本的、一般的社会现象。 2分) 12. 差减少 将在预测变量 Y的值时,知道变量 X的值时所减少的误差eE - 差E 称为误差减少比例,简称 (2 分)PRE 取值 为0→1 ,PRE 用 变 量X 去预测变量 Y是能够减少的误差所占的比例越大,即变量 X与变量 Y之间的相关性越大;反 之, E越小、说明变量 X与变量 Y之间的关系越小。 2分) 13. 散点图是在坐标系中,用 X轴表示自变量 x,用 Y轴表示因变量 y,而变量组 x, )则用坐 标系中的点表示,不同的变量组在坐标系中形成不同的散点,用坐标系及其坐标系中的散点形 成的二维图就是散点图。 2分) 散点图是描述变量关系的→种直观方法,我们可以从散点图中直观的看出两个变量之间 是否存在相关关系、是正线性相关还是负线性相关,也可以大致看出变量之间关系强度如何乙 (2 1713
14.正态分布 连续性随机变量中重要的分布是钟型概率分布,就是正态分布,也称为常态分布,是一种 连续型随机变量的概率分布。(2分)正态分布是对称的,且正态分布的中央点最高。(2分) 15.最小二乘法 对于存在线性关系的变量x和y的观察值,我们可以用很多直线去描述,但我们需要选用 距离各观测值最近的一条直线,用它来描述x与y之间的关系使实际的误差最小,根据这一思 想来确定回归方程中参数的方法就是最小二乘法。(2分)最小二乘法是使因变量的观察值与 估计值之间的离差平方和达到最小来求参数的方法。(2分) 三、简答题(每题10分,共30分) 16.等距分组和不等距分组有什么区别?请举例说明。 (1)在对数据进行分组时,如果各组组距相等,则称为等距分组。(2分)例如,分析某班同 学期末统计课成绩时,假如最低分为73分,最高分为98分,以5分为组距进行分组,分为 70一75分,75-80分,80一85分,85一90分,90-95分,95-100分。(3分) (2)如果各组组距不相等,则称为不等距分组。(2分)例如,在分析人口时,往往将人口分 为婴幼儿组(0一6岁),少年儿童组(7一17岁),中青年组(18一59岁),老年人组(60岁及以 上),该分类中各组组距不相等,这就是不等距分组。(3分) 17.举例说明什么是自变量和因变量,二者之间是什么关系? (1)我们将引起其他变量变化的变量称为自变量,(2分)而将由于其他变量的变化而导致 自身发生变化的变量称为因变量。(2分) (2)自变量与因变量之间的关系不仅仅是先后关系,还必须是因变量的变化是以自变量的 变化为前提。(3分) (3)例如,随着受教育程度增加,收入也增加,那么这两者就是因果关系,其中受教育程度 是自变量,收入则是因变量。(3分) 18.简要说明卡方的拟合优度检验和独立性检验的含义。 x2检验用于分类变量之间关系的检验。当用于检验不同类别的目标量之间是否存在显 著差异时,称为拟合优度检验。(4分)例如,不同职业的人群中对某项改革措施的支持率是否 一致。(1分) 1714
14. 正态 连续性随机变量中重要的分布是钟型概率分布,就是正态分布,也称为常态分布,是)种 连续型随机变量的概率分布。 2分)正态分布是对称的,且正态分布的中央点最高。 2分) 15. 最小 对于存在线性关系的变量 x和 y的观察值,我们可以用很多直线去描述,但我们需要选用 距离各观测值最近的一条直线,用它来描述 x与 y之间的关系使实际的误差最小,根据这一思 想来确定回归方程中参数的方法就是最小二乘法。 2分)最小二乘法是使因变量的观察值与 估计值之间的离差平方和达到最小来求参数的方法。 2分) 三、筒答题(每题 16. 距分组 不等距 组有 (1)在对数据进行分组时,如果各组组距相等,则称为等距分组。 2分)例如,分析某班同 学期末统计课成绩时,假如最低分为 3分,最高分为 8分,以 5分为组距进行分组,分为 70一75 7 5 ,80 →95 ,95-100 。(3 (2) 果各组 相等 距分 。(2 将人 为婴幼儿组 6岁) .少年儿童组 7岁) ,中青年组 9岁) ,老年人组 0岁及以 上) ,该分类中各组组距不相等,这就是不等距分组。 3分) 17. 变量 变量 二者 是什 (1)我们将引起其他变量变化的变量称为自变量, 2分)而将由于其他变量的变化而导致 自身发生变化的变量称为因变量。 2分) (2) 变量 间 的 仅仅 先后 必须是 变化 变量 变化为前提。 3分) (3) 例如 教育 增加 也增 这 两 者就 教育 是自变量,收入则是因变量。 3分) 18. 合优 检验和独 含义 χ2 检验 检验不 是否 著差异时,称为拟合优度检验。 4分)例如,不同职业的人群中对某项改革措施的支持率是否 一致。(l分) 1714
×检验还可用于判断两个分类变量之间是否存在联系。如果两个分类变量之间没有关 系,则称为独立,我们用×2判断它们之间是否关联,这时称为独立性检验。(4分)例如,对性 行为的态度是否与受教育程度有关。(1分) 四、计算题(每题15分,共30分) 19.(1)已知:n=225,x=6.5,s=2.5,Z.025=1.96 (2分) 网络用户每天平均上网时间的95%的置信区间为: x士Z2 =6.5t1.96×25=6.5t0.33 (4分) n √225 即(6.17,6.83) (2分) (2)样本比例:p 90 225=0.4 ·(2分) 年龄在20岁以下的网络用户比例的95%的置信区间为: p士Z12 PP2=0.4士1,96X4X50D=0.4生0.064 (4分) n 225 即(33.6%,46.4%) (3分) 20.(15分) 变差来源 SS df MS F Sig. 组间 420 2 210 1.478 0.000 组内 3836 27 142.07 二 一 总计 4256 29 一 1715
χ2 检验 可用于判 断两个分类变量 果两个分 变量 系,则称为独立,我们用扩判断它们之间是否关联,这时称为独立性检验。 4分〉例如,对性 行为的态度是否与受教育程度有关。 o分) 四、计算题(每题 5分,共 0分} 19. 0) 2 2 1. (2 网络用户每天平均上网时间的 9 5 %的置信区间为: 2. 5 ./2 1. 96Xτ 二=6.5 士0.33 (4 ,J225 (2 (2) 例:P= 旦=0.4 (2 ... 225 年龄在 0岁以下的网络用户比例的 9 5 %的置信区间为: (3 20. 05 变差来源 SS df F Sig. 组间 420 2 210 1. 478 0.000 组内 3836 27 142.07 总计 4256 29 1715