试卷代号:1318 座位■ 国家开放大学(中央广播电视大学)2014年春季学期“开放本科”期末考试 社会统计学 试题(半开卷) 2014年7月 题 号 二 三 四 总 分 分 数 得分 评卷人 一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确 答案的序号,填写在题中的括号内。每小题2分,共20分】 1.为了解某地区的消费,从该地区随机抽取5000户进行调查,其中30%回答他们的月消 费在5000元以上,40%回答他们每月用于通讯、网络的费用在300元以上。此处5000户是 () A.变量 B.总体 C.样本 D.统计量 2.当我们用图形描述甲乙两地区的人口年龄结构时,适合选用哪种图形() A,环形图 B.饼图 C.直方图 D.条形图 3.如果一组数据中某一个数值的标准分值为1.8,这表明该数值() A.是平均数的1.8倍 B.比平均数多1.8 C.等于标准差的1.8倍 D.比平均数高出1.8个标准差 1348
试卷代号 座位号 国家开放大学(中央广播电视大学 4年春季学期"开放本科"期未考试 社会统计学试题(半开卷) 2014 年7 一、单项选择题{在备题的备选答案中,只有 1项是正确的,请将正确 答案的序号,填写在题中的括号肉。每小题 2分,共 0分} 1.为了解某地区的消费,从该地区随机抽取 000户进行调查,其中 %回答他们的月消 |题号|一|二|三|四|总分| |分数 I I I I I |得分|评卷人| I I I 费在 000元以上, 4 0 %回答他们每月用于通讯、网络的费用在 0元以上。此处 0 0 0户是 ( ) A. 变量 B. c. 样本 2. 龄结构 时 哪种 ) A. c. B. D. 3. 果-组 数值 分值 1. 这表 该数 ) A.是平均数的1. B. 1.8 c. 1. D. 平均 1.8 1348
4.离散系数的主要目的是() A.反映一组数据的平均水平 B.比较多组数据的平均水平 C.反映一组数据的离散程度 D.比较多组数据的离散程度 5.某班级学生期末统计学考试平均成绩为82分,标准差为5分。如果已知这个班学生的 考试分数服从正态分布,可以判断成绩在7?一87之间的学生大约占全班学生的() A.68% B.89% C.90% D.95% 6.已知某单位平均月收入标准差为700元,离散系数为0.2,那么他们月收入的均值为 () A.700 B.0.2 C.3500 D.140 7.根据一个具体的样本求出的总体均值95%的置信区间() A.以95%的概率包含总体均值 B.5%的可能性包含总体均值 C.绝对包含总体均值 D.绝对不包含总体均值 8.在因变量的总离差平方和中,如果回归平方和所占的比例越小,则自变量和因变量之 间() A.相关程度越高 B.相关程度越低 C.完全相关 D.没有任何关系 1349
4. ) A. 映一组 平均水 B. 组数据 c.反映一组数据的离散程度 D. 多组数 散程 5. 班级 学考 为82 准差为5 班学 考试分数服从正态分布,可以判断成绩在 7 7 7之间的学生大约占全班学生的( ) A. 68% R 89% c. 90% D. 95% 6. 某单位平 准差为700 为0.2 A. 700 C. 3500 B. 0.2 D. 140 7. 个具体 样本求 值95% 区 间 ) A. 以95% 率包 B.5% 可能 体均 c.绝对包含总体均值 D. 对不 8. 总离 平方 变量 间( ) A.相关程度越高 B. C. D. 没有任何关 1349
9.从两个总体中共选取了8个观察值,得到组间平方和为432,组内平方和为426,则组 间均方和组内均方分别为() A.432,71 B.216,71 C.432,426 D.216,426 10.对于线性回归,在因变量的总离差平方和中,如果残差平方和所占比例越大,那么两 个变量之间() A.相关程度越大 B.相关程度越小 C.完全相关 D.完全不相关 得分 评卷人 二、名词解释(每题4分,共20分) 11.普查与抽样调查 12.参数与统计量 13.误差减少比例 14.最小二乘法 15.组间均方 得 分 评卷人 三、简答题(每题10分,共30分) 16.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是 连续变量。 (1)考研辅导班参加者的姓名 (2)家庭月消费 (3)温度 (4)上个月外出吃饭的次数 (5)产品等级 17.概率抽样方法主要包括哪几种? 18.简要说明卡方的拟合优度检验和独立性检验的含义。 1350
9. 两个 选取了8 个观 为432 为426 间均方和组内均方分别为( ) A. 432 ,71 C. 432 ,426 B. 216 ,71 D. 216 ,426 10. 变量 残差平 例越 个变量之间( ) A. 程度越大B. 关程 越小 C. 关D. 不相 |得分|评卷人 I I ilt 11. 12. 参数 13. 14. 最小二 15. |得分|评卷人| I I I 三、筒答题{每题 0分,共 0分} 16. 随机 量是 量还是定量变 是定 变量 量还 连续变量。 (1)考研辅导班参加者的姓名 (2) 家庭 (3) (4) (5) 17. 样方 几种 18. 优度栓 性检 含义 1350
得分 评卷人 四、计算题(每题15分,共30分) 19.一项关于大学生体重状况的研究发现,男生的平均体重为60千克,标准差为5千克: 女生的平均体重为50千克,标准差为5千克。请问: (1)是男生体重差异大还是女生体重差异大?为什么? (2)男生中有多少比重的人体重在55千克一65千克之间? (3)女生中有多少比重的人体重在40千克一60千克之间? 20.某公司欲了解广告费用x对销售量y的影响,收集了16个地区的数据,并对x、y进 行线性回归分析,得到:方程的截距为280,回归系数为1.6,回归平方和SSR=1503000,残差 平方和SSE=38000。要求: (1)写出广告费用y与销售量x之间的线性回归方程。 (2)假如广告费用投人80000元,根据回归方程估计商品的销售量。 (3)计算判定系数R2,并解释它的意义。 1351
|得分|评卷人| I I I 四、计算踵{每题 5分,共 0分} 19. 学生 重状 研究 为60 千克 为5 女生的平均体重为 0千克,标准差为 5千克。请问 (1)是男生体重差异大还是女生体重差异大?为什么? (2) 在55 克-65 (3) 有多 人体 在40 克-60 20. 某公 用x 销售量 了16 对x 行线性回归分析,得到 z方程的截距为 0,回归系数为1. 平方和SSR= 1503000 平方和 SS 000 (1)写出广告费用 y与销售量 x之间的线性回归方程。 (2) 人80000 根据 方程 (3) 算判 数R 解释它 意义 1351
试卷代号:1318 国家开放大学(中央广播电视大学)2014年春季学期“开放本科”期末考试 ·社会统计学 试题答案及评分标准(半开卷) (供参考) 2014年7月 一、单项选择题(在各题的备选答案中,只有1项是正确的,请将正确答案的序号,填写在题中 的括号内。每小题2分,共20分)】 1.C 2.A 3.D 4.D 5.A 6.C 7.A 8.B 9.A 10.B 二、名词解释(每题4分,共20分) 11.普查与抽样调查 普查是一种专门的调查,它是为了某种特定的目的而对总体中所有的个体进行的一次全 面调查。(2分) 抽样调查是从总体中选取部分个体组成样本进行调查的一种方式,其目的在于根据样本 的调查结果推断总体特征。(2分) 12.参数与统计量 参数是研究者想要了解的总体的某种特征值。通常情况下,我们关心的总体的参数主要 有总体平均数、标准差、比例等。(2分) 统计量是根据样本数据计算出来的一个量。与参数类似,我们通常关心的样本统计量主 要有样本平均数、样本标准差、样本比例等。(2分) 13.误差减少比例 在预测变量Y的值时,知道变量X的值时所减少的误差(E1一E2)与总误差E1的比值称 为误差减少比例,简称PRE。(2分)PRE的取值范围为O一1,PRE值越大,说明用变量X去 预测变量Y时能够减少的误差所占的比例越大,即变量X与变量Y之间的相关性越大:反 之,PRE越小,说明变量X与变量Y之间的关系越弱。(2分) 14.最小二乘法 1352
试卷代号 国家开放大学(中央广播电视大学 4年春季学期"开放本科"期末考试 社会统计学试题答案及评分标准(半开卷) (供参考) 2014 年7 一、单项选择题{在各题的备选答案中,只有 1项是正确的,请将正确答案的序号.填写在题中 的括号肉。每小题 2分,共 0分} 1. C 2. A 3. D 4. D 5. A 6. C 7.A 8. B 9. A 10. B 二、名词解释{每题 4分,共 0分} 1. 普查是一种专门的调查,它是为了某种特定的目的而对总体中所有的个体进行的一次全 面调查。 2分) 抽样调查是从总体中选取部分个体组成样本进行调查的一种方式,其目的在于根据样本 的调查结果推断总体特征。 2分) 12. 参数 参数是研究者想要了解的总体的某种特征值。通常情况下,我们关心的总体的参数主要 有总体平均数、标准差、比例等。 2分〉 统计量是根据样本数据计算出来的一个量。与参数类似,我们通常关心的样本统计量主 要有样本平均数、样本标准差、样本比例等。 2分〉 13. 差减 在预测变量 Y的值时,知道变量 X的值时所减少的误差 )与总误差 为误差减少比例,简称 (2 分)PRE 为0-I ,PRE 用 变量X 预测变量 Y时能够减少的误差所占的比例越大,即变量 X与变量 Y之间的相关性越大 z反 之, E越小,说明变量 X与变量 Y之间的关系越弱。 2分) 14. 最小二乘法 1352
对于存在线性关系的变量x和y的观察值,我们可以用很多直线去描述,但我们需要选用 距离各观测值最近的一条直线,用它来描述×与y之间的关系时实际的误差最小,根据这一思 想来确定回归方程中参数的方法就是最小二乘法。(2分)最小二乘法是使因变量的观察值与 估计值之间的离差平方和达到最小来求参数。和B1的方法。(2分) 15.组间均方 均方是用各误差除以它们的自由度。(1分)组间均方记作MSA,就是用组间平方和除以 它的自由度,其自由度为因素水平个数减去1,即k一1。(2分) 其计算公式为:MSA=组冒资和-.1分) 自由度 三、简答题(每题10分,共30分) 16.判断以下随机变量是定性变量还是定量变量,如果是定量变量,确定是离散变量还是 连续变量。 (1)考研辅导班参加者的姓名:定性变量(2分) (2)家庭月消费:定量变量,连续变量(2分) (3)温度:定量变量,连续变量(2分) (4)上个月外出吃饭的次数:定量变量,离散变量(2分) (5)产品等级:定性变量(2分) 17.概率抽样方法主要包括哪几种? 概率抽样主要包括简单随机抽样、系统抽样、分层抽样、整群抽样和多阶段抽样五种。 简单随机抽样是从包括总体N个单位的抽样框中随机的、一个一个的抽取n(n<N)个单 位作为样本,每个单位人选样本的概率是相等的。(2分) 系统抽样也称为等距抽样,是将总体中所有单位按照某一标志排序后,在规定的范围内随 机抽取一个单位作为初始单位,然后按照一定的相等距离抽取调查单位。(2分) 分层抽样也称类型抽样,它是先将总体中的所有单位按某种特征或标志(如年龄、性别、职 业等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的方 法抽样一个子样本,最后将这些子样本合起来构成总体的样本的方法。(2分) 整群抽样是先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一 些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。(2分) 1353
对于存在线性关系的变量 x和 y的观察值,我们可以用很多直线去描述,但我们需要选用 距离各观测值最近的一条直线,用它来描述 x与 y之间的关系时实际的误差最小,根据这一思 想来确定回归方程中参数的方法就是最小二乘法。 2分〉最小二乘法是使因变量的观察值与 估计值之间的离差平方和达到最小来求参数品和自1的方法。 2分〉 15. 均方是用各误差除以它们的自由度。(l分〉组间均方记作 A,就是用组间平方和除以 它的自由度,其自由度为因素水平个数减去 1,即 l. (2 一组间平方和 SS 其计算公式为 "= '=: -.:... :';:"'"一一。(1分) 自由度 k一 三、筒答题{每题 10分,共 0分} 16. 判 断 下随 定性 变量 是定 离 散变 连续变量。 (1)考研辅导班参加者的姓名:定性变量 2分) (2) 变量 连续 量(2 (3) 量(2 (4) 次数 定量变量 量(2 (5) 等级 量(2 17. 概率 样方法 哪几种 概率抽样主要包括简单随机抽样、系统抽样、分层抽样、整群抽样和多阶段抽样五种。 简单随机抽样是从包括总体 N个单位的抽样框中随机的、一个一个的抽取 )个单 位作为样本,每个单位入选样本的概率是相等的。 2分〉 系统抽样也称为等距抽样,是将总体中所有单位按照某一标志排序后,在规定的范围内随 机抽取一个单位作为初始单位,然后按照一定的相等距离抽取调查单位。 2分〉 分层抽样也称类型抽样,它是先将总体中的所有单位按某种特征或标志〈如年龄、性别、职 业等〉划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的方 法抽样一个子样本,最后将这些子样本合起来构成总体的样本的方法。 2分) 整群抽样是先将总体按照某种标志或特征划分为一些子群体,然后从总体中随机抽取一 些子群体,再将这些抽出的若干小群体内的所有元素构成总体样本的方法。 2分〉 1353
多阶段抽样也称多级抽样或分段抽样,是根据抽样元素的隶属关系或层次关系,将抽样过 程分为几个阶段来进行。(2分) 18.简要说明卡方的拟合优度检验和独立性检验的含义。 x2检验用于分类变量之间关系的检验。当用于检验不同类别的目标量之间是否存在显 著差异时,称为拟合优度检验。(4分)例如,不同职业的人群中对某项改革措施的支持率是否 一致。(1分) x2检验还可用于判断两个分类变量之间是否存在联系。如果两个分类变量之间没有关 系,则称为独立,我们用x2判断它们之间是否关联,这时称为独立性检验。(4分)例如,对性 行为的态度是否与受教育程度有关。(1分) 四、计算题(每题15分,共30分】 9.(1)v=勇=5=0.083(4分) 女—这一0=0.1(4分) v勇<v女,所以女生体重差异比男生大。(1分) (2)68%的男生体重在55千克一65千克之间。(3分) (3)95%的女生体重在40千克一60千克之间。(3分) 20.(1)y=280+1.6x(5分) (2)当x=80000时,y=280+1.6×80000=128280(5分) SSR (3)R*-SSR+SSR =1503000÷(1503000+38000) =1503000÷1541000 =0.9753 表明在商品销售量的总变差中,有97.53%可以由回归方程解释,说明回归方程的拟合程 度很高。(5分) 1354
多阶段抽样也称多级抽样或分段抽样,是根据抽样元素的隶属关系或层次关系,将抽样过 程分为几个阶段来进行. (2 18. 合优 检验和独立性检验 用于 系 的 撞验 验不 著差异时,称为拟合优度检验。 职业 对某项改革措 一致。(1分〉 检验 于判 个分类 量之 个分 没有 系,则称为独立,我们用对判断它们之间是否关联,这时称为独立性检验。 行为的态度是否与受教青程度有关。(1分) 四、计算题{每踵 只. 5 19. (l) (4 女=豆豆=立 (4 X女 V男 女生 生大 (1 (2)68% 的 男 在55 克-65 。(3 (3)95% 在40 克-60 (3 20. (1 ) y = 280 + 1. 6x (5 (2) 当x=80000 ,y=280+ 1. 6X80000=128280 (5 • SSR (3)RZ =一一一一一 SSR+SSR = 1503000-:- (1503000+ 38000) = 1503000 -:-1541000 =0.9753 表明在商品销售量的总变差中,有 5 3 %可以由回归方程解释,说明回归方程的拟合程 度很高. (5 1354