第八章过关检测(A卷) (时间:120分钟满分:150分) 一、选择题:本大题共12小题,每小题5分,共60分 1.对有线性相关关系的两个变量建立的经验回归方程y=a+bx中,回归系数 A b( A.可以小于0B.大于0 C.能等于0D.只能小于0 答案A 解析:当b=0时,r=0,这时不具有线性相关关系,但b可以大于0也可以小于0. 2.根据一名母亲记录儿子3~9岁的身高数据,建立儿子身高(单位:cm)对年龄(单 位:岁)的经验回归方程为y=7.19x+73.93,若用此方程预测儿子10岁时的身高,有 关叙述正确的是( A.身高一定为145.83cm B.身高大于145.83cm C.身高小于145.83cm D.身高在145.83cm左右 答案D 解析:用经验回归方程预测的不是精确值,而是估计值.当x=10时y=145.83,只能 说身高在145.83cm左右 3.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是( 5 7 8 9 10 14 18 19 20 23 25 28 A.线性函数模型 B.二次函数模型 C.指数函数模型 D.对数函数模型 答案A 解析:画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最 可能是线性函数模型 4.己知x,y的取值如下表所示,若y与x线性相关,且y=0.95x+a,则a等于( 3 2.2 4.3 4.8 6. A.2.2 B.2.9 C.2.8 D.2.6 答案D 解析:经验回归直线一定过样本点的中心(亿,),由已知元=2,=4.5,代入经验回归方 程得a=2.6
第八章过关检测(A 卷) (时间:120 分钟 满分:150 分) 一、选择题:本大题共 12 小题,每小题 5 分,共 60 分. 1.对有线性相关关系的两个变量建立的经验回归方程𝑦 ^ = a ^ + 𝑏 ^ x 中,回归系数 𝑏 ^ ( ) A.可以小于 0 B.大于 0 C.能等于 0 D.只能小于 0 答案:A 解析:当𝑏 ^ =0 时,r=0,这时不具有线性相关关系,但b ^ 可以大于 0 也可以小于 0. 2.根据一名母亲记录儿子 3~9 岁的身高数据,建立儿子身高(单位:cm)对年龄(单 位:岁)的经验回归方程为𝑦 ^ =7.19x+73.93,若用此方程预测儿子 10 岁时的身高,有 关叙述正确的是( ) A.身高一定为 145.83 cm B.身高大于 145.83 cm C.身高小于 145.83 cm D.身高在 145.83 cm 左右 答案:D 解析:用经验回归方程预测的不是精确值,而是估计值.当 x=10 时,y=145.83,只能 说身高在 145.83 cm 左右. 3.下表显示出样本中变量 y 随变量 x 变化的一组数据,由此判断它最可能是( ) x 4 5 6 7 8 9 10 y 14 18 19 20 23 25 28 A.线性函数模型 B.二次函数模型 C.指数函数模型 D.对数函数模型 答案:A 解析:画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最 可能是线性函数模型. 4.已知 x,y 的取值如下表所示,若 y 与 x 线性相关,且𝑦 ^ =0.95x+a,则 a 等于( ) x 0 1 3 4 y 2.2 4.3 4.8 6.7 A.2.2 B.2.9 C.2.8 D.2.6 答案:D 解析:经验回归直线一定过样本点的中心(𝑥, 𝑦),由已知𝑥=2,𝑦=4.5,代入经验回归方 程得 a=2.6
5.下列两个变量之间具有相关关系的是() A.正方形的边长a和面积S B.一个人的身高h和右手一拃长x C.真空中的自由落体运动其下落的距离h和下落的时间t D.学生的学籍号与学生的数学成绩 答案B 解析:对于A,正方形的边长α和面积S是函数关系,不是相关关系;对于B,一般情 况下,一个人的身高h和右手一柞长x是正相关关系:对于C,真空中的自由落体 运动其下落的距离h和下落的时间1是函数关系,不是相关关系:对于D,学生的学 籍号与学生的数学成绩没有相关关系.故选B, 6.如图,5个(x,y)数据,去掉点D(3,10)后,下列说法错误的是( E(10,12) D3,10) .C(4,5) ·B(2,4) A(1,3) A.样本相关系数r变大 B.残差平方和变大 C.R2变大 D.解释变量x与响应变量y的相关性变强 答案B 解析:由散点图知,去掉D点后,x,y的相关性变强,且为正相关,因此r变大,R2变大, 残差平方和变小 7.某车间加工零件的数量x与加工时间y的统计数据如下表: 零件数x/个 10 20 30 加工时间y/分钟 21 30 39 现已求得上表数据的经验回归方程y=bx+a中的b值为0.9,则据此回归模型可以 预测,加工100个零件所需要的加工时间约为( A.84分钟 B.94分钟 C.102分钟 D.112分钟 答案:C 解析:由已知可得x=20,y=30 又b=0.9,则a=y-bx=30-0.9×20=12. 因此经验回归方程为y=0.9x+12 故当x=100时,y=0.9×100+12=102 故选C
5.下列两个变量之间具有相关关系的是( ) A.正方形的边长 a 和面积 S B.一个人的身高 h 和右手一拃长 x C.真空中的自由落体运动其下落的距离 h 和下落的时间 t D.学生的学籍号与学生的数学成绩 答案:B 解析:对于 A,正方形的边长 a 和面积 S 是函数关系,不是相关关系;对于 B,一般情 况下,一个人的身高 h 和右手一拃长 x 是正相关关系;对于 C,真空中的自由落体 运动其下落的距离 h 和下落的时间 t 是函数关系,不是相关关系;对于 D,学生的学 籍号与学生的数学成绩没有相关关系.故选 B. 6.如图,5 个(x,y)数据,去掉点 D(3,10)后,下列说法错误的是( ) A.样本相关系数 r 变大 B.残差平方和变大 C.R 2 变大 D.解释变量 x 与响应变量 y 的相关性变强 答案:B 解析:由散点图知,去掉 D 点后,x,y 的相关性变强,且为正相关,因此 r 变大,R 2 变大, 残差平方和变小. 7.某车间加工零件的数量 x 与加工时间 y 的统计数据如下表: 零件数 x/个 10 20 30 加工时间 y/分钟 21 30 39 现已求得上表数据的经验回归方程𝑦 ^ = b ^ x+𝑎 ^中的𝑏 ^ 值为 0.9,则据此回归模型可以 预测,加工 100 个零件所需要的加工时间约为( ) A.84 分钟 B.94 分钟 C.102 分钟 D.112 分钟 答案:C 解析:由已知可得𝑥=20,𝑦=30, 又𝑏 ^ =0.9,则a ^ = 𝑦 − 𝑏 ^ 𝑥=30-0.9×20=12. 因此经验回归方程为𝑦 ^ =0.9x+12. 故当 x=100 时,𝑦 ^ =0.9×100+12=102. 故选 C
8.在两个学习基础相当的班级实行某种教学措施的试验,试验结果见下表,根据小 概率值α=0.01的独立性检验,推断试验效果与教学措施( 单位:人 成绩 班级 优、良、中 合计 实验班 48 2 50 对比班 38 12 50 合计 86 14 100 A.有关 B.无关 C.关系不明确D.以上都不正确 答案A 解析:随机变量2=100x48x138x28.306>6.635=001,根据小概率值a=0.01的独 50×50×86×14 立性检验,有充分证据推断试验效果与教学措施有关,且犯错误的概率不大于 0.01 9.“关注夕阳、爱老敬老”一某马拉松协会从2016年开始每年向敬老院捐赠物 资和现金.下表记录了第x年(2016年是第一年)与捐赠的现金(单位:万元)的对 应数据.由此表中的数据得到了变量y关于变量x的经验回归方程y=mx+0.35,则 预测2022年捐赠的现金大约是( 3 2.5 3 4.5 A.5万元 B.5.2万元 C.5.25万元 D.5.5万元 答案:C 解析:由已知得,元=3+4+5+6=4.5, 4 万=25+34+45-3.5, 4 即样本点的中心点的坐标为(4.5,3.5),将该坐标代入经验回归方程y=mx+0.35,得 3.5=4.5m+0.35,即m=0.7,故经验回归方程为y=0.7x+0.35. 当x=7时,得y=0.7×7+0.35=5.25 预测2022年捐赠的现金大约是5.25万元 10.设(x1y1),(x22),…,(xmn)是变量x和y的n个样本点,直线1是由这些样本点通 过最小二乘法得到的经验回归直线如图所示,以下结论中正确的是() A.x和y的样本相关系数为直线1的斜率
8.在两个学习基础相当的班级实行某种教学措施的试验,试验结果见下表,根据小 概率值 α=0.01 的独立性检验,推断试验效果与教学措施( ) 单位:人 班级 成绩 合计 优、良、中 差 实验班 48 2 50 对比班 38 12 50 合计 86 14 100 A.有关 B.无关 C.关系不明确 D.以上都不正确 答案:A 解析:随机变量 χ 2= 100×(48×12-38×2) 2 50×50×86×14 ≈8.306>6.635=x0.01,根据小概率值 α=0.01 的独 立性检验,有充分证据推断试验效果与教学措施有关,且犯错误的概率不大于 0.01. 9.“关注夕阳、爱老敬老”——某马拉松协会从 2016 年开始每年向敬老院捐赠物 资和现金.下表记录了第 x 年(2016 年是第一年)与捐赠的现金 y(单位:万元)的对 应数据.由此表中的数据得到了变量 y 关于变量 x 的经验回归方程𝑦 ^ =mx+0.35,则 预测 2022 年捐赠的现金大约是( ) x 3 4 5 6 y 2.5 3 4 4.5 A.5 万元 B.5.2 万元 C.5.25 万元 D.5.5 万元 答案:C 解析:由已知得,𝑥 = 3+4+5+6 4 =4.5, 𝑦 = 2.5+3+4+4.5 4 =3.5, 即样本点的中心点的坐标为(4.5,3.5),将该坐标代入经验回归方程𝑦 ^ =mx+0.35,得 3.5=4.5m+0.35,即 m=0.7,故经验回归方程为y ^ =0.7x+0.35. 当 x=7 时,得𝑦 ^ =0.7×7+0.35=5.25, 预测 2022 年捐赠的现金大约是 5.25 万元. 10.设(x1,y1),(x2,y2),…,(xn,yn)是变量 x 和 y 的 n 个样本点,直线 l 是由这些样本点通 过最小二乘法得到的经验回归直线如图所示,以下结论中正确的是( ) A.x 和 y 的样本相关系数为直线 l 的斜率
B.x和y的样本相关系数在0到1之间 C.当n为偶数时,分布在直线1两侧的样本点的个数一定相同 D.直线1过点(民,) 答案D 解析:两个变量的样本相关系数不是直线的斜率,有专门的计算公式,选项A错误: 两个变量的样本相关系数在-1到0之间,选项B错误:C中当n为偶数时,分布在 直线1两侧的样本点的个数可以不相同,选项C错误:根据经验回归方程一定经过 样本点中心可知选项D正确 11.某学校开展研究性学习活动,某同学获得一组统计数据如下表: 1.99 4 5.1 6.12 1.5 4.04 7.5 12 18.01 对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是( ) A.y=2x-2 B() C.y=log2x Dy-i(x2-1) 答案D 解析:本题若用R2或残差来分析拟合效果,运算将会很烦琐,计算量太大,可以将各 组数据代入检验,发现D最接近 12.某人研究中学生的性别与成绩、视力、智商、阅读量这4个变量的关系,随机 抽查52名中学生,得到统计数据如表1至表4,则与性别有关联的可能性最大的 变量是() 表1 单位:人 性别 成绩 合计 不及格 及格 男 6 14 20 女 10 22 32 合计 16 B6 52 表2 单位:人 性别 视力 恰计 好 差 男 4 16 20 女 12 20 32 合计 16 36 52 表3
B.x 和 y 的样本相关系数在 0 到 1 之间 C.当 n 为偶数时,分布在直线 l 两侧的样本点的个数一定相同 D.直线 l 过点(𝑥, 𝑦) 答案:D 解析:两个变量的样本相关系数不是直线的斜率,有专门的计算公式,选项 A 错误; 两个变量的样本相关系数在-1 到 0 之间,选项 B 错误;C 中当 n 为偶数时,分布在 直线 l 两侧的样本点的个数可以不相同,选项 C 错误;根据经验回归方程一定经过 样本点中心可知选项 D 正确. 11.某学校开展研究性学习活动,某同学获得一组统计数据如下表: x 1.99 3 4 5.1 6.12 y 1.5 4.04 7.5 12 18.01 对于表中数据,现给出以下拟合曲线,其中拟合程度最好的是( ) A.y=2x-2 B.y=( 1 2 ) 𝑥 C.y=log2x D.y= 1 2 (x 2 -1) 答案:D 解析:本题若用 R 2 或残差来分析拟合效果,运算将会很烦琐,计算量太大,可以将各 组数据代入检验,发现 D 最接近. 12.某人研究中学生的性别与成绩、视力、智商、阅读量这 4 个变量的关系,随机 抽查 52 名中学生,得到统计数据如表 1 至表 4,则与性别有关联的可能性最大的 变量是( ) 表 1 单位:人 性别 成绩 合计 不及格 及格 男 6 14 20 女 10 22 32 合计 16 36 52 表 2 单位:人 性别 视力 合计 好 差 男 4 16 20 女 12 20 32 合计 16 36 52 表 3
单位:人 性别 智商 合计 偏高 正常 男 8 12 20 女 8 24 32 合计 16 36 52 表4 单位:人 阅读量 性别 合计 丰富 不丰富 男 14 6 20 女 2 30 32 合计 16 36 52 A.成绩 B.视力 C.智商 D.阅读量 答案D 解析:结合各列联表中数据,得 X7=52x6x2-14x102 52×82 20×32×16×36 20×32×16×36 52×(4×20-16×12)2 52×1122 20×32×16×36 20×32×16×36 X好= 52×(8×24-12×8)2 52×962 20×32×16×36 20×32×16×36 x= 52×(14×30-6×2)2 52×4082 20×32×16×36 20×32×16×36 则x子>X径>X好>X行,因此阅读量与性别有关联的可能性最大. 二、填空题:本大题共4小题,每小题5分,共20分. 13.若对甲、乙、丙3组不同的数据作线性相关性检验,得到这3组数据的样本相 关系数依次为0.83.0.72,-0.90,则线性相关程度最强的一组是 (填甲、 乙、丙中的一个) 答案丙 解析:在两个变量y与x的回归模型中,它们的样本相关系数越接近于1, 则这个模型的两个变量线性相关程度就越强 在甲、乙、丙中,所给的数值中0.90的绝对值最接近1, 故丙的线性相关程度最强故答案为丙 14.某小卖部为了解热茶销售量(单位:杯)与气温x(单位:℃)之间的关系,随机统 计了某4天卖出的热茶的杯数与当天气温度数,并制作了对照表 气温/C 18 13 10
单位:人 性别 智商 合计 偏高 正常 男 8 12 20 女 8 24 32 合计 16 36 52 表 4 单位:人 性别 阅读量 合计 丰富 不丰富 男 14 6 20 女 2 30 32 合计 16 36 52 A.成绩 B.视力 C.智商 D.阅读量 答案:D 解析:结合各列联表中数据,得 𝜒1 2 = 52×(6×22-14 ×10) 2 20×32×16 ×36 = 52×8 2 20×32×16×36 , 𝜒2 2 = 52×(4×20-16 ×12) 2 20×32×16 ×36 = 52×112 2 20×32×16×36 , 𝜒3 2 = 52×(8×24-12 ×8) 2 20 ×32×16×36 = 52×96 2 20×32×16×36 , 𝜒4 2 = 52×(14×30-6 ×2) 2 20 ×32×16×36 = 52×408 2 20×32×16×36 , 则𝜒4 2 > 𝜒2 2 > 𝜒3 2 > 𝜒1 2 ,因此阅读量与性别有关联的可能性最大. 二、填空题:本大题共 4 小题,每小题 5 分,共 20 分. 13.若对甲、乙、丙 3 组不同的数据作线性相关性检验,得到这 3 组数据的样本相 关系数依次为 0.83,0.72,-0.90,则线性相关程度最强的一组是 .(填甲、 乙、丙中的一个) 答案:丙 解析:在两个变量 y 与 x 的回归模型中,它们的样本相关系数|r|越接近于 1, 则这个模型的两个变量线性相关程度就越强. 在甲、乙、丙中,所给的数值中-0.90 的绝对值最接近 1, 故丙的线性相关程度最强.故答案为丙. 14.某小卖部为了解热茶销售量 y(单位:杯)与气温 x(单位:℃)之间的关系,随机统 计了某 4 天卖出的热茶的杯数与当天气温度数,并制作了对照表: 气温/℃ 18 13 10 -1
杯数杯 24 34 38 由表中数据算得经验回归方程y=bx+a中的b≈-2,预测当气温为-5℃时,热茶销 售量大约为 杯 答案:70 解析:根据表格中的数据可求得x=三×(18+13+10-1)=10,y= 2×24+34+38+64)=40, ∴.a=了-bx=40-(-2)×10=60, ∴.经验回归方程为y=-2x+60. 故当x=-5时,y=-2×(-5)+60=70 15.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另 外500名未使用血清的人一年中的感冒记录作比较,提出假设Ho:这种血清不能 起到预防感冒的作用.利用2×2列联表计算得2≈3.918,经查临界值表知 P(2≥3.8410.05.则下列结论中正确的序号是 ①根据小概率值α=0.05的独立性检验,有充分证据推断这种血清能起到预防感 冒的作用; ②若某人未使用该血清,则他在一年中有95%的可能性得感冒; ③这种血清预防感冒的有效率为95%: ④这种血清预防感冒的有效率为5% 答案:① 16.若两个分类变量X与Y的2×2列联表为 合计 2 10 15 25 40 16 56 合计 50 31 81 则“X与Y之间有关系”这个结论出错的概率不超过 答案0.01 解析:由列联表数据,可求得 2-81X10x1640x157.227>6.635=001 25×56×50×31 故“X与Y之间有关系”出错的概率不超过0.01. 三、解答题:共70分.解答应写出文字说明、证明过程或演算步骤 17.(10分)为了调查某大学学生在某天上网的时间,随机对100名男生和100名女 生进行了不记名的问卷调查,得到的统计结果如下表所示 表1:男生上网时间与频数分布表
杯数/杯 24 34 38 64 由表中数据算得经验回归方程𝑦 ^ = b ^ x+𝑎 ^中的𝑏 ^ ≈-2,预测当气温为-5 ℃时,热茶销 售量大约为 杯. 答案:70 解析:根据表格中的数据可求得𝑥 = 1 4 ×(18+13+10-1)=10,𝑦 = 1 4 ×(24+34+38+64)=40, ∴𝑎 ^ = y − b ^ 𝑥=40-(-2)×10=60, ∴经验回归方程为𝑦 ^ =-2x+60. 故当 x=-5 时,𝑦 ^ =-2×(-5)+60=70. 15.某医疗研究所为了检验某种血清预防感冒的作用,把 500 名使用血清的人与另 外 500 名未使用血清的人一年中的感冒记录作比较,提出假设 H0:这种血清不能 起到预防感冒的作用.利用 2×2 列联表计算得 χ 2≈3.918,经查临界值表知 P(χ 2≥3.841)≈0.05.则下列结论中正确的序号是 . ①根据小概率值 α=0.05 的独立性检验,有充分证据推断这种血清能起到预防感 冒的作用; ②若某人未使用该血清,则他在一年中有 95%的可能性得感冒; ③这种血清预防感冒的有效率为 95%; ④这种血清预防感冒的有效率为 5%. 答案:① 16.若两个分类变量 X 与 Y 的 2×2 列联表为 X Y 合计 y1 y2 x1 10 15 25 x2 40 16 56 合计 50 31 81 则“X 与 Y 之间有关系”这个结论出错的概率不超过 . 答案:0.01 解析:由列联表数据,可求得 χ 2= 81×(10×16-40×15 ) 2 25 ×56×50×31 ≈7.227>6.635=x0.01, 故“X 与 Y 之间有关系”出错的概率不超过 0.01. 三、解答题:共 70 分.解答应写出文字说明、证明过程或演算步骤. 17.(10 分)为了调查某大学学生在某天上网的时间,随机对 100 名男生和 100 名女 生进行了不记名的问卷调查,得到的统计结果如下表所示: 表 1:男生上网时间与频数分布表
上网时间 分 [30,40) 40,50) [50,60) [60,70) 70,80] 人数 5 25 30 25 15 表2:女生上网时间与频数分布表 上网时间 [30,40) 40,50) 50,60) [60,70) 70,80] 分 人数 10 20 40 20 10 (1)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数: (2)完成下面的2×2列联表,根据小概率值a=0.1的独立性检验,能否推断出大学 生上网时间与性别有关? 单位:人 上网时间 性别 上网时间少于 上网时间不少于 合计 60分钟 50分钟 男生 女生 合计 附x2= n(ad-be)2 其中n=a+b+c+d为样本容量. a+b)(c+d(a+c)(b+d)' 0.1 0.05 0.01 0.005 0.001 Xa 2.706 3.841 6.635 7.879 10.828 解(1)设上网时间不少于60分钟的人数为x, 依题意有后=品解得x=225, 估计其中上网时间不少于60分钟的人数是225. (2)填列联表如下: 单位:人 上网时间 性别 上网时间少于 上网时间不少于 合计 60分钟 60分钟 男生 60 40 100 女生 70 30 100 合计 130 70 200 零假设为H0:大学生上网时间与性别无关」 由表中数据可得到X2-200X60x30:0x70≈220<2.706=0. 100×100×130×70
上网时间 /分 [30,40) [40,50) [50,60) [60,70) [70,80] 人数 5 25 30 25 15 表 2:女生上网时间与频数分布表 上网时间 /分 [30,40) [40,50) [50,60) [60,70) [70,80] 人数 10 20 40 20 10 (1)若该大学共有女生 750 人,试估计其中上网时间不少于 60 分钟的人数; (2)完成下面的 2×2 列联表,根据小概率值 α=0.1 的独立性检验,能否推断出大学 生上网时间与性别有关? 单位:人 性别 上网时间 上网时间少于 合计 60 分钟 上网时间不少于 60 分钟 男生 女生 合计 附:χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) ,其中 n=a+b+c+d 为样本容量. α 0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 解:(1)设上网时间不少于 60 分钟的人数为 x, 依题意有 𝑥 750 = 30 100 ,解得 x=225, 估计其中上网时间不少于 60 分钟的人数是 225. (2)填列联表如下: 单位:人 性别 上网时间 上网时间少于 合计 60 分钟 上网时间不少于 60 分钟 男生 60 40 100 女生 70 30 100 合计 130 70 200 零假设为 H0:大学生上网时间与性别无关. 由表中数据可得到 χ 2= 200 ×(60×30-40 ×70) 2 100 ×100×130 ×70 ≈2.20<2.706=x0.1
根据小概率值α=0.1的独立性检验,没有充分证据推断Ho不成立,因此可以认为 H成立, 即认为大学生上网时间与性别无关 18.(12分)期中考试后,对某班60名学生的成绩优秀和不优秀与学生近视和不近 视的情况做了调查,其中成绩优秀的36名学生中,有20人近视,另外24名成绩不 优秀的学生中,有6人近视 (1)请列出列联表并画出等高堆积条形图,判断成绩与患近视是否有关系 (2)根据小概率值a=0.05的独立性检验,能否推断出成绩与患近视有关? 解(1)列联表如下: 单位:人 成绩 是否近视 合计 近视 不近视 成绩优秀 20 16 36 成绩不优秀 6 18 24 合计 26 34 60 等高堆积条形图如图所示: 99 口不近视 口近视 0 优秀不优秀 由图知成绩与患近视有关」 (2)零假设为H0:成绩与患近视无关 X-60X20x186x1625.475>3.841=t00s 36×24×26×34 根据小概率值α=0.05的独立性检验,有充分证据推断H0不成立,即成绩与患近视 有关,此推断犯错误的概率不超过0.05 19.(12分)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机 抽取了100名观众进行调查,并根据调查结果绘制了观众日均收看该体育节目时 间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体 育迷” ↑频率/组距 88 0.020------ 0.018 0.010 0.005 0 102030405060时间份钟
根据小概率值 α=0.1 的独立性检验,没有充分证据推断 H0 不成立,因此可以认为 H0 成立, 即认为大学生上网时间与性别无关. 18.(12 分)期中考试后,对某班 60 名学生的成绩优秀和不优秀与学生近视和不近 视的情况做了调查,其中成绩优秀的 36 名学生中,有 20 人近视,另外 24 名成绩不 优秀的学生中,有 6 人近视. (1)请列出列联表并画出等高堆积条形图,判断成绩与患近视是否有关系. (2)根据小概率值 α=0.05 的独立性检验,能否推断出成绩与患近视有关? 解:(1)列联表如下: 单位:人 成绩 是否近视 合计 近视 不近视 成绩优秀 20 16 36 成绩不优秀 6 18 24 合计 26 34 60 等高堆积条形图如图所示: 由图知成绩与患近视有关. (2)零假设为 H0:成绩与患近视无关. χ 2= 60×(20×18-6 ×16) 2 36×24×26×34 ≈5.475>3.841=x0.05. 根据小概率值 α=0.05 的独立性检验,有充分证据推断 H0 不成立,即成绩与患近视 有关,此推断犯错误的概率不超过 0.05. 19.(12 分)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机 抽取了 100 名观众进行调查,并根据调查结果绘制了观众日均收看该体育节目时 间的频率分布直方图.将日均收看该体育节目时间不低于 40 分钟的观众称为“体 育迷
(1)根据已知条件完成下面的2×2列联表,根据小概率值a=0.05的独立性检验,能 否推断出“体育迷”与性别有关? 单位:人 性别 是不是体育迷 合计 非体育迷 体育迷 男 女 10 55 合计 (2)将上述调查所得到的频率视为概率,现在从该地区大量电视观众中,采用随机 抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为 X.若每次抽取的结果是相互独立的,求X的分布列、均值E)和方差D(), 附x2= n(ad-be)2 a+b)(c+d)(a+c)(b+d) 0.05 0.01 a 3.841 6.635 解:(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而列联表如 下: 单位:人 是不是体育迷 性别 合计 非体育迷 体育迷 男 30 15 45 女 45 10 55 合计 75 25 100 零假设为H0:“体育迷”与性别无关 将2×2列联表中的数据代入公式计算,得 n(ad-bc)2 -(a+DXcrdXa+cXb+4 =100×130×10-15×452=100≈3.030<3.841=X0.05 45×55×75×25 33 根据小概率值α=O.05的独立性检验,没有充分证据推断H0不成立,因此可以认为 H0成立,即“体育迷”与性别无关 (2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中 抽取一名“体育迷”的概率为由题意知水B(3,),从而X的分布列为 D 27 27 9 1 64 64 64 64 00=p-=3×好=寻 D0=m1p=3x2×号=品
(1)根据已知条件完成下面的 2×2 列联表,根据小概率值 α=0.05 的独立性检验,能 否推断出“体育迷”与性别有关? 单位:人 性别 是不是体育迷 合计 非体育迷 体育迷 男 女 10 55 合计 (2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机 抽样方法每次抽取 1 名观众,抽取 3 次,记被抽取的 3 名观众中的“体育迷”人数为 X.若每次抽取的结果是相互独立的,求 X 的分布列、均值 E(X)和方差 D(X). 附:χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) α 0.05 0.01 xα 3.841 6.635 解:(1)由频率分布直方图可知,在抽取的 100 人中,“体育迷”有 25 人,从而列联表如 下: 单位:人 性别 是不是体育迷 合计 非体育迷 体育迷 男 30 15 45 女 45 10 55 合计 75 25 100 零假设为 H0:“体育迷”与性别无关. 将 2×2 列联表中的数据代入公式计算,得 χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) = 100 ×(30×10-15 ×45) 2 45 ×55×75×25 = 100 33 ≈3.030<3.841=x0.05. 根据小概率值 α=0.05 的独立性检验,没有充分证据推断 H0 不成立,因此可以认为 H0 成立,即“体育迷”与性别无关. (2)由频率分布直方图知抽到“体育迷”的频率为 0.25,将频率视为概率,即从观众中 抽取一名“体育迷”的概率为1 4 .由题意知 X~B(3, 1 4 ),从而 X 的分布列为 X 0 1 2 3 P 27 64 27 64 9 64 1 64 E(X)=np=3× 1 4 = 3 4 , D(X)=np(1-p)=3× 1 4 × 3 4 = 9 16
20.(12分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽数之间的关 系进行分析研究,他们分别记录了12月1日至12月5日的每天昼夜温差与实验 室每天每100颗种子中的发芽数,得到如下资料: 12月 12月 12月 12月 12月 日期 1 日 日 3日 4日 5日 温差x/C 10 11 13 12 8 发芽数y颗 23 25 30 26 16 该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求经 验回归方程,再对被选取的2组数据进行检验: (1)求选取的2组数据恰好是不相邻2天数据的概率; (2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日 的数据,求出y关于x的经验回归方程y=bx+a. 解(1)设抽到不相邻两组数据为事件A,因为从5组数据中选取2组数据共有10 种情况,每种情况都是等可能出现的,其中抽到相邻两组数据的情况有4种,所以 PM=l若= (2)由数据,求得x=12,y=27 11×25+13×30+12×26=977,112+132+122=434, 由公式,求得b=a=-b饭=-3 故y关于x的经验回归方程为y=x-3. 21.(12分)某个服装店经营某种服装,在某周内获纯利单位:元)与该周每天销售 这种服装数x(单位:件)之间的一组数据关系见下表: /件 3 4 7 8 /元 66 69 73 81 189 90 己知∑x2=280,∑y7=45309,∑xy=3487. i=1 1 (1)求元 (2)判断纯利(单位:元)与每天销售件数x之间是否线性相关,如果线性相关,求出 经验回归方程 解:(1)元=3++5+6+7+8+9=6 7 万=66+69+73+81+89+90+91=559 7 7 (2)画出散点图如图,可知y与x的样本数据呈现出线性相关关系,设经验回归方程 A 为y=bx+a
20.(12 分)某农科所对冬季昼夜温差大小与某反季节大豆新品种发芽数之间的关 系进行分析研究,他们分别记录了 12 月 1 日至 12 月 5 日的每天昼夜温差与实验 室每天每 100 颗种子中的发芽数,得到如下资料: 日期 12 月 1 日 12 月 2 日 12 月 3 日 12 月 4 日 12 月 5 日 温差 x/℃ 10 11 13 12 8 发芽数 y/颗 23 25 30 26 16 该农科所确定的研究方案是:先从这五组数据中选取 2 组,用剩下的 3 组数据求经 验回归方程,再对被选取的 2 组数据进行检验. (1)求选取的 2 组数据恰好是不相邻 2 天数据的概率; (2)若选取的是 12 月 1 日与 12 月 5 日的两组数据,请根据 12 月 2 日至 12 月 4 日 的数据,求出 y 关于 x 的经验回归方程𝑦 ^ = b ^ x+𝑎 ^ . 解:(1)设抽到不相邻两组数据为事件 A,因为从 5 组数据中选取 2 组数据共有 10 种情况,每种情况都是等可能出现的,其中抽到相邻两组数据的情况有 4 种,所以 P(A)=1- 4 10 = 3 5 . (2)由数据,求得𝑥=12,𝑦=27. 11×25+13×30+12×26=977,112+132+122=434, 由公式,求得𝑏 ^ = 5 2 , 𝑎 ^ = 𝑦 − 𝑏 ^ 𝑥=-3. 故 y 关于 x 的经验回归方程为𝑦 ^ = 5 2 x-3. 21.(12 分)某个服装店经营某种服装,在某周内获纯利 y(单位:元)与该周每天销售 这种服装数 x(单位:件)之间的一组数据关系见下表: x/件 3 4 5 6 7 8 9 y/元 66 69 73 81 89 90 91 已知 ∑ 𝑖=1 7 xi 2=280, ∑ i=1 7 𝑦𝑖 2=45 309, ∑ 𝑖=1 7 xiyi=3 487. (1)求𝑥, 𝑦; (2)判断纯利 y(单位:元)与每天销售件数 x 之间是否线性相关,如果线性相关,求出 经验回归方程. 解:(1)𝑥 = 3+4+5+6+7+8+9 7 =6; 𝑦 = 66+69+73 +81+89+90+91 7 = 559 7 . (2)画出散点图如图,可知 y 与 x 的样本数据呈现出线性相关关系,设经验回归方程 为𝑦 ^ = 𝑏 ^ x+𝑎 ^