第八章过关检测(B卷) (时间:120分钟满分:150分) 一、选择题:本大题共12小题,每小题5分,共60分 1.下列语句表示的事件中的因素不具有相关关系的是( A瑞雪兆丰年 B.名师出高徒 C.吸烟有害健康 D.喜鹊叫喜,乌鸦叫丧 答案D 解析:“喜鹊叫喜,鸟鸦叫丧”是一种迷信说法,它们之间无任何关系,故选D 2.对两个变量y与x进行回归分析,分别选择4个不同的模型,根据下面的数据可 得拟合效果最好的模型是() A.模型1,其中样本相关系数r为-0.98 B.模型2,其中样本相关系数r为0.80 C.模型3,其中样本相关系数r为-0.50 D.模型4,其中样本相关系数r为0.25 答案:A 解析:样本相关系数的绝对值越大,其相关性越强,模型1样本相关系数为-0.98,其 绝对值最大,相关性也最强,故模型1的拟合效果最好,故选A 3.甲、乙两个平行班(甲班A老师教,乙班B老师教)进行某次数学考试,按学生考 试及格与不及格统计成绩后的2×2列联表如下表所示, 单位:人 是否及格 班级 合计 不及格 及格 甲班(A教) 36 40 乙班(B教) 16 24 40 合计 20 60 80 有充分证据推断不及格人数与不同老师执教有关,且此推断犯错误的概率不超过 () A.0.005 B.0.001 C.0.0025 D.无充分依据 答案A 解析以2= n(ad-bc)2 80×14×2416x362=9.6>7.879=x0.005, (a+b)(c+d0(a+c)(b+d)40×40×20×60 故此推断犯错误的概率不超过0.005. 4.某考察团对全国10大城市进行职工人均工资水平x(单位:千元)与居民人均消 费水平(单位:千元)统计调查,y与x具有线性相关关系,其经验回归方程为
第八章过关检测(B 卷) (时间:120 分钟 满分:150 分) 一、选择题:本大题共 12 小题,每小题 5 分,共 60 分. 1.下列语句表示的事件中的因素不具有相关关系的是( ) A.瑞雪兆丰年 B.名师出高徒 C.吸烟有害健康 D.喜鹊叫喜,乌鸦叫丧 答案:D 解析:“喜鹊叫喜,乌鸦叫丧”是一种迷信说法,它们之间无任何关系,故选 D. 2.对两个变量 y 与 x 进行回归分析,分别选择 4 个不同的模型,根据下面的数据可 得拟合效果最好的模型是( ) A.模型 1,其中样本相关系数 r 为-0.98 B.模型 2,其中样本相关系数 r 为 0.80 C.模型 3,其中样本相关系数 r 为-0.50 D.模型 4,其中样本相关系数 r 为 0.25 答案:A 解析:样本相关系数的绝对值越大,其相关性越强,模型 1 样本相关系数为-0.98,其 绝对值最大,相关性也最强,故模型 1 的拟合效果最好,故选 A. 3.甲、乙两个平行班(甲班 A 老师教,乙班 B 老师教)进行某次数学考试,按学生考 试及格与不及格统计成绩后的 2×2 列联表如下表所示. 单位:人 班级 是否及格 合计 不及格 及格 甲班(A 教) 4 36 40 乙班(B 教) 16 24 40 合计 20 60 80 有充分证据推断不及格人数与不同老师执教有关,且此推断犯错误的概率不超过 ( ) A.0.005 B.0.001 C.0.002 5 D.无充分依据 答案:A 解析:χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) = 80 ×(4×24-16×36) 2 40 ×40×20×60 =9.6>7.879=x0.005, 故此推断犯错误的概率不超过 0.005. 4.某考察团对全国 10 大城市进行职工人均工资水平 x(单位:千元)与居民人均消 费水平 y(单位:千元)统计调查,y 与 x 具有线性相关关系,其经验回归方程为
y=0.66x+1.562.若某城市居民人均消费水平为7.675千元,估计该城市人均消费额 占人均工资收入的百分比约为( ) A.83% B.72% C.67% D.66% 答案:A 解析:将y=7.675代入经验回归方程,可计算得x9.26,因此该城市人均消费额占 人均工资收入的百分比约为7.675÷9.26≈0.83,即该城市人均消费额占人均工资 收入的百分比约为83% 5.己知变量x与y具有相关关系,且由观测数据得到的样本数据散点图如图所示, 则由该观测数据求得的经验回归方程可能是() A.y=-1.314x+1.520 B.y=1.314x+1.520 C.y=-1.314x-1.520 D.y=1.314x-1.520 答案B 解析:由样本数据散点图可知,经验回归方程中α>0,b>0,故选B 6.下列说法中,错误的个数是() ①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变: ②经验回归方程y=3-7x,变量x增加1个单位时,y平均增加7个单位 ③在一个2×2列联表中,若x2=13.079,则犯错误的概率不超过0.001. A.0 B.1 C.2 D.3 答案B 解析:由方差的性质得①正确;对于经验回归方程y=3-7x,变量x增加1个单位时,y 平均减少7个单位,故②错误:若X2=13.079>10.828,则犯错误的概率不超过0.001, 故③正确 7.已知船员人数关于船的吨位的经验回归方程是y=95+0.06x若两艘轮船吨位相 差1000吨,则船员平均人数相差( A.40 B.57 C.60 D.95 答案:C
𝑦 ^ =0.66x+1.562.若某城市居民人均消费水平为 7.675 千元,估计该城市人均消费额 占人均工资收入的百分比约为( ) A.83% B.72% C.67% D.66% 答案:A 解析:将 y=7.675 代入经验回归方程,可计算得 x≈9.26,因此该城市人均消费额占 人均工资收入的百分比约为 7.675÷9.26≈0.83,即该城市人均消费额占人均工资 收入的百分比约为 83%. 5.已知变量 x 与 y 具有相关关系,且由观测数据得到的样本数据散点图如图所示, 则由该观测数据求得的经验回归方程可能是( ) A.𝑦 ^ =-1.314x+1.520 B.y ^ =1.314x+1.520 C.𝑦 ^ =-1.314x-1.520 D.𝑦 ^ =1.314x-1.520 答案:B 解析:由样本数据散点图可知,经验回归方程中𝑎 ^ >0,b ^ >0,故选 B. 6.下列说法中,错误的个数是( ) ①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变; ②经验回归方程𝑦 ^ =3-7x,变量 x 增加 1 个单位时,𝑦 ^平均增加 7 个单位; ③在一个 2×2 列联表中,若 χ 2=13.079,则犯错误的概率不超过 0.001. A.0 B.1 C.2 D.3 答案:B 解析:由方差的性质得①正确;对于经验回归方程𝑦 ^ =3-7x,变量 x 增加 1 个单位时,y ^ 平均减少 7 个单位,故②错误;若 χ 2=13.079>10.828,则犯错误的概率不超过 0.001, 故③正确. 7.已知船员人数关于船的吨位的经验回归方程是𝑦 ^ =95+0.06x.若两艘轮船吨位相 差 1 000 吨,则船员平均人数相差( ) A.40 B.57 C.60 D.95 答案:C
解析:由题意,由于经验回归方程是y=95+0.06x,两艘轮船吨位相差1000吨,则船 员平均人数的差值是0.06×1000=60 8.(多选题)下列说法错误的是() A.对于独立性检验,x的值越大,说明两事件相关程度越大 B.以模型y=cea去拟合一组数据时,为了求出经验回归方程,设=ny,将其变换后 得到经验回归方程=0.3x+4,则c,k的值分别是e4和0.3 C.已知随机变量水N0,a2),若P(M<2)=a,则PK2)的值为 D.通过经验回归直线y=bx+a及回归系数b,可以精确反映变量的取值和变化趋 势 答案:AD 解析:对于AX2是检验两个分类变量之间是否有关联,故错误;对于B,lny=kx+ln c=0.3x+4,则c,k的值分别是e4和0.3,故正确:对于C,已知随机变量 X-N0,g2),P(XM<2)=a,由正态密度曲线的对称性可知,PX2)的值为,故正确:对 于D,通过经验回归直线y=bx+a及回归系数b,只能大致地(不能精确)反映变量 的取值和变化趋势,故错误.综上所述,故选AD 9.(多选题)设某大学的女生体重(单位:kg)与身高x(单位:cm)具有线性相关关系 根据一组样本数据(x)(i=1,2,…,n),用最小二乘法建立的经验回归方程为 y=0.85x-85.71,则下列结论正确的是( Ay与x具有正的线性相关关系 B.经验回归直线过样本点的中心(区,) C.若该大学某女生身高增加1cm,则其体重约增加0.85kg D.若该大学某女生身高为170cm,则可断定其体重必为58.79kg 答案:ABC 解析:D选项中,若该大学某女生身高为170cm,则可预测,不可断定其体重约为 0.85×170-85.71=58.79kg). 故D选项错误.ABC都正确! 10.高三某班学生每周用于数学学习的时间x(单位:时)与数学成绩(单位:分)之间 有如下数据: 24 15 23 19 16 20 16 17 13 y92 79 97 89 64 47 83 68 71 59 根据上表可得经验回归方程的系数b≈3.53.若某学生每周用于数学学习的时间为 18小时,则可预测该学生的数学成绩(结果保留整数)是( A.71分 B.80分 C.74分 D.77分 答案D
解析:由题意,由于经验回归方程是𝑦 ^ =95+0.06x,两艘轮船吨位相差 1 000 吨,则船 员平均人数的差值是 0.06×1 000=60. 8.(多选题)下列说法错误的是( ) A.对于独立性检验,χ 2 的值越大,说明两事件相关程度越大 B.以模型 y=ce kx 去拟合一组数据时,为了求出经验回归方程,设 z=ln y,将其变换后 得到经验回归方程 z=0.3x+4,则 c,k 的值分别是 e 4 和 0.3 C.已知随机变量 X~N(0,σ 2 ),若 P(|X|2)的值为1-𝑎 2 D.通过经验回归直线𝑦 ^ = b ^ x+𝑎 ^及回归系数𝑏 ^ ,可以精确反映变量的取值和变化趋 势 答案:AD 解析:对于 A,χ 2 是检验两个分类变量之间是否有关联,故错误;对于 B,ln y=kx+ln c=0.3x+4,则 c,k 的值分别是 e 4 和 0.3,故正确;对于 C,已知随机变量 X~N(0,σ 2 ),P(|X|2)的值为1-𝑎 2 ,故正确;对 于 D,通过经验回归直线𝑦 ^ = b ^ x+𝑎 ^及回归系数𝑏 ^ ,只能大致地(不能精确)反映变量 的取值和变化趋势,故错误.综上所述,故选 AD. 9.(多选题)设某大学的女生体重 y(单位:kg)与身高 x(单位:cm)具有线性相关关系, 根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的经验回归方程为 𝑦 ^ =0.85x-85.71,则下列结论正确的是( ) A.y 与 x 具有正的线性相关关系 B.经验回归直线过样本点的中心(x, y) C.若该大学某女生身高增加 1 cm,则其体重约增加 0.85 kg D.若该大学某女生身高为 170 cm,则可断定其体重必为 58.79 kg 答案:ABC 解析:D 选项中,若该大学某女生身高为 170 cm,则可预测,不可断定其体重约为 0.85×170-85.71=58.79(kg). 故 D 选项错误.ABC 都正确. 10.高三某班学生每周用于数学学习的时间 x(单位:时)与数学成绩 y(单位:分)之间 有如下数据: x 24 15 23 19 16 11 20 16 17 13 y 92 79 97 89 64 47 83 68 71 59 根据上表可得经验回归方程的系数𝑏 ^ ≈3.53.若某学生每周用于数学学习的时间为 18 小时,则可预测该学生的数学成绩(结果保留整数)是( ) A.71 分 B.80 分 C.74 分 D.77 分 答案:D
解析:学生每周用于数学学习的时间的平均值 元=24+15+23+19+16+11+20+16+17+3=17.4(时)》 10 数学成绩的平均值 了=92+79+97+89+64+47+83+68+71+59=74.9(分), 10 即a=y-bx=74.9-3.53×17.4=13.478. 当x=18时,y=3.53×18+13.478=77.018≈77, 预测该学生的数学成绩为77分 11.小明同学在做市场调查时得到如下样本数据: 33 10 2 他由此得到的经验回归方程为y=-2.1x+15.5,则下列说法错误的是( A变量x与y线性负相关 B.当x=2时可以预测y=11.3 C.a=6 D.变量x与y之间是函数关系 答案D 解析:由经验回归方程y=-2.1x+15.5,可知变量x与y线性负相关,故A正确: 当x=2时,y=-2.1×2+15.5=11.3,故B正确; :元=+3+6+10-=5,y=8+a+4+2=14+ “样本点的中心坐标为5,), 代入y=-2.1x+15.5,得4+e=-2.1×5+15.5,解得a=6,故C正确;变量x与y负线性相 关,故D错误, 12.为研究某种细菌在特定环境下,随时间变化的繁殖情况,得到如下实验数据: 天数x/天 3 6 繁殖个数y千个 2.5 3 4.5 由最小二乘法得y与x的经验回归方程为y=0.7x+a,则当x=7时,繁殖个数y的预 测值为( A.4.9 B.5.25 C.5.95 D.6.15 答案B 解析:由题意,根据表格中的数据,可得元=455=了=25+45=号 4 4 即样本中心为(任)代入经验回归方程y=0.7x+a,即=0.7×号+à,解得a=0.35, 即经验回归方程为y=0.7x+0.35
解析:学生每周用于数学学习的时间的平均值 𝑥 = 24+15+23+19+16+11+20+16+17 +13 10 =17.4(时), 数学成绩的平均值 𝑦 = 92+79+97+89+64+47+83+68+71+59 10 =74.9(分), 即𝑎 ^ = y − b ^ 𝑥=74.9-3.53×17.4=13.478. 当 x=18 时,𝑦 ^ =3.53×18+13.478=77.018≈77, 预测该学生的数学成绩为 77 分. 11.小明同学在做市场调查时得到如下样本数据: x 1 3 6 10 y 8 a 4 2 他由此得到的经验回归方程为𝑦 ^ =-2.1x+15.5,则下列说法错误的是( ) A.变量 x 与 y 线性负相关 B.当 x=2 时可以预测y ^ =11.3 C.a=6 D.变量 x 与 y 之间是函数关系 答案:D 解析:由经验回归方程𝑦 ^ =-2.1x+15.5,可知变量 x 与 y 线性负相关,故 A 正确; 当 x=2 时,y ^ =-2.1×2+15.5=11.3,故 B 正确; ∵𝑥 = 1+3+6+10 4 =5,𝑦 = 8+𝑎+4+2 4 = 14+𝑎 4 , ∴样本点的中心坐标为(5, 14+𝑎 4 ), 代入𝑦 ^ =-2.1x+15.5,得 14+𝑎 4 =-2.1×5+15.5,解得 a=6,故 C 正确;变量 x 与 y 负线性相 关,故 D 错误. 12.为研究某种细菌在特定环境下,随时间变化的繁殖情况,得到如下实验数据: 天数 x/天 3 4 5 6 繁殖个数 y/千个 2.5 3 4 4.5 由最小二乘法得 y 与 x 的经验回归方程为𝑦 ^ =0.7x+a ^ ,则当 x=7 时,繁殖个数 y 的预 测值为( ) A.4.9 B.5.25 C.5.95 D.6.15 答案:B 解析:由题意,根据表格中的数据,可得𝑥 = 3+4+5+6 4 = 9 2 , 𝑦 = 2.5+3+4+4.5 4 = 7 2 , 即样本中心为( 9 2 , 7 2 ),代入经验回归方程𝑦 ^ =0.7x+a ^ ,即 7 2 =0.7× 9 2 + 𝑎 ^ ,解得𝑎 ^ =0.35, 即经验回归方程为𝑦 ^ =0.7x+0.35
当x=7时,y=0.7×7+0.35=5.25,故选B 二、填空题:本大题共4小题,每小题5分,共20分 13.“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博 拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表: 单位:只 是否服 是否感染 合计 用疫苗 感染 未感染 服用 10 40 50 未服用 20 30 50 合计 30 70 100 根据上表,小动物是否感染与服用疫苗有关,这个结论犯错误的概率不超 过 答案0.05 解析:由题中数据可得 n(ad-bc)2 X-=a+bxc+ana+cbt0、 =100×10×30-40×202=100≈4.762>3.841=X0.05, 50×50×30×70 21 根据临界值表可得,小动物是否感染与服用疫苗有关,这个结论犯错误的概率不超 过0.05. 14.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场以降低生产 成本,某白酒酿造企业市场部对该企业9月份的产品销量(单位:千箱)与单位成本 (单位:元)的资料进行经验回归分析,结果如下x=子,=71,∑x好=79,∑x=1 481,b= 1481-6×2×71 79-6×(③ -1.8182,a=71-(1.8182)×277.36,则销售量每增加1千箱,单 位成本下降 元 答案1.8182 解析:由已知条件得y=-1.8182x+77.36,销售量每增加1千箱,则单位成本下降 1.8182元 15.对有关数据的分析可知,每立方米混凝土的水泥用量x(单位:kg)与28天后混 凝土的抗压度单位kgcm)之间具有线性相关关系,其经验回归方程为 y=0.30x+9.99.根据建设项目的需要,28天后混凝土的抗压度不得低于89.7 kg/cm,则每立方米混凝土的水泥用量最少应为. kg.(精确到0.1kg) 答案265.7 解析:由已知,得0.30x+9.99≥89.7,解得x≥265.7 16.某工厂为研究某种产品的产量x(单位:吨)与所需某种原材料的质量(单位:吨) 的相关性,在生产过程中收集4组对应数据(xy),如下表所示
当 x=7 时,𝑦 ^ =0.7×7+0.35=5.25,故选 B. 二、填空题:本大题共 4 小题,每小题 5 分,共 20 分. 13.“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁,为了考察某种埃博 拉病毒疫苗的效果,现随机抽取 100 只小鼠进行试验,得到如下列联表: 单位:只 是否服 用疫苗 是否感染 合计 感染 未感染 服用 10 40 50 未服用 20 30 50 合计 30 70 100 根据上表,小动物是否感染与服用疫苗有关,这个结论犯错误的概率不超 过 . 答案:0.05 解析:由题中数据可得: χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) = 100 ×(10×30-40 ×20) 2 50 ×50×30×70 = 100 21 ≈4.762>3.841=x0.05, 根据临界值表可得,小动物是否感染与服用疫苗有关,这个结论犯错误的概率不超 过 0.05. 14.面对竞争日益激烈的消费市场,众多商家不断扩大自己的销售市场以降低生产 成本,某白酒酿造企业市场部对该企业 9 月份的产品销量(单位:千箱)与单位成本 (单位:元)的资料进行经验回归分析,结果如下:𝑥 = 7 2 , 𝑦=71, ∑ 𝑖=1 6 xi 2=79, ∑ i=1 6 xiyi=1 481,𝑏 ^ = 1 481-6× 7 2 ×71 79-6×( 7 2 ) 2 ≈-1.818 2,𝑎 ^ =71-(-1.818 2)× 7 2 ≈77.36,则销售量每增加 1 千箱,单 位成本下降 元. 答案:1.818 2 解析:由已知条件得𝑦 ^ =-1.818 2x+77.36,销售量每增加 1 千箱,则单位成本下降 1.818 2 元. 15.对有关数据的分析可知,每立方米混凝土的水泥用量 x(单位:kg)与 28 天后混 凝土的抗压度 y(单位:kg/cm2 )之间具有线性相关关系,其经验回归方程为 y ^ =0.30x+9.99.根据建设项目的需要,28 天后混凝土的抗压度不得低于 89.7 kg/cm2 ,则每立方米混凝土的水泥用量最少应为 kg.(精确到 0.1 kg) 答案:265.7 解析:由已知,得 0.30x+9.99≥89.7,解得 x≥265.7. 16.某工厂为研究某种产品的产量 x(单位:吨)与所需某种原材料的质量 y(单位:吨) 的相关性,在生产过程中收集 4 组对应数据(x,y),如下表所示
3 4 5 6 2.5 3 m 根据表中数据,得出y关于x的经验回归方程为y=0.7x+a.据此计算出在样本(4,3) 处的残差为-0.15,则表中m的值为 答案4.5 解析:根据题意可得,在样本(4,3)处,y=3.15 则3.15=0.7×4+a,解得a=0.35 由题表可知,元=2×(3+4+5+6)=4.5, 因为经验回归方程为y=0.7x+0.35过样本的中心点(,), 所以y=0.7x+0.35=0.7×4.5+0.35=3.5. 故4y=9.5+m,解得m=4.5. 三、解答题共70分.解答应写出文字说明、证明过程或演算步骤 17.(10分)甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸x(单 位:cm)及个数y,如下表: 零件尺寸x 1.01 1.02 1.03 1.04 1.05 零件闸 3 8 3 个数y乙 7 4 由表中数据得y关于x的经验回归方程为y=-91+100x(1.01≤x≤1.05),其中合格 零件尺寸为1.03±0.01(cm)完成下面列联表,根据小概率值a=0.01的独立性检 验,能否推断出加工零件的质量与甲、乙有关? 单位:个 零件是不是合格 机床 合格 不合格 合计 甲 合计 解元=1.03,万=,y=-91+100x知*9-.91+100x1.03,解得a-11 由于合格零件尺寸为1.03士0.01cm, 故甲、乙加工的合格与不合格零件的数据表为 单位:个 零件是不是合格 机床 合计 合格 不合格 甲 24 Bo 12 18 B0
x 3 4 5 6 y 2.5 3 4 m 根据表中数据,得出 y 关于 x 的经验回归方程为𝑦 ^ =0.7x+a ^ .据此计算出在样本(4,3) 处的残差为-0.15,则表中 m 的值为 . 答案:4.5 解析:根据题意可得,在样本(4,3)处,𝑦 ^ =3.15, 则 3.15=0.7×4+a ^ ,解得𝑎 ^ =0.35. 由题表可知,𝑥 = 1 4 ×(3+4+5+6)=4.5, 因为经验回归方程为𝑦 ^ =0.7x+0.35 过样本的中心点(𝑥, 𝑦), 所以𝑦=0.7𝑥+0.35=0.7×4.5+0.35=3.5. 故 4𝑦=9.5+m,解得 m=4.5. 三、解答题:共 70 分.解答应写出文字说明、证明过程或演算步骤. 17.(10 分)甲、乙两机床加工同一种零件,抽检得到它们加工后的零件尺寸 x(单 位:cm)及个数 y,如下表: 零件尺寸 x 1.01 1.02 1.03 1.04 1.05 零件 个数 y 甲 3 7 8 9 3 乙 7 4 4 4 a 由表中数据得 y 关于 x 的经验回归方程为𝑦 ^ =-91+100x(1.01≤x≤1.05),其中合格 零件尺寸为 1.03±0.01(cm).完成下面列联表,根据小概率值 α=0.01 的独立性检 验,能否推断出加工零件的质量与甲、乙有关? 单位:个 机床 零件是不是合格 合计 合格 不合格 甲 乙 合计 解:𝑥=1.03,𝑦 = 𝑎+49 5 ,由𝑦 ^ =-91+100x,知 a+49 5 =-91+100×1.03,解得 a=11. 由于合格零件尺寸为 1.03±0.01 cm, 故甲、乙加工的合格与不合格零件的数据表为 单位:个 机床 零件是不是合格 合计 合格 不合格 甲 24 6 30 乙 12 18 30
合计 36 24 50 零假设为H0:加工零件的质量与甲、乙无关】 n(ad-be)2 60x24×18-6×12=10>6.635=x0.01. (a+K(d)30x0x6 根据小概率值α=0.01的独立性检验,有充分证据推断H0不成立】 即认为加工零件的质量与甲、乙有关,此推断犯错误的概率不大于0.01」 18.(12分)某省高考政策修改为取消文理科,实行3+3”,成绩由语文、数学、外语 统一高考成绩和自主选考的3门普通高中学业水平考试等级性考试科目成绩构 成.为了解各年龄层对新高考的了解情况,随机调查50人(把年龄在15,45)称为中 青年,年龄在45,75)称为中老年),并把调查结果制成下表: 年龄 15,25) 25,35) 岁 I35,45) [45,55) [55,65) [65,75) 频数 15 10 10 5 了解 4 12 5 (1)分别估计中青年和中老年对新高考了解的概率; (2)请根据上表完成下面2×2列联表,根据小概率值α=0.05的2的独立性检验,分 析对新高考的了解与年龄(中青年、中老年)是否有关: 单位:人 是否了解新高考 年龄 合计 了解新高考 不了解新高考 中青年 中老年 合计 附2= n(ad-bc)2 a+bXc+d)(a+cXb+an=a+b+c+d. 0.050 0.010 0.001 3.841 6.635 10.828 (3)若从年龄在区间[55,65)内的被调查者中随机选取3人进行调查,记选中的3人 中了解新高考的人数为X,求X的分布列以及E) 解:()由题中数据可知,中青年对新高考了解的概率P=二=兰中老年对新高考了 3015 解的概率P品=号 (2)零假设为H0:对新高考的了解与年龄(中青年、中老年)无关. 列联表如下表所示 单位:人 是否了解新高考 年龄 合计 了解新高考 不了解新高考
合计 36 24 60 零假设为 H0:加工零件的质量与甲、乙无关. χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) = 60×(24×18-6 ×12) 2 30×30×36 ×24 =10>6.635=x0.01. 根据小概率值 α=0.01 的独立性检验,有充分证据推断 H0 不成立, 即认为加工零件的质量与甲、乙有关,此推断犯错误的概率不大于 0.01. 18.(12 分)某省高考政策修改为取消文理科,实行“3+3”,成绩由语文、数学、外语 统一高考成绩和自主选考的 3 门普通高中学业水平考试等级性考试科目成绩构 成.为了解各年龄层对新高考的了解情况,随机调查 50 人(把年龄在[15,45)称为中 青年,年龄在[45,75)称为中老年),并把调查结果制成下表: 年龄 /岁 [15,25) [25,35) [35,45) [45,55) [55,65) [65,75) 频数 5 15 10 10 5 5 了解 4 12 6 5 2 1 (1)分别估计中青年和中老年对新高考了解的概率; (2)请根据上表完成下面 2×2 列联表,根据小概率值 α=0.05 的 χ 2 的独立性检验,分 析对新高考的了解与年龄(中青年、中老年)是否有关; 单位:人 年龄 是否了解新高考 合计 了解新高考 不了解新高考 中青年 中老年 合计 附:χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) ,n=a+b+c+d. α 0.050 0.010 0.001 xα 3.841 6.635 10.828 (3)若从年龄在区间[55,65)内的被调查者中随机选取 3 人进行调查,记选中的 3 人 中了解新高考的人数为 X,求 X 的分布列以及 E(X). 解:(1)由题中数据可知,中青年对新高考了解的概率 P=22 30 = 11 15 ,中老年对新高考了 解的概率 P= 8 20 = 2 5 . (2)零假设为 H0:对新高考的了解与年龄(中青年、中老年)无关. 列联表如下表所示. 单位:人 年龄 是否了解新高考 合计 了解新高考 不了解新高考
中青年 22 8 30 中老年 8 12 20 合计 Bo 20 50 根据列联表中的数据,经计算得到2-50x22x128×5.56>3.841=x0.0s, 30×20×30×20 根据小概率值α=0.05的独立性检验,有充分证据推断H0不成立,即认为对新高考 的了解与年龄(中青年、中老年)有关,此推断犯错误的概率不大于0.05 (3)年龄在区间[55,65)内的被调查者共5人,其中了解新高考的有2人,则抽取的3 人中了解新高考的人数X可能取值为0,1,2, 则PX=0)=2c=L 103 PCX-I)- c-10 P0X-2)-謦=品 所以X的分布列为 2 3 10 5 10 00-0x六+1号+2x品=目 10 5 19.(12分)某高校共有学生15000人,其中男生10500人,女生4500人.为调查该 校学生每周平均体育运动时间的情况,采用分层随机抽样的方法,收集300名学生 每周平均体育运动时间(单位:时)的样本数据 ()应收集多少名女生的样本数据? (2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图如 图所示,其中样本数据的分组区间为[0,2),[2,4),[4,6),[6,8),[8,10),[10,12]估计该校 学生每周平均体育运动时间超过4小时的概率 ↑频率组距 0.150 0.125 0.100 0.075 0.025 0 024681012时间/时 (3)在样本数据中,有60名女生的每周平均体育运动时间超过4个小时,请完成每 周平均体育运动时间与性别的列联表,根据小概率值α=0.05的独立性检验,能否 推断出该校学生的每周平均体育运动时间与性别有关? 参考公式x= n(ad-bc)2 n=a+b+c+d. a+by(c+d(a+c)b+d)
中青年 22 8 30 中老年 8 12 20 合计 30 20 50 根据列联表中的数据,经计算得到 χ 2= 50×(22×12-8 ×8) 2 30 ×20×30×20 ≈5.56>3.841=x0.05, 根据小概率值 α=0.05 的独立性检验,有充分证据推断 H0 不成立,即认为对新高考 的了解与年龄(中青年、中老年)有关,此推断犯错误的概率不大于 0.05. (3)年龄在区间[55,65)内的被调查者共 5 人,其中了解新高考的有 2 人,则抽取的 3 人中了解新高考的人数 X 可能取值为 0,1,2, 则 P(X=0)= C2 0C3 3 C5 3 = 1 10 ; P(X=1)= C2 1C3 2 C5 3 = 6 10 = 3 5 ; P(X=2)= C2 2C3 1 C5 3 = 3 10 . 所以 X 的分布列为 X 0 1 2 P 1 10 3 5 3 10 E(X)=0× 1 10 +1× 3 5 +2× 3 10 = 6 5 . 19.(12 分)某高校共有学生 15 000 人,其中男生 10 500 人,女生 4 500 人.为调查该 校学生每周平均体育运动时间的情况,采用分层随机抽样的方法,收集 300 名学生 每周平均体育运动时间(单位:时)的样本数据. (1)应收集多少名女生的样本数据? (2)根据这 300 个样本数据,得到学生每周平均体育运动时间的频率分布直方图如 图所示,其中样本数据的分组区间为[0,2),[2,4),[4,6),[6,8),[8,10),[10,12].估计该校 学生每周平均体育运动时间超过 4 小时的概率. (3)在样本数据中,有 60 名女生的每周平均体育运动时间超过 4 个小时,请完成每 周平均体育运动时间与性别的列联表,根据小概率值 α=0.05 的独立性检验,能否 推断出该校学生的每周平均体育运动时间与性别有关? 参考公式:χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) ,n=a+b+c+d
X2的独立性检验中常用的小概率值和相应的临界值: 0.1 0.05 0.01 0.005 2.706 3.841 6.635 7.879 解(1)由分层随机抽样可得300×4500=90,故应收集90名女生的样本数据. 15000 (2)由频率分布直方图得学生每周平均体育运动超过4小时的频率为1 2×(0.100+0.025)=0.75,故该校学生每周平均体育运动时间超过4小时的概率的估 计值为0.75. (3)由(2)知,300名学生中有300×0.75=225(人)的每周平均体育运动时间超过4小 时,75人的每周平均体育运动时间不超过4小时.样本数据中有210份是关于男 生的,90份是关于女生的,可得每周平均体育运动时间与性别列联表: 单位:人 每周平均体育 性别 男生 合计 运动时间 女生 不超过4小时 45 30 75 超过4小时 165 60 225 合计 210 190 300 零假设为H0:该校学生的每周平均体育运动时间与性别无关, 结合列联表可算得2-0X456030X1654.762>3.841=005 75×225×210×90 根据小概率值α=0.05的独立性检验,有充分证据推断H0不成立,即认为该校学生 的每周平均体育运动时间与性别有关,此推断犯错误的概率不大于0.05 20.(12分)某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名 为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法从中抽 取了100名工人,先统计了他们某月的日平均生产件数,再按工人年龄在25周岁 以上(含25周岁)”和25周岁以下”分为两组,最后将两组工人的日平均生产件数 分成5组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到频率分布直方 图如图所示 ↑频率组距 0.0350 0.0200 0.0050 405060708090100件数 25周岁以上组
χ 2 的独立性检验中常用的小概率值和相应的临界值: α 0.1 0.05 0.01 0.005 xα 2.706 3.841 6.635 7.879 解:(1)由分层随机抽样可得 300× 4 500 15 000 =90,故应收集 90 名女生的样本数据. (2)由频率分布直方图得学生每周平均体育运动超过 4 小时的频率为 1- 2×(0.100+0.025)=0.75,故该校学生每周平均体育运动时间超过 4 小时的概率的估 计值为 0.75. (3)由(2)知,300 名学生中有 300×0.75=225(人)的每周平均体育运动时间超过 4 小 时,75 人的每周平均体育运动时间不超过 4 小时.样本数据中有 210 份是关于男 生的,90 份是关于女生的,可得每周平均体育运动时间与性别列联表: 单位:人 每周平均体育 运动时间 性别 合计 男生 女生 不超过 4 小时 45 30 75 超过 4 小时 165 60 225 合计 210 90 300 零假设为 H0:该校学生的每周平均体育运动时间与性别无关. 结合列联表可算得 χ 2= 300 ×(45×60-30 ×165 ) 2 75 ×225×210×90 ≈4.762>3.841=x0.05. 根据小概率值 α=0.05 的独立性检验,有充分证据推断 H0 不成立,即认为该校学生 的每周平均体育运动时间与性别有关,此推断犯错误的概率不大于 0.05. 20.(12 分)某工厂有 25 周岁以上(含 25 周岁)工人 300 名,25 周岁以下工人 200 名. 为研究工人的日平均生产量是否与年龄有关,现采用分层随机抽样的方法从中抽 取了 100 名工人,先统计了他们某月的日平均生产件数,再按工人年龄在“25 周岁 以上(含 25 周岁)”和“25 周岁以下”分为两组,最后将两组工人的日平均生产件数 分成 5 组:[50,60),[60,70),[70,80),[80,90),[90,100]分别加以统计,得到频率分布直方 图如图所示. 25 周岁以上组
↑频率组距 0.0325 0.0250 0.0050 405060708090100件数 25周岁以下组 (1)从样本中日平均生产件数不足60的工人中随机抽取2人,求至少抽到一名25 周岁以下组”工人的概率; (2)规定日平均生产件数不少于80者为生产能手”,请根据已知条件作出2×2列 联表,依据小概率值α=O.1的独立性检验,能否推断生产能手与工人所在的年龄组 有关? 解:(1)由已知得,样本中有25周岁以上组工人60名,25周岁以下组工人40名 故样本中日平均生产件数不足60件的工人中,25周岁以上组工人有 60×0.05=3(人),记为A1,A2,A325周岁以下组工人有40×0.05=2(人),记为B1,B2 从中随机抽取2名工人,所有可能的结果共有10种,它们 是:(A1,A2),(A1,A3),(A2,A3,(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,BI),(A3,B2,(B1,B2) 其中,至少有1名“25周岁以下组”工人的可能结果共有7种,它们 是(A1,B1,(A1,B2),(A2,B1),(A2,B2,A3,B1),(A3,B2),(B1,B2. 故所求的概率P=Z 101 (2)由频率分布直方图可知 在抽取的100名工人中,25周岁以上组”中的生产能手60×0.25=15(人),“25周岁 以下组”中的生产能手40×0.375=15(人), 据此可得列联表如下: 单位:人 是不是生产能手 组别 合计 是生产能手 非生产能手 25周岁以上组 15 45 60 25周岁以下组 15 25 40 合计 30 70 100 零假设为H0:生产能手与工人所在的年龄组无关 X-10X52515×45=21.79<2.706=0l 60×40×30×70 14 根据小概率值α=0.1的独立性检验,没有证据推断Ho不成立,因此可以认为H0成 立,即认为生产能手与工人所在的年龄组无关
25 周岁以下组 (1)从样本中日平均生产件数不足 60 的工人中随机抽取 2 人,求至少抽到一名“25 周岁以下组”工人的概率; (2)规定日平均生产件数不少于 80 者为“生产能手”,请根据已知条件作出 2×2 列 联表,依据小概率值 α=0.1 的独立性检验,能否推断生产能手与工人所在的年龄组 有关? 解:(1)由已知得,样本中有 25 周岁以上组工人 60 名,25 周岁以下组工人 40 名. 故样本中日平均生产件数不足 60 件的工人中,25 周岁以上组工人有 60×0.05=3(人),记为 A1,A2,A3;25 周岁以下组工人有 40×0.05=2(人),记为 B1,B2. 从中随机抽取 2 名工人,所有可能的结果共有 10 种,它们 是:(A1,A2),(A1,A3),(A2,A3),(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2). 其中,至少有 1 名“25 周岁以下组”工人的可能结果共有 7 种,它们 是:(A1,B1),(A1,B2),(A2,B1),(A2,B2),(A3,B1),(A3,B2),(B1,B2). 故所求的概率 P= 7 10 . (2)由频率分布直方图可知, 在抽取的 100 名工人中,“25 周岁以上组”中的生产能手 60×0.25=15(人),“25 周岁 以下组”中的生产能手 40×0.375=15(人), 据此可得列联表如下: 单位:人 组别 是不是生产能手 合计 是生产能手 非生产能手 25 周岁以上组 15 45 60 25 周岁以下组 15 25 40 合计 30 70 100 零假设为 H0:生产能手与工人所在的年龄组无关. χ 2= 100 ×(15×25-15 ×45) 2 60 ×40×30×70 = 25 14 ≈1.79<2.706=x0.1. 根据小概率值 α=0.1 的独立性检验,没有证据推断 H0 不成立,因此可以认为 H0 成 立,即认为生产能手与工人所在的年龄组无关