8.3 列联表与独立性检验 课后训练提升 基础巩固 1高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人 数后,得到如下列联表 单位:人 数学成绩 班级 合计 优秀 及格 甲班 11 34 45 乙班 8 37 45 合计 19 71 90 则随机变量,2的值约为( A.0.600 B.0.828 C.2.712 D.6.004 答案A 解析:根据列联表中的数据,可得随机变量_90xx734×8≈0.600.故选A 45×45×19×71 2.在2×2列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么 这两个比值为( A与 c+d Ba与 Ca与 D品a与 答案:A 解析:由题意d ac+ad-ac-bc ad-bc 因为ad-bc的值越大,两个分 (a+b)(c+d) (a+bX(c+a)l 类变量有关系的可能性就越大,故选A, 3.有两个分类变量X,Y,其列联表如下所示 20-a 15-a 30+a 其中a,15-a均为大于5的整数,若变量X与Y不独立,这个结论犯错误的概率不 超过0.05,则a的值为( ) A.8 B.9 C.8或9 D.6或8 答案:C 解析根据公式,得_65a30+a520-a_1x3603.841, 20×45×15×50 20×45×3×2
8.3 列联表与独立性检验 课后· 基础巩固 1.高二第二学期期中考试,按照甲、乙两个班学生的数学成绩优秀和及格统计人 数后,得到如下列联表: 单位:人 班级 数学成绩 合计 优秀 及格 甲班 11 34 45 乙班 8 37 45 合计 19 71 90 则随机变量 χ 2 的值约为( ) A.0.600 B.0.828 C.2.712 D.6.004 答案:A 解析:根据列联表中的数据,可得随机变量 χ 2= 90×(11×37-34 ×8) 2 45×45×19×71 ≈0.600.故选 A. 2.在 2×2 列联表中,两个比值相差越大,两个分类变量有关系的可能性就越大,那么 这两个比值为( ) A. 𝑎 𝑎+𝑏 与 𝑐 𝑐+𝑑 B. 𝑎 𝑐+𝑑 与 𝑐 𝑎+𝑏 C. 𝑎 𝑎+𝑑 与 𝑐 𝑏+𝑐 D. 𝑎 𝑏+𝑑 与 𝑐 𝑎+𝑐 答案:A 解析:由题意,| 𝑎 𝑎+𝑏 - 𝑐 𝑐+𝑑 | = | 𝑎𝑐+𝑎𝑑-𝑎𝑐-𝑏𝑐 (𝑎+𝑏)(𝑐+𝑑) | = | 𝑎𝑑-𝑏𝑐 (𝑎+𝑏)(𝑐+𝑑) |,因为|ad-bc|的值越大,两个分 类变量有关系的可能性就越大,故选 A. 3.有两个分类变量 X,Y,其列联表如下所示, X Y Y1 Y2 X1 a 20-a X2 15-a 30+a 其中 a,15-a 均为大于 5 的整数,若变量 X 与 Y 不独立,这个结论犯错误的概率不 超过 0.05,则 a 的值为( ) A.8 B.9 C.8 或 9 D.6 或 8 答案:C 解析:根据公式,得 χ 2= 65×[𝑎(30+𝑎)-(15-𝑎)(20-𝑎)] 2 20×45×15×50 = 13×(13𝑎-60) 2 20×45 ×3×2 >3.841
根据a>5,且15-a>5,a∈Z求得当a=8或9时满足题意 4.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据,并根据小 概率值α=0.01的独立性检验,得到打鼾与患心脏病有关的结论.下列说法中正 确的是() A.100个心脏病患者中至少有99人打鼾 B.若1个人患心脏病,则这个人有99%的概率打鼾 C.100个心脏病患者中一定有打鼾的人 D.100个心脏病患者中可能一个打鼾的人都没有 答案D 5.下列关于等高堆积条形图的叙述正确的是() A.从等高堆积条形图中可以精确地判断两个分类变量是否有关系 B.从等高堆积条形图中可以看出两个变量频数的相对大小 C.从等高堆积条形图中可以粗略地看出两个分类变量是否有关系 D.以上说法都不对 答案:C 6.(多选题)下列说法正确的是( 附:x独立性检验中常用的小概率值和相应的临界值 0. 0.05 0.01 0.005 0.001 Xa 2.706 3.841 6.635 7.879 10.828 A.经验回归方程对应的直线y=bx+a至少经过其样本数据点 (x1y),(x22),…,(xmm)中的一个点 B.命题“Vx≥1,x2+3≥4”的否定是3x≥1,x2+310.828=x0.001, 故D正确 故选BD 7.某班主任对全班50名学生进行了作业量的调查,数据如下表所示: 单位:人 性别 作业量 合计
根据 a>5,且 15-a>5,a∈Z,求得当 a=8 或 9 时满足题意. 4.在研究打鼾与患心脏病之间的关系中,通过收集数据、整理分析数据,并根据小 概率值 α=0.01 的独立性检验,得到“打鼾与患心脏病有关”的结论.下列说法中正 确的是( ) A.100 个心脏病患者中至少有 99 人打鼾 B.若 1 个人患心脏病,则这个人有 99%的概率打鼾 C.100 个心脏病患者中一定有打鼾的人 D.100 个心脏病患者中可能一个打鼾的人都没有 答案:D 5.下列关于等高堆积条形图的叙述正确的是( ) A.从等高堆积条形图中可以精确地判断两个分类变量是否有关系 B.从等高堆积条形图中可以看出两个变量频数的相对大小 C.从等高堆积条形图中可以粗略地看出两个分类变量是否有关系 D.以上说法都不对 答案:C 6.(多选题)下列说法正确的是( ) 附:χ 2 独立性检验中常用的小概率值和相应的临界值 α 0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 A.经验回归方程对应的直线𝑦 ^ = b ^ x+𝑎 ^ 至少经过其样本数据点 (x1,y1),(x2,y2),…,(xn,yn)中的一个点 B.命题“∀x≥1,x 2+3≥4”的否定是“∃x≥1,x 2+310.828=x0.001, 故 D 正确. 故选 BD. 7.某班主任对全班 50 名学生进行了作业量的调查,数据如下表所示: 单位:人 性别 作业量 合计
认为作业量大 以为作业量不大 男生 18 27 女生 8 15 23 合计 24 50 根据上述数据分析,我们得出的2值约为」 答案:5.059 解析:由18+a=27,得a=9,18+8=b=26. 由公式得2-50X19x158x92≈5.059, 27×23×26×24 8.某学生对其亲属30人的饮食进行了一次调查,30人的饮食指数如图所示.(说明: 图中饮食指数低于70的人,饮食以蔬菜为主:饮食指数高于70的人,饮食以肉类 为主) 甲(50岁以下) 214345587476777882838590 20212526262732333637394244 乙(50岁以上) 4558617578 (1)根据以上数据完成下列2×2列联表; 单位:人 住食 年龄 合计 主食蔬菜 主食肉类 50岁以下 50岁以上 合计 (2)根据小概率值=0.01的独立性检验分析其亲属的饮食习惯与年龄是否有关, 并写出简要分析. 解(1)2×2列联表如下 单位:人 主食 年龄 合计 主食蔬莱 主食肉类 50岁以下 4 8 12 50岁以上 16 2 18 合计 20 10 30 (2)零假设为H0:亲属的饮食习惯与年龄无关联根据列联表中的数据,经计算得到 X2-30x4x216x82 12×18×20×10 10>6.635=x0.01. 根据小概率值α=0.01的独立性检验,推断H0不成立,即认为其亲属的饮食习惯与 年龄有关,此推断犯错误的概率不大于0.01
认为作业量大 认为作业量不大 男生 18 a 27 女生 8 15 23 合计 b 24 50 根据上述数据分析,我们得出的 χ 2 值约为 . 答案:5.059 解析:由 18+a=27,得 a=9,18+8=b=26. 由公式得 χ 2= 50×(18×15-8 ×9) 2 27 ×23×26×24 ≈5.059. 8.某学生对其亲属 30 人的饮食进行了一次调查,30 人的饮食指数如图所示.(说明: 图中饮食指数低于 70 的人,饮食以蔬菜为主;饮食指数高于 70 的人,饮食以肉类 为主) 甲(50 岁以下) 21 43 45 58 74 76 77 78 82 83 85 90 乙(50 岁以上) 20 21 25 26 26 27 32 33 36 37 39 42 44 45 58 61 75 78 (1)根据以上数据完成下列 2×2 列联表; 单位:人 年龄 主食 合计 主食蔬菜 主食肉类 50 岁以下 50 岁以上 合计 (2)根据小概率值 α=0.01 的独立性检验分析其亲属的饮食习惯与年龄是否有关, 并写出简要分析. 解:(1)2×2 列联表如下: 单位:人 年龄 主食 合计 主食蔬菜 主食肉类 50 岁以下 4 8 12 50 岁以上 16 2 18 合计 20 10 30 (2)零假设为 H0:亲属的饮食习惯与年龄无关联.根据列联表中的数据,经计算得到 χ 2= 30×(4×2-16×8) 2 12 ×18×20×10 =10>6.635=x0.01. 根据小概率值 α=0.01 的独立性检验,推断 H0 不成立,即认为其亲属的饮食习惯与 年龄有关,此推断犯错误的概率不大于 0.01
9.某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了55名市 民,得到数据如下表所示: 单位:人 是否喜欢 年龄 合计 喜欢 不喜欢 大于40岁 20 5 25 20岁至40岁 10 20 30 合计 30 25 55 (1)根据小概率值α=0.005的独立性检验分析喜欢“人文景观”景点与年龄是否有 关 (2)用分层随机抽样的方法从喜欢“人文景观°景点的市民中随机抽取6人作进一 步调查,将这6名市民作为一个样本,从中任选2人,求恰有1名大于40岁的市民 和1名20岁至40岁的市民的概率 解(1)零假设为H0:喜欢“人文景观”景,点与年龄无关联根据列联表中的数据,经计 算得2-55120x20-5x1011.978>7.879=00s. 25×30×30×25 根据小概率值α=0.005的独立性检验,推断Ho不成立,因此可以认为喜欢“人文景 观”景点与年龄有关联,此推断犯错误的概率不大于0.005. (2)由题意知抽取的6人中大于40岁的市民有4人,20岁至40岁的市民有2人, 分别记为B1,B2,B3,B4,C1,C2, 从中任选2人的可能结果有 (B1,B2),B1,B3),B1,B4),B1,C1),B1,C2,B2,B3),B2,B4),.B2,C)B2,C2,B3,B4),B3,C1) (B3,C2),B4,C1),B4,C2),(C1,C2,共15个,其中恰有1名大于40岁的市民和1名20 岁至40岁的市民的结果有 (B1,C1),B1,C2),B2,C1),(B2,C2,B3,C),B3,C2),B4,C1),B4,C2),共8个,因此恰有1名 大于40岁的市民和1名20岁至40岁的市民的概率为号 10.某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民 仅有一次参加机会,通过随机抽样,得到参与问卷调查的100人的得分(满分:100 分)数据,统计结果如表所示, 组别 [40, [50, [60, [70, [80, [90, 50) 50) 70) 180) 90) 100) 男 2 5 15 18 12 女 0 10 13 (1)若规定问卷得分不低于70分的市民称为“环保关注者”,请列出2×2列联表,根 据小概率值α=0.05的独立性检验,分析“环保关注者”是否与性别有关 (2)若问卷得分不低于80分的人称为环保达人”,视频率为概率:
9.某旅行社为调查市民喜欢“人文景观”景点是否与年龄有关,随机抽取了 55 名市 民,得到数据如下表所示: 单位:人 年龄 是否喜欢 合计 喜欢 不喜欢 大于 40 岁 20 5 25 20 岁至 40 岁 10 20 30 合计 30 25 55 (1)根据小概率值 α=0.005 的独立性检验分析喜欢“人文景观”景点与年龄是否有 关. (2)用分层随机抽样的方法从喜欢“人文景观”景点的市民中随机抽取 6 人作进一 步调查,将这 6 名市民作为一个样本,从中任选 2 人,求恰有 1 名大于 40 岁的市民 和 1 名 20 岁至 40 岁的市民的概率. 解:(1)零假设为 H0:喜欢“人文景观”景点与年龄无关联.根据列联表中的数据,经计 算得 χ 2= 55×(20×20-5 ×10) 2 25×30×30×25 ≈11.978>7.879=x0.005. 根据小概率值 α=0.005 的独立性检验,推断 H0 不成立,因此可以认为喜欢“人文景 观”景点与年龄有关联,此推断犯错误的概率不大于 0.005. (2)由题意知抽取的 6 人中大于 40 岁的市民有 4 人,20 岁至 40 岁的市民有 2 人, 分别记为 B1,B2,B3,B4,C1,C2, 从中任选 2 人的可能结果有 (B1,B2),(B1,B3),(B1,B4),(B1,C1),(B1,C2),(B2,B3),(B2,B4),(B2,C1),(B2,C2),(B3,B4),(B3,C1) ,(B3,C2),(B4,C1),(B4,C2),(C1,C2),共 15 个,其中恰有 1 名大于 40 岁的市民和 1 名 20 岁至 40 岁的市民的结果有 (B1,C1),(B1,C2),(B2,C1),(B2,C2),(B3,C1),(B3,C2),(B4,C1),(B4,C2),共 8 个,因此恰有 1 名 大于 40 岁的市民和 1 名 20 岁至 40 岁的市民的概率为 8 15 . 10.某市环保部门对该市市民进行了一次垃圾分类知识的网络问卷调查,每位市民 仅有一次参加机会,通过随机抽样,得到参与问卷调查的 100 人的得分(满分:100 分)数据,统计结果如表所示. 组别 [40, 50) [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) 男 2 3 5 15 18 12 女 0 5 10 10 7 13 (1)若规定问卷得分不低于 70 分的市民称为“环保关注者”,请列出 2×2 列联表,根 据小概率值 α=0.05 的独立性检验,分析“环保关注者”是否与性别有关. (2)若问卷得分不低于 80 分的人称为“环保达人”,视频率为概率:
①在我市所有“环保达人”中,随机抽取3人,求抽取的3人中,既有男“环保达人”又 有女“环保达人”的概率, ②为了鼓励市民关注环保,针对此次的调查制定了如下奖励方案:“环保达人”获得 两次抽奖活动:其他参与的市民获得一次抽奖活动,每次抽奖获得红包的金额和对 应的概率如下表: 红包金额(单位:元) 10 20 概率 4 现某市民要参加此次问卷调查,记(单位:元)为该市民参加问卷调查获得的红包 金额,求X的分布列及数学期望 附表及公式: n(ad-bc) (a bNcaxabcd. ?独立性检验中常用的小概率值和相应的临界值 a b.1 0.05 0.01 0.005 0.001 a 2.706 3.841 6.635 7.879 10.828 解(1)零假设为Ho:“环保关注者”与性别无关联 由题中表格可得2×2列联表如下: 单位:人 性别 是否为“环保关注者” 合计 非“环保关注者” “环保关注者” 男 10 45 55 女 15 3o 45 合计 25 75 100 将2×2列联表中的数据代入公式 n(ad-bc)2 X=(axbxc+tdxa+cl(b+dn=a+b+c+d, 得2-100x0X305X152≈3.03<3.841=00s 55×45×25×75 根据小概率值α=0.05的独立性检验,没有充分证据推断H0不成立,因此可以认为 H0成立,即认为性别与“环保关注者”无关联 (2)视频率为概率,则抽取1人为男“环保达人”的概率为为女“环保达人”的概率 为娟 ①抽取的3人中既有男“环保达人”又有女“环保达人”的概率为 p=1-0-)=是 ②X的取值为10,20,30,40; P0X=10)-×2=系
①在我市所有“环保达人”中,随机抽取 3 人,求抽取的 3 人中,既有男“环保达人”又 有女“环保达人”的概率; ②为了鼓励市民关注环保,针对此次的调查制定了如下奖励方案:“环保达人”获得 两次抽奖活动;其他参与的市民获得一次抽奖活动,每次抽奖获得红包的金额和对 应的概率如下表: 红包金额(单位:元) 10 20 概率 3 4 1 4 现某市民要参加此次问卷调查,记 X(单位:元)为该市民参加问卷调查获得的红包 金额,求 X 的分布列及数学期望. 附表及公式: χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) ,n=a+b+c+d. χ 2 独立性检验中常用的小概率值和相应的临界值 α 0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 解:(1)零假设为 H0:“环保关注者”与性别无关联. 由题中表格可得 2×2 列联表如下: 单位:人 性别 是否为“环保关注者” 合计 非“环保关注者” “环保关注者” 男 10 45 55 女 15 30 45 合计 25 75 100 将 2×2 列联表中的数据代入公式 χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) ,n=a+b+c+d, 得 χ 2= 100 ×(10×30-45 ×15) 2 55 ×45×25×75 ≈3.03<3.841=x0.05. 根据小概率值 α=0.05 的独立性检验,没有充分证据推断 H0 不成立,因此可以认为 H0 成立,即认为性别与“环保关注者”无关联. (2)视频率为概率,则抽取 1 人为男“环保达人”的概率为3 5 ,为女“环保达人”的概率 为 2 5 . ①抽取的 3 人中既有男“环保达人”又有女“环保达人”的概率为 P=1-( 2 5 ) 3 − ( 3 5 ) 3 = 18 25 . ②X 的取值为 10,20,30,40; P(X=10)= 1 2 × 3 4 = 3 8 ;
P=20-×+×2×= 32 P心=30)=Cx-x-x= 4 416 P心X=40)××=击 故X的分布列为 10 20 30 40 3 13 3 32 16 32 E00=102+20是+30×名+40×克= 32 16 32 拓展提高 1.假设有两个分类变量X和Y,它们的值域分别为{x1,x2}和y12,其中2×2列联 表如下表所示: y 合计 a b a+b d c+d 合计 a+c b+d a+b+c+a 对同一样本,以下数据能说明X与Y有关的可能性最大的一组是( A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2 C.a=2,b=3,c=4,d=5 D.a=3,b=2,c=4,d=5 答案D 解析:对于同一样本,lad-bc越小,说明x与y相关性越弱,而ad-bc越大,说明x与y 相关性越强,通过计算知,对于A,B,C都有|ad-bcl=|10-12=2.对于选项D,有|ad- bc=|15-8=7,显然7>2. 2.针对“中学生追星问题”,某校团委对学生性别和中学生追星是否有关”作了一 次调查,其中女生人数是男生人数的男生追星的人数占男生人数的二女生追星的 人数占女生人数的三根据小概率值a=0.05的独立性检验得到是否追星和性别有 关则男生至少有() A.12人 B.11人 C.10人 D.18人 答案:A 解析:设男生人数为x,依题意可得列联表如下表所示: 是否追星 性别 合计 追星 不追星
P(X=20)= 1 2 × 1 4 + 1 2 × 3 4 × 3 4 = 13 32 ; P(X=30)=C2 1 × 1 2 × 1 4 × 3 4 = 3 16 ; P(X=40)= 1 2 × 1 4 × 1 4 = 1 32 . 故 X 的分布列为 X 10 20 30 40 P 3 8 13 32 3 16 1 32 E(X)=10× 3 8 +20× 13 32 +30× 3 16 +40× 1 32 = 75 4 . 拓展提高 1.假设有两个分类变量 X 和 Y,它们的值域分别为{x1,x2}和{y1,y2},其中 2×2 列联 表如下表所示: X Y 合计 y1 y2 x1 a b a+b x2 c d c+d 合计 a+c b+d a+b+c+d 对同一样本,以下数据能说明 X 与 Y 有关的可能性最大的一组是( ) A.a=5,b=4,c=3,d=2 B.a=5,b=3,c=4,d=2 C.a=2,b=3,c=4,d=5 D.a=3,b=2,c=4,d=5 答案:D 解析:对于同一样本,|ad-bc|越小,说明 x 与 y 相关性越弱,而|ad-bc|越大,说明 x 与 y 相关性越强,通过计算知,对于 A,B,C 都有|ad-bc|=|10-12|=2.对于选项 D,有|adbc|=|15-8|=7,显然 7>2. 2.针对“中学生追星问题”,某校团委对“学生性别和中学生追星是否有关”作了一 次调查,其中女生人数是男生人数的1 2 ,男生追星的人数占男生人数的1 6 ,女生追星的 人数占女生人数的2 3 .根据小概率值 α=0.05 的独立性检验得到是否追星和性别有 关,则男生至少有( ) A.12 人 B.11 人 C.10 人 D.18 人 答案:A 解析:设男生人数为 x,依题意可得列联表如下表所示: 性别 是否追星 合计 追星 不追星
男 6 X 6 x-2 合计 3x 2 根据小概率值α=0.05的独立性检验得到是否追星和性别有关, 则x2>3.841, 3/25x22 由2-26g 3 五xx 1 >3.841, 解得x>10.24 为整数。 ∴.根据小概率值《=0.05的独立性检验得到是否追星和性别有关,则男生至少有 12人,故选A 3.某机构调查市民收入增减与购买愿望的关系时,采用独立性检验法抽查了6000 人,计算发现2=7.831,则根据这一数据查阅下表,该机构断言市民收入增减与购 买愿望有关系的可信程度是( 5.1 0.05 0.01 0.005 0.001 2.706 13.847 6.635 7.879 10.828 A.90% B.95% C.99% D.99.9% 答案:C 4.某班主任对全班50名学生作了一次调查,所得数据如下表所示: 单位:人 喜不喜欢玩 作业量 合计 电脑游戏 认为作业多 认为作业不多 喜欢玩电脑游戏 18 9 27 不喜欢玩电脑游戏 15 23 合计 6 24 50 由表中数据计算得到x2≈5.059,于是根据小概率值aα=0.01的独立性检验 (填“能”或“不能)认为喜欢玩电脑游戏与认为作业多有关 答案:不能 解析:本题中x2≈5.059<6.635=x0.01,根据小概率值a=0.01的独立性检验,不能认为 喜欢玩电脑游戏与认为作业多有关 5.为研究某新药的疗效,给100名患者服用此药,跟踪调查后得到数据如下表所示: 单位:人 是否有效果 性别 合计 无效 有效
男 x 6 5x 6 x 女 x 3 x 6 x 2 合计 x 2 x 3x 2 根据小概率值 α=0.05 的独立性检验得到是否追星和性别有关, 则 χ 2>3.841, 由 χ 2= 3𝑥 2 ( 𝑥 2 36 - 5𝑥 2 18 ) 2 𝑥 2 ·𝑥·𝑥· 𝑥 2 = 3 8 x>3.841, 解得 x>10.24. ∵ 𝑥 2 , 𝑥 6为整数, ∴根据小概率值 α=0.05 的独立性检验得到是否追星和性别有关,则男生至少有 12 人,故选 A. 3.某机构调查市民收入增减与购买愿望的关系时,采用独立性检验法抽查了 6 000 人,计算发现 χ 2=7.831,则根据这一数据查阅下表,该机构断言市民收入增减与购 买愿望有关系的可信程度是( ) α 0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 A.90% B.95% C.99% D.99.9% 答案:C 4.某班主任对全班 50 名学生作了一次调查,所得数据如下表所示: 单位:人 喜不喜欢玩 电脑游戏 作业量 合计 认为作业多 认为作业不多 喜欢玩电脑游戏 18 9 27 不喜欢玩电脑游戏 8 15 23 合计 26 24 50 由表中数据计算得到 χ 2≈5.059,于是根据小概率值 α=0.01 的独立性检验, (填“能”或“不能”)认为喜欢玩电脑游戏与认为作业多有关. 答案:不能 解析:本题中,χ 2≈5.059<6.635=x0.01,根据小概率值 α=0.01 的独立性检验,不能认为 喜欢玩电脑游戏与认为作业多有关. 5.为研究某新药的疗效,给 100 名患者服用此药,跟踪调查后得到数据如下表所示: 单位:人 性别 是否有效果 合计 无效 有效
男性患者 15 35 50 女性患者 6 44 50 合计 21 79 100 设0服用此药的效果与患者的性别无关,则2≈ (小数点后保留一位有 效数字),从而得出结论:服用此药的效果与患者的性别有关联,这种判断犯错误的 概率 答案4.9不大于0.05 解析:由公式计算得2≈4.882. X2>3.841, ∴.根据小概率值α=0.05的独立性检验得到服用此药的效果与患者的性别有关, 犯错误的概率不大于0.05 6.为了研究玉米品种对产量的影响,某农科院对一块试验田种植的一批玉米共10 000株的生长情况进行研究,现采用分层随机抽样方法抽取50株作为样本,统计 结果如下: 单位株 玉米粒 植株的高矮 的形状 高茎 矮茎 合计 圆粒 11 19 30 皱粒 13 7 20 合计 24 26 50 (1)现采用分层随机抽样的方法,先从该样本所含的圆粒玉米中取出6株玉米,再 从这6株玉米中随机选出2株,求这2株之中既有高茎玉米又有矮茎玉米的概率: (2)根据小概率值a=0.05的独立性检验,分析玉米粒的形状与植株的高矮有无关 联 解(1)依题意,取出的6株圆粒玉米中含高茎2株,记为a,b:矮茎4株,记为 A,B,C,D,从中随机选取2株有如下15种情 :aA.aB.aC.aD.bA.bB.bC.bD.ab.AB.AC.AD.BC.BD.CD 其中满足题意的共有aA,aB,aC,aD,bA,bB,bC,bD,共8种,则所求概率为P=8 Γ15 (2)零假设为H0:玉米粒的形状与植株的高矮之间无关联, 根据已知列联表。 得-50x1x713×123.860>3.841=m.05,根据小概率值a=0.05的独立性检验,推 30×20×24×26 断H0不成立,即认为玉米粒的形状与植株的高矮有关联,此推断犯错误的概率不 大于0.05. 挑战创新
男性患者 15 35 50 女性患者 6 44 50 合计 21 79 100 设 H0:服用此药的效果与患者的性别无关,则 χ 2≈ (小数点后保留一位有 效数字),从而得出结论:服用此药的效果与患者的性别有关联,这种判断犯错误的 概率 . 答案:4.9 不大于 0.05 解析:由公式计算得 χ 2≈4.882. ∵χ 2>3.841, ∴根据小概率值 α=0.05 的独立性检验得到服用此药的效果与患者的性别有关, 犯错误的概率不大于 0.05. 6.为了研究玉米品种对产量的影响,某农科院对一块试验田种植的一批玉米共 10 000 株的生长情况进行研究,现采用分层随机抽样方法抽取 50 株作为样本,统计 结果如下: 单位:株 玉米粒 的形状 植株的高矮 合计 高茎 矮茎 圆粒 11 19 30 皱粒 13 7 20 合计 24 26 50 (1)现采用分层随机抽样的方法,先从该样本所含的圆粒玉米中取出 6 株玉米,再 从这 6 株玉米中随机选出 2 株,求这 2 株之中既有高茎玉米又有矮茎玉米的概率; (2)根据小概率值 α=0.05 的独立性检验,分析玉米粒的形状与植株的高矮有无关 联. 解:(1)依题意,取出的 6 株圆粒玉米中含高茎 2 株,记为 a,b;矮茎 4 株,记为 A,B,C,D,从中随机选取 2 株有如下 15 种情 况:aA,aB,aC,aD,bA,bB,bC,bD,ab,AB,AC,AD,BC,BD,CD. 其中满足题意的共有 aA,aB,aC,aD,bA,bB,bC,bD,共 8 种,则所求概率为 P= 8 15 . (2)零假设为 H0:玉米粒的形状与植株的高矮之间无关联. 根据已知列联表, 得 χ 2= 50×(11×7-13 ×19) 2 30×20×24 ×26 ≈3.860>3.841=x0.05,根据小概率值 α=0.05 的独立性检验,推 断 H0 不成立,即认为玉米粒的形状与植株的高矮有关联,此推断犯错误的概率不 大于 0.05. 挑战创新
为比较注射A,B两种药物产生的皮肤疱疹的面积,选200只家兔做试验,将这200 只家兔随机地分成两组,每组100只,其中一组注射药物A,另一组注射药物B.表 1和表2所示的分别是注射药物A和药物B后皮肤疱疹面积的频数分布.(疱疹 面积单位:mm2) 表1 疱疹 面积 [60,65) [65,70) 70,75) [75,80] 频数 30 40 20 10 表2 疱疹 [60,65) [65,70) 70,75) [75,80) 面积 80,85] 频数10 25 2o 30 15 (1)完成图①和图②所示的分别注射药物A,B后皮肤疱疹面积的频率分布直方图。 并求注射药物A后疱疹面积的中位数: +频率/组距 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 606570758085疱疹 面积 图① +频率/组距 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0 06570758085疱疹 面积 图② (2)完成下面的2×2列联表,根据小概率值α=0.001的独立性检验,分析注射两种 药物是否与疱疹面积有关 单位:只 疱疹面积 注射 疱疹面积 疱疹面积不 合计 药物 小于70mm2 小于70mm2 注射 a1= b=
为比较注射 A,B 两种药物产生的皮肤疱疹的面积,选 200 只家兔做试验,将这 200 只家兔随机地分成两组,每组 100 只,其中一组注射药物 A,另一组注射药物 B.表 1 和表 2 所示的分别是注射药物 A 和药物 B 后皮肤疱疹面积的频数分布.(疱疹 面积单位:mm2 ) 表 1 疱疹 面积 [60,65) [65,70) [70,75) [75,80] 频数 30 40 20 10 表 2 疱疹 面积 [60,65) [65,70) [70,75) [75,80) [80,85] 频数 10 25 20 30 15 (1)完成图①和图②所示的分别注射药物 A,B 后皮肤疱疹面积的频率分布直方图, 并求注射药物 A 后疱疹面积的中位数; 图① 图② (2)完成下面的 2×2 列联表,根据小概率值 α=0.001 的独立性检验,分析注射两种 药物是否与疱疹面积有关. 单位:只 注射 药物 疱疹面积 疱疹面积 合计 小于 70 mm2 疱疹面积不 小于 70 mm2 注射 a= b=
药物A 注射 C= d= 药物B 合计 附x2= nad-bc)2 a+bXc+dX(a+cXb+dyn=a+b+c+d. X2独立性检验中常用的小概率值和相应的临界值 b.1 0.05 0.01 0.005 0.001 Xa 2.706 3.841 6.635 7.879 10.828 解(1)根据题意,完成图①和图②的频率分布直方图,如图所示: 4颜率/组距 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 606570758085疱疹 面积 图① 频率组距 0.08 0.05 0.04 0.03 0.02 0.01 606570758085疱疹 面积 图② 注射药物A后疱疹面积的中位数为元=65+5×2=67.5. 0.4 (2)零假设为H0:注射药物与疱疹面积独立,即注射两种药物对疱疹面积没有差异 根据题意填写列联表如下: 单位:只 疱疹面积 注射药物 疱疹面积小于 疱疹面积不小于 合计 70mm2 70mm2 注射药物A a=70 b=30 100 注射药物B c=35 d=65 100 合计 105 95 200 n(ad-bc)2 得X=a+bxc+aa+co+ 200×70×65-30×35≈24.56>10.828=x0.001, 100×100×105×95 根据小概率值a=0.001的独立性检验,我们推断H0不成立 即认为注射两种药物对疱疹面积有差异,此推断犯错误的概率不大于0.001」
药物 A 注射 药物 B c= d= 合计 附:χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) ,n=a+b+c+d. χ 2 独立性检验中常用的小概率值和相应的临界值 α 0.1 0.05 0.01 0.005 0.001 xα 2.706 3.841 6.635 7.879 10.828 解:(1)根据题意,完成图①和图②的频率分布直方图,如图所示: 图① 图② 注射药物 A 后疱疹面积的中位数为𝑥=65+5× 0.2 0.4 =67.5. (2)零假设为 H0:注射药物与疱疹面积独立,即注射两种药物对疱疹面积没有差异. 根据题意填写列联表如下: 单位:只 注射药物 疱疹面积 疱疹面积小于 合计 70 mm2 疱疹面积不小于 70 mm2 注射药物 A a=70 b=30 100 注射药物 B c=35 d=65 100 合计 105 95 200 得 χ 2= 𝑛(𝑎𝑑-𝑏𝑐) 2 (𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑) = 200 ×(70×65-30 ×35) 2 100 ×100×105 ×95 ≈24.56>10.828=x0.001. 根据小概率值 α=0.001 的独立性检验,我们推断 H0 不成立, 即认为注射两种药物对疱疹面积有差异,此推断犯错误的概率不大于 0.001