第十章双样本假设检验及区间估计 我们在掌握了单样本检验与估计的有关方法与原理 之后,把视野投向双样本检验与估计是很自然的。双样 本统计,除了有大样本、小样本之分外,根据抽样之不 同,还可分为独立样本与配对样本。 独立样本,指 配对样本,指只有 双样本是在两个 个总体,双样本是由于样 总体中相互独立 本中的个体两两匹配成对 地抽取的 而产生的。配对样本相互 之间不独立。 202l/12/21
2021/12/21 1 第十章 双样本假设检验及区间估计 我们在掌握了单样本检验与估计的有关方法与原理 之后,把视野投向双样本检验与估计是很自然的。双样 本统计,除了有大样本、小样本之分外,根据抽样之不 同,还可分为独立样本与配对样本。 独立样本, 指 双样本是在两个 总体中相互独立 地抽取的 。 配对样本,指只有一 个总体,双样本是由于样 本中的个体两两匹配成对 而产生的。配对样本相互 之间不独立
第一节两总体大样本假设检验 为了把单样本检验推广到能够比较两个样本的均值的检验,必须 再一次运用中心极限定理。下面是一条由中心极限定理推广而来的重 要定理:如果从N(k12G12)和N(42a2)两个总体中分别抽取容量为 n1和n2的独立随机样本,那么两个样本的均值差(X1-X2)的抽样分 布就是N(A1-2+ 。与单样本的情况相同,在大样本的 情况下(两个样本的容量都超过50),这个定理可以推广应用于任何具 有均值H1和2以及方差和a2的两个总体。当n1和n2还渐变大 时,(x1-X2)的抽样分布像前面那样将接近正态分布。 202l/12/21
2021/12/21 2 第一节 两总体大样本假设检验 为了把单样本检验推广到能够比较两个样本的均值的检验,必须 再一次运用中心极限定理。下面是一条由中心极限定理推广而来的重 要定理:如果从 和 两个总体中分别抽取容量为 n1和n2 的独立随机样本,那么两个样本的均值差 的抽样分 布就是 。与单样本的情况相同,在大样本的 情况下(两个样本的容量都超过50),这个定理可以推广应用于任何具 有均值μ1和μ2以及方差 和 的两个总体。当n1和n2逐渐变大 时, 的抽样分布像前面那样将接近正态分布
1.大样本均值差检验 (1)零假设:H0:{1-2=D (2)备择假设: 单侧 双侧 H1:1-42)D0 H1:{1-2≠D 或H1 2(D (3)否定域:单侧2。双侧Za2 (4)检验统计量 X-X-D (5)比较判定 202l/12/21
2021/12/21 3 1.大样本均值差检验 (1)零假设: (2)备择假设: 单侧 双侧 或 (3)否定域:单侧 双侧 (4)检验统计量 (5)比较判定
例为了比较已婚妇女对婚后生活的态度是否因婚 龄而有所差别,将已婚妇女按对婚后生活的态度分为 满 意”和“不满意”两组。从满意组中随机抽取600名妇女, 其平均婚龄为8.5年,标准差为2.3年;从不满意组抽出 500名妇女,其平均婚龄为92年,标准差28年。试问在 0.05显著性水平上两组是否存在显著性差异? 样本 人数 均值 标准差 满意组 600 8.5 2.3 不满意组 500 9.2 2.8 202l/12/21
2021/12/21 4 [例]为了比较已婚妇女对婚后生活的态度是否因婚 龄而有所差别,将已婚妇女按对婚后生活的态度分为 “满 意”和“不满意”两组。从满意组中随机抽取600名妇女, 其平均婚龄为8.5年,标准差为2.3年;从不满意组抽出 500名妇女,其平均婚龄为9.2年,标准差2.8年。试问在 0.05显著性水平上两组是否存在显著性差异? 样本 人数 均值 标准差 满意组 600 8.5 2.3 不满意组 500 9.2 2.8
「解]据题意, “不满意”组的抽样结果为1=9,2年,S1=2.8年,m1=500; “满意”组的抽样结果为x2=8.5年,S2=2.3年,n2=600 Hn:H1-H2=D0=0 H1:P1-H2#0 计算检验统计量 X-X-D 9.2-8.5 4.47 n, n2 500600 确定否定域, 因为a=0.05,因而有Z2=1.960的备择假设,即可 以认为妇女婚龄长容易对婚后生活产生“不满意”。 202l/12/21
2021/12/21 5 [解] 据题意, “不满意”组的抽样结果为: =9.2年, S1=2.8年, n1=500; “满意”组的抽样结果为: =8.5 年,S2=2.3 年, n2=600。 H0:μ1―μ2=D0=0 H1: μ1―μ2 ≠0 计算检验统计量 确定否定域, 因为α=0.05,因而有 Zα/2=1.96<4.47 因此否定零假设,即可以认为在0.05显著性水平上,婚龄对妇女婚 后生活的态度是有影响的。同时我们看到,由于样本计算值Z=4.47 远大 于单侧 Z0.05 的临界值1. 65,因此本题接受μ1―μ2 >0 的备择假设,即可 以认为妇女婚龄长容易对婚后生活产生“不满意
2.大样本成数差检验 (1)零假设: (2)备择假设: H:1-p2=D 单侧 双侧 H1:P1-P2>D H ≠D 或H1:n1-p2(D (3)否定域:单侧z。双侧Z。2 (4)检验统计量 其中: x1为总体1的 )D.(n-P2)D n1样本成数 P191⊥P292 X2为总体2的 ny 72样本成数。 202l/12/21
2021/12/21 6 2.大样本成数差检验 (1)零假设: (2)备择假设: 单侧 双侧 或 (3)否定域:单侧 双侧 (4)检验统计量 其中: 为总体1的 样本成数 为总体2的 样本成数
当1和2未知,须用样本成数n和n进行估算时,分以下两 种情况讨论 ①若零假设中两总体成数的关系为p1=P2,这时两总体可看作成数 P相同的总体,它 们的点估计值为 X+x2 n, p,+n,p H1+n2 11+n2 此时上式中检验 PI-p 统计量z可简化为 2(n1-P2)-0 Puqu puqi p29n/+n2 ny nn ②若零假设中两总体成数p21≠P2’那么它们的点估计值有 此时上式中 (P1-p2)D 5)判定 检验统计量Z为 P1q1P292 202l/12/21
2021/12/21 7 当p1和p2未知,须用样本成数 和 进行估算时,分以下两 种情况讨论: ① 若零假设中两总体成数的关系为 ,这时两总体可看作成数 P 相同的总体,它 们的点估计值为 此时上式中检验 统计量 Z 可简化为 ② 若零假设中两总体成数 ,那么它们的点估计值有 此时上式中 检验统计量Z为 (5)判定
例有一个大学生的随机样本,按照性格“外向”和 内向”,把他们分成两类。结果发现,新生中有73% 属 于“外向”类,四年级学生中有58%属于“外向”类 样本 中新生有171名,四年级学生有17名。试问,在0.01水平 上,两类学生有无显著社皇异?内向 四年级58%(117)42% 年级73%(171)27% 202l/12/21
2021/12/21 8 [例]有一个大学生的随机样本,按照性格“外向”和 “内向”,把他们分成两类。结果发现,新生中有73% 属 于“外向”类,四年级学生中有58%属于“外向”类。 样本 中新生有171名,四年级学生有117名。试问,在0.01水平 上,两类学生有无显著性差异? 外向 内向 四年级 58%(117) 42% 一年级 73%(171) 27%
解]据题意 新生组的抽样结果为:P=03,92=027,n1=171 四年级学生组的抽样结果为:=0.58 =0.42,n2=117 Hn:p1-P2=D0=0 H1:p1-P2=D0=0 计算检验统计量 X,+X,171×0.73+117×0.58 0.669 n1+ 171+117 P1-P2 0.73-0.58 2.66 9/n1+n2 71+117 669×0.331 nn, 171×117 确定否定域 因为a=001,因而有Z2=205-=258<266 因而否定零假设,即可以认为在001显著性水平上,两类 202l/12/21 学生在性格上是有差异的
2021/12/21 9 [解] 据题意 新生组的抽样结果为: =0.73, =0.27,n1=171 四年级学生组的抽样结果为: =0.58, =0.42,n2=117 H0:p1―p2=D0=0 H1:p1―p2=D0≠0 计算检验统计量 确定否定域 因为α=0.01,因而有 Zα/2=Z0.005=2.58<2.66 因而否定零假设,即可以认为在0.01显著性水平上,两类 学生在性格上是有差异的
第二节两总体小样本假设检验 与对单总体小样本假设检验一样,我们对两 总体小样本假设检只讨论总体满足正态分布的情 况。 1.小样本均值差假设检验 (1)当1和可2已知时,小样本均值差 检验,与上一节所述大样本总体均值差检验完全 相同,这里不再赘述 202l/12/21
2021/12/21 10 第二节 两总体小样本假设检验 与对单总体小样本假设检验一样,我们对两 总体小样本假设检只讨论总体满足正态分布的情 况。 1. 小样本均值差假设检验 (1) 当 和 已知时,小样本均值差 检验,与上一节所述大样本总体均值差检验完全 相同,这里不再赘述