第十章双样本假设检验及区间估计 我们在掌握了单样本检验与估计的有关方法与原理之后,把视野投向双样本 检验与估计是很自然的。双样本统计,除了有大样本、小样本之分外,根据抽样 之不同,还可分为独立样本与配对样本 独立样本,指双样本是在两个总体中相互独立地抽取的 配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产 生的。配对样本相互之间不独立。 第一节两总体大样本假设检验 为了把单样本检验推广到能够比较两个样本的均值的检验,必须再一次运用 中心极限定理。下面是一条由中心极限定理推广而来的重要定理:如果从 )和[N(∠ 两个总体中分别抽取容量为n1和n2 的独立随机样本,那么两个样本的均值差x1-X2)的抽样分布就 是 N(1-2 2、。与单样本的情况相同,在大样本的 情况下(两个样本的容量都超过50),这个定理可以推广应用于任何具有均值 u1和u2以及方差2和 的两个总体。当n1和n2逐渐变 大时,(X1-x2)的抽样分布像前面那样将接近正态分布。 1.大样本均值差检验 (1)零假设:H:μr-u2=D (2)备择假设: 单侧H1:μμ2>D0 双侧H1:μμ2≠Do 或H1:μrμ2<D (3)否定域:单侧Z 双侧Za/2 (4)检验统计量 (5)比较判定
第十章 双样本假设检验及区间估计 我们在掌握了单样本检验与估计的有关方法与原理之后,把视野投向双样本 检验与估计是很自然的。双样本统计,除了有大样本、小样本之分外,根据抽样 之不同,还可分为独立样本与配对样本。 独立样本, 指双样本是在两个总体中相互独立地抽取的 。 配对样本,指只有一个总体,双样本是由于样本中的个体两两匹配成对而产 生的。配对样本相互之间不独立。 第一节 两总体大样本假设检验 为了把单样本检验推广到能够比较两个样本的均值的检验,必须再一次运用 中心极限定理。下面是一条由中心极限定理推广而来的重要定理:如果从 和 两个总体中分别抽取容量为 n1 和 n2 的独立随机样本,那么两个样本的均值差 的抽样分布就 是 。与单样本的情况相同,在大样本的 情况下(两个样本的容量都超过 50),这个定理可以推广应用于任何具有均值 μ1 和μ2 以及方差 和 的两个总体。当 n1 和 n2 逐渐变 大时, 的抽样分布像前面那样将接近正态分布。 1.大样本均值差检验 (1)零假设:H0:μ1-μ2=D0 (2)备择假设: 单侧 H1:μ1-μ2>D0 双侧 H1:μ1-μ2 ≠ D0 或 H1:μ1-μ2< D0 (3)否定域:单侧 Zα 双侧 Zα/2 (4)检验统计量 (5)比较判定 ( , ) 2 N 1 1 ( , ) 2 N 2 2 (X1 − X2 ) ( , ) 2 2 2 1 2 1 1 2 n n N − + 2 1 2 2 (X1 − X2 ) 2 2 2 1 2 1 1 2 0 n n X X D Z + − − =
[例]为了比较已婚妇女对婚后生活的态度是否因婚龄而有所差别,将已婚妇 女按对婚后生活的态度分为“满意”和“不满意”两组。从满意组中随机抽取 600名妇女,其平均婚龄为8.5年,标准差为2.3年;从不满意组抽出500名妇 女,其平均婚龄为9.2年,标准差2.8年。试问在0.05显著性水平上两组是否 存在显著性差异? 样本 人数均值标准差 满意组 8.5 2.3 不满意组 500 9.2 2.8 [解]据题意, “不满意”组的抽样结果为:区}=9.2年,S1=2.8年,n1=500 满意”组的抽样结果为 8.5年,S2=2.3年,n2=600。 HO:p1-u2=D0=0 Hl:μ1-12≠0 计算检验统计量 2-8.5 50O 600 确定否定域, 因为a=0.05,因而有Za/2=1.960的备择假设,即可以认为 妇女婚龄长容易对婚后生活产生“不满意”。 2.大样本成数差检验 (1)零假设 (2)备择假设 单侧H:μμ2>D 双侧H:μ-μ2≠Db 或H1:μ1μ2<D
[例]为了比较已婚妇女对婚后生活的态度是否因婚龄而有所差别,将已婚妇 女按对婚后生活的态度分为“满意”和“不满意”两组。从满意组中随机抽取 600 名妇女,其平均婚龄为 8.5 年,标准差为 2.3 年;从不满意组抽出 500 名妇 女,其平均婚龄为 9.2 年,标准差 2.8 年。试问在 0.05 显著性水平上两组是否 存在显著性差异? 样本 人数 均值 标准差 满意组 600 8.5 2.3 不满意组 500 9.2 2.8 [解] 据题意, “不满意”组的抽样结果为: =9.2 年, S1=2.8 年, n1=500; “满意”组的抽样结果为: =8.5 年,S2=2.3 年, n2=600。 H0:μ1―μ2=D0=0 H1: μ1―μ2 ≠0 计算检验统计量 确定否定域, 因为α=0.05,因而有 Zα/2=1.96<4.47 因此否定零假设,即可以认为在 0.05 显著性水平上,婚龄对妇女婚后 生活的态度是有影响的。同时我们看到,由于样本计算值 Z=4.47 远大于单侧 Z0.05 的临界值 1. 65,因此本题接受μ1―μ2 >0 的备择假设,即可以认为 妇女婚龄长容易对婚后生活产生“不满意”。 2.大样本成数差检验 (1)零假设: (2)备择假设: 单侧 H1:μ1-μ2>D0 双侧 H1:μ1-μ2 ≠ D0 或 H1:μ1-μ2< D0 X1 X2 4.47 600 2.3 500 2.8 9.2 8.5 2 2 2 2 2 1 2 1 1 2 0 = + − = + − − = n n X X D Z 0 1 2 0 H : p − p = D
(3)否定域:单侧Z 双侧Za/2 (4)检验统计量 (P1 )-D (P1-P2) P191+ P212 当pl和p2未知,须用样本成数 A 进行估算时,分以下两 种情况讨论: ①若零假设中两总体成数的关系为P=P2,这时两总体可看作成数P 相同的总体,它们的点估计值为 此时上式中检验统计量Z可简化为 p2 PI Puqu Puqi V%,/+2 n,n2 ②若零假设中两总体成数P1≠P2,那么它们的点估计值有 P1 此时上式中检验统计量Z为 (5)判定
(3)否定域:单侧 Zα 双侧 Zα/2 (4)检验统计量 当 p1 和 p2 未知,须用样本成数 和 进行估算时,分以下两 种情况讨论: ① 若零假设中两总体成数的关系为 P1=P2 ,这时两总体可看作成数 P 相同的总体,它们的点估计值为 此时上式中检验统计量 Z 可简化为 ② 若 零 假 设 中 两 总 体 成 数 P1 ≠ P2 , 那 么 它 们 的 点 估 计 值 有 此时上式中 检验统计量 Z 为 (5)判定 2 2 2 1 1 1 1 2 ( ) 1 2 0 1 2 0 ( ) ( ) n p q n p q p p D p p D Z p p + − − = − − = − p1 p2 1 2 1 1 2 2 1 2 1 2 n n n p n p n n X X p + + = + + = 1 2 1 2 1 2 1 2 ( 1 2 ) 0 n n n n p q p p n p q n p q p p Z + − = + − − = p1 p1 p2 p2 2 2 2 1 1 1 ( 1 2 ) 0 n p q n p q p p D Z + − − =
[例]有一个大学生的随机样本,按照性格“外向”和“内向”,把他们分成 两类。结果发现,新生中有73%属于“外向”类,四年级学生中有58%属于“外 向”类。样本中新生有171名,四年级学生有117名。试问,在0.01水平上, 两类学生有无显著性差异? 第二节两总体小样本假设检验 与对单总体小样本假设检验一样,我们对两总体小样本假设检只讨论总体满 足正态分布的情况。 1.小样本均值差假设检验 (1)当和2已知时,小样本均值差检验,与上一节所述 大样本总体均值差检验完全相同,这里不再赘述 未知,但假定它们相等时,关键是要解决 的算式。 现又因为σ未知,所以要用它的无偏估计量 替代它。由于两个样本的方 差基于不同的样本容量,因而可以用加权的方法求出σ的无偏估计量,得 n1S12+n2S2 Vn1+n2-2 注意,上式的分母上减2,是因为根据国和国计算S1和S2 时,分别损失了一个自由度,一共损失了两个自由度,所以全部自由度的数目就 成为(n1+n2-2)。于是有 n
[例]有一个大学生的随机样本,按照性格“外向”和“内向”,把他们分成 两类。结果发现,新生中有 73%属于“外向”类,四年级学生中有 58%属于“外 向”类。样本中新生有 171 名,四年级学生有 117 名。试问,在 0.01 水平上, 两类学生有无显著性差异? 第二节 两总体小样本假设检验 与对单总体小样本假设检验一样,我们对两总体小样本假设检只讨论总体满 足正态分布的情况。 1. 小样本均值差假设检验 (1) 当 和 已知时,小样本均值差检验,与上一节所述 大样本总体均值差检验完全相同,这里不再赘述。 (2) 和 未知,但假定它们相等时, 关键是要解决 的算式。 现又因为σ未知,所以要用它的无偏估计量 替代它。由于两个样本的方 差基于不同的样本容量,因而可以用加权的方法求出σ的无偏估计量,得 注意,上式的分母上减 2,是因为根据 和 计算 S1 和 S2 时,分别损失了一个自由度,一共损失了两个自由度,所以全部自由度的数目就 成为(n1+ n2―2)。 于是有 2 1 2 2 2 1 2 2 ( X1−X2 ) S X1 X2 1 2 2 2 2 2 2 1 1 + − + = n n n S n S S ( X1−X2 ) 1 2 1 2 n n n n S + =
[例]为研究某地民族间家庭规模是否有所不同,各做如下独立随机抽样: 民族A:12户,平均人口6.8人,标准差1.5人 民族B:12户,平均人口5.3人,标准差0.9人 问:能否认为A民族的家庭平均人口高于B民族的家庭平均人口(a =0.05)?(假定家庭平均人口服从正态分布,且方差相等)t=2.97 [例]某市对儿童体重情况进行调查,抽查8岁的女孩20人,平均体重 22.2千克,标准差2.46千克:抽查8岁的男孩18人,平均体重21.3千克,标 准差1.82千克。若男女儿童体重的总体方差相等,问在显著性水平5%上,该年 龄男女儿童之体重有无显著差异? 2.小样本方差比检验 在实际研究中,除了要比较两总体的均值外,有时还需要比较两总体的方差。 例如对农村家庭和城镇家庭进行比较,除了平均收入的比较外,还要用方差比较 收入的不平均情况。此外,刚刚在小样本均值差的检验中曾谈到,当方差未知时, 往往还假设两总体方差相等。因此,在总体方差未知的情况下,先进行方差比检 验,对于均值差检检验也是具有一定意义的。 设两总体分别满足正态分N(A和N(∠22·现从这 两个总体中分别独立地各抽取一个随机样本,并具有容量n1,n2和方差 根据第八章(8.22)式,对两总体样本方差的抽样分布分别有 x2(n1-1) x2(n2-1)
[例]为研究某地民族间家庭规模是否有所不同,各做如下独立随机抽样: 民族 A:12 户,平均人口 6.8 人,标准差 1.5 人 民族 B:12 户,平均人口 5.3 人,标准差 0.9 人 问:能否认为 A 民族的家庭平均人口高于 B 民族的家庭平均人口( α =0.05)?(假定家庭平均人口服从正态分布,且方差相等)t=2.97 [例] 某市对儿童体重情况进行调查,抽查 8 岁的女孩 20 人,平均体重 22.2 千克,标准差 2.46 千克;抽查 8 岁的男孩 18 人,平均体重 21.3 千克,标 准差 1.82 千克。若男女儿童体重的总体方差相等,问在显著性水平 5%上,该年 龄男女儿童之体重有无显著差异? 2.小样本方差比检验 在实际研究中,除了要比较两总体的均值外,有时还需要比较两总体的方差。 例如对农村家庭和城镇家庭进行比较,除了平均收入的比较外,还要用方差比较 收入的不平均情况。此外,刚刚在小样本均值差的检验中曾谈到,当方差未知时, 往往还假设两总体方差相等。因此,在总体方差未知的情况下,先进行方差比检 验,对于均值差检检验也是具有一定意义的。 设两总体分别满足正态分布 和 。现从这 两个总体中分别独立地各抽取一个随机样本,并具有容量 n1,n2 和方差 S1 2 , S2 2 。根据第八章(8.22)式,对两总体样本方差的抽样分布分别有 ( , ) 2 N 2 2 ( , ) 2 N 2 2 ~ ( 1) 1 2 2 1 2 1 1 n − n S ~ ( 1) 2 2 2 2 2 2 2 n − n S
根据本书第八章第四节F分布中的(8.25)式有 /(n1-1) F(n1-1 /(n2-1) 由于 S2,所以简化后,检验方差比所 用统计量为 FO 2/O2 当零假设H0:01=02时,上式中的统计量又简化为 71 (3)否定域(参见下图 单侧Fa(n1-1,n2-1),双侧Fa/2(nl-1,n2-1) 单侧 双侧 F c/2 0/2 图10.1小样本方差比检验之否定域 方差比检验,比起前面所介绍的检验有一个不同点,那就是无论是单侧检验 还是双侧检验,F的临界值都只在右侧。其原因是我们总是把S2和S2中的 较大者放在分子上,以便使用者掌握。因此有
根据本书第八章第四节 F 分布中的(8.25)式有 由于 ,所以简化后,检验方差比所 用统计量为: 当零假设 H0: σ1=σ2 时,上式中的统计量又简化为: (3)否定域(参见下图) 单侧 Fα(n1―1,n2―1),双侧 Fα/2(n1―1,n2―1) 方差比检验,比起前面所介绍的检验有一个不同点,那就是无论是单侧检验 还是双侧检验,F 的临界值都只在右侧。其原因是我们总是把 S1 2 和 S2 2 中的 较大者放在分子上,以便使用者掌握。因此有 ~ ( 1 1) /( 1) /( 1) 1 2 2 2 2 2 2 2 2 1 1 2 1 1 − − − − F n n n n S n n S , 2 2 1 S n n S − = ~ ( 1 1) / / 1 2 2 2 2 2 2 1 2 1 − − F n n S S , ~ ( 1 1) 1 2 2 2 2 1 = − − F n n S S F
≥1或者F= [例]为了研究男性青年和女性青年两身高总体的方差是否相等,分别作了 独立随机抽样。对男性青年样本有nl=10,S2=30.8(厘米2);对女性青年 样本有n2=8,S2=27.8(厘米2),试问在0.05水平上,男性青年身高的 方差和女性青年身高的方差有无显著性差异? [解]据题意, 对男性青年样本有n1=10,S12=30.8(厘米2) 对女性青年样本有n2=8,S2=27.8(厘米2) H0:012=02 10 10-1×308=34.2 2 ×27.8=31.8 计算检验统计量 34.2 1O8 31.8 确定否定域,因为a=0.05, Fa/2(n1-1,n2-1)=F0.025(9,7)=4.82>1.08 因而不能否定零假设,即在0.05水平上,我们不能说男性青年身高的方差 和女性青年身高的方差有显著性差异
≥1 或者 ≥1 [例] 为了研究男性青年和女性青年两身高总体的方差是否相等,分别作了 独立随机抽样。对男性青年样本有 n1=10, S1 2 =30.8(厘米 2);对女性青年 样本有 n2=8, S2 2 =27.8(厘米 2),试问在 0.05 水平上,男性青年身高的 方差和女性青年身高的方差有无显著性差异? [解] 据题意, 对男性青年样本有 n1 =10, S1 2 =30.8(厘米 2) 对女性青年样本有 n2 =8, S2 2 =27.8(厘米 2) H0 : σ1 2 =σ2 2 H1 : σ1 2≠σ2 2 计算检验统计量 确定否定域,因为α=0.05, Fα/2(n1―1,n2―1)=F0.025(9,7)=4.82>1.08 因而不能否定零假设,即在 0.05 水平上,我们不能说男性青年身高的方差 和女性青年身高的方差有显著性差异。 = 2 2 2 1 S S F = 2 1 2 2 S S F 30.8 34.2 10 1 10 1 2 1 1 2 1 1 = − = − = S n n S 27.8 31.8 8 1 8 1 2 2 2 2 2 2 = − = − = S n n S 1.08 31.8 34.2 ˆ ˆ 2 2 2 1 = = = S S F
第三节配对样本的假设检验 配对样本,是两个样本的单位两两匹配成对,它实际上只能算作一个样本, 也称关联样本 因此对它的检验,用均值差检验显然是不行的。因为2n个样本单位(每个 样本n个)不是全部独立抽取的。而如果把每一配对当作一个单位,在符合其他 必要的假定条件下,统计检验与单样本检验相差无几。 单一实验组的假设检验 对于单一实验组这种“前一后”对比型配对样本的假设检验,我们的做法是, 不用均值差检验,而是求出每一对观察数据的差,直接进行一对一的比较。如果 采用“前测”“后测”两个总体无差异的零假设,也就是等于假定实验刺激无效。 于是,问题就转化为每对观察数据差的均值μd=0的单样本假设检验了。求每 对观察值的差,直接进行一对一的比较。 设配对样本的样本单位前测与后测的观察数据分别 是X0i与X1i,其差记作d d i=x li-X oi 如果假设两总体前测与后测无显著性差别,即μ1=μ0或者 A=4-/=0°那么对取自这两个总体的配对大样本有 NOO 对于大样本,当二总体的方差未知时,可以用样本标准差来近似。 (a 若为小样本则需用t分布,即对配对(小)样本而言,其均值差的抽样分布 将服从于自由度为(n-1)的t分布。所以对单一实验组实验的假设检验,其检 验统计量为
第三节 配对样本的假设检验 配对样本,是两个样本的单位两两匹配成对,它实际上只能算作一个样本, 也称关联样本。 因此对它的检验,用均值差检验显然是不行的。因为 2 n 个样本单位(每个 样本 n 个)不是全部独立抽取的。而如果把每一配对当作一个单位,在符合其他 必要的假定条件下,统计检验与单样本检验相差无几。 1.单一实验组的假设检验 对于单一实验组这种“前—后”对比型配对样本的假设检验,我们的做法是, 不用均值差检验,而是求出每一对观察数据的差,直接进行一对一的比较。如果 采用“前测”“后测”两个总体无差异的零假设,也就是等于假定实验刺激无效。 于是,问题就转化为每对观察数据差的均值μd =0 的单样本假设检验了。求每 一对观察值的差,直接进行一对一的比较。 设配对样本的样本单位前测与后测的观察数据分别 是 X 0i 与 X 1i,其差记作 di d i= X 1i―X 0i 如果假设两总体前测与后测无显著性差别,即μ 1 = μ 0 或 者 。那么对取自这两个总体的配对大样本有 对于大样本,当二总体的方差未知时,可以用样本标准差来近似。 若为小样本则需用 t 分布,即对配对(小)样本而言,其均值差的抽样分布 将服从于自由度为(n—1)的 t 分布。所以对单一实验组实验的假设检验,其检 验统计量为 = = 1 − 0 = 0 N di d ~ (0, ) 2 n N n d d i = 2 = − 2 ( ) 1 d d n Sd i ~ ( 1) / 1 0 − − − = t n S n d t d
[例]随机地选择13个单位,放映一部描述吸烟有害于身体健康的影片, 下表中的数字是各单位认为吸烟有害身体健康的职工的百分比,试在0.05显著 性水平上检检验实验无效的零假设 表10.1 配对序号 前测/% 一后测/%值d=x1-xd d-d)2 3 计 328 练习一:以下是经济体制改革后,某厂8个车间竞争性测量的比较。问改 革后,竞争性有无增加?(取α=0.05)t=3.176 改革后8687 9384937579 改革前 91 练习二:为了了解职工的企业认同感,根据男性1000人的抽样调查,其中 有52人希望调换工作单位;而女性1000人的调査有23人希望调换工作,能否 说明男性比女性更期望职业流动?(取α=0.05) 2.一实验组与一控制组的假设检验 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于实验 刺激。在社会现实生活进行的实际实验中,对象前测后测之间的变化,有时除了 受到实验刺激外,还受到其他社会因素的作用。因而,配对样本的一实验组与 控制组之假设检验,要设法把实验变量的作用和额外变量的作用区分开来,然后 就像对待单一实验组实验一样,把问题转化为零假设μd=0的单样本检验来处 在一实验组与一控制组的实验设计之中,对前测后测之间的变化,消除额
[例] 随机地选择 13 个单位,放映一部描述吸烟有害于身体健康的影片, 下表中的数字是各单位认为吸烟有害身体健康的职工的百分比,试在 0.05 显著 性水平上检检验实验无效的零假设。 练习一:以下是经济体制改革后,某厂 8 个车间竞争性测量的比较。问改 革后,竞争性有无增加?( 取α=0.05)t=3.176 改革后 86 87 56 93 84 93 75 79 改革前 80 79 58 91 77 82 74 66 练习二:为了了解职工的企业认同感,根据男性 1000 人的抽样调查,其中 有 52 人希望调换工作单位;而女性 1000 人的调查有 23 人希望调换工作,能否 说明男性比女性更期望职业流动?( 取α=0.05) 2.一实验组与一控制组的假设检验 单一实验组实验的逻辑,是把实验对象前测后测之间的变化全部归因于实验 刺激。在社会现实生活进行的实际实验中,对象前测后测之间的变化,有时除了 受到实验刺激外,还受到其他社会因素的作用。因而,配对样本的一实验组与一 控制组之假设检验,要设法把实验变量的作用和额外变量的作用区分开来,然后 就像对待单一实验组实验一样,把问题转化为零假设μd=0 的单样本检验来处 理。 在一实验组与一控制组的实验设计之中,对前测后测之间的变化,消除额
外变量影响的基本做法如下 (1)前测:对实验组与控制组分别度量 (2)实验刺激:只对实验组实行实验刺激 (3)后测:对实验组与控制组分别度量; (4)计算消除了额外变量影响之后的di 后测实验组一前测实验组=前测后测差实验组 后测控制组一前测控制组=前测后测差控制组 实验效应di=前测后测差实验组一前测后测差控制组 [例]假定实施一种新教学法有助于提髙儿童的学习成绩,现将20名儿童 两两匹配成对,分成一实验组与一控制组,然后对实验组实施新教学法两年,下 表列示了控制组与实验组前测后测的所有10组数据,试在0.05显著性水平上检 验实验无效的零假设 表10.2 控制组 实验组 序号「前测 前测后测差前测后测差 75 234567890 399 10 9 144 64 l21 3.对实验设计与相关检验的评论 有了独立样本和非独立样本的认识,读者自然会提出什么时候使用配对样本 以及什么时候不使用配对样本的问题。很显然,匹配样本损失了自由度,使用配 对样本相当于减小了一半样本容量。这样做是不是得不偿失呢?答案是要看我们 能否恰当地配对。 在配对过程中,最好用掷硬币的方式决定“对”中的哪一个归入实验组,哪 个归入控制组。从而使“对”内随机化
外变量影响的基本做法如下: (1)前测:对实验组与控制组分别度量; (2)实验刺激:只对实验组实行实验刺激; (3)后测:对实验组与控制组分别度量; (4)计算消除了额外变量影响之后的 d i 后测实验组―前测实验组=前测后测差实验组 后测控制组―前测控制组=前测后测差控制组 实验效应 di=前测后测差实验组―前测后测差控制组 [例] 假定实施一种新教学法有助于提高儿童的学习成绩,现将 20 名儿童 两两匹配成对,分成一实验组与一控制组,然后对实验组实施新教学法两年,下 表列示了控制组与实验组前测后测的所有 10 组数据,试在 0.05 显著性水平上检 验实验无效的零假设。 3.对实验设计与相关检验的评论 有了独立样本和非独立样本的认识,读者自然会提出什么时候使用配对样本 以及什么时候不使用配对样本的问题。很显然,匹配样本损失了自由度,使用配 对样本相当于减小了一半样本容量。这样做是不是得不偿失呢?答案是要看我们 能否恰当地配对。 在配对过程中,最好用掷硬币的方式决定“对”中的哪一个归入实验组,哪 一个归入控制组。从而使“对”内随机化