
目录第七章假设检验187.2重要参数检验1一样本正态总体均值和方差的检验1$7.2.1两样本正态总体的情形6$7.2.2成对数据7$7.2.30-1分布中未知参数p的假设检验8$7.2.4置信区间和假设检验之间的关系9$7.2.5i
8 ¹ 1ÔÙ bu 1 §7.2 ëêu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1 §7.2.1 oNþÚu . . . . . . . . . . . . . . . . . . . 1 §7.2.2 üoN/ . . . . . . . . . . . . . . . . . . . . . . . . . . 6 §7.2.3 ¤éêâ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 §7.2.4 0-1 ©Ù¥ëêp bu . . . . . . . . . . . . . . . . . . . . 8 §7.2.5 &«mÚbum'X . . . . . . . . . . . . . . . . . . . . 9 i

第七章假设检验87.2重要参数检验本节介绍最基本的假设检验问题:一样本和两样本正态总体的有关均值和方差的检验,简单的大样本检验(0-1分布参数的假设检验),87.2.1一样本正态总体均值和方差的检验现实中经常碰到诸如此类的问题:假设用于某用途的合格铁钉要求长度为10厘米现有经销商从生产厂家订购了一批这样的铁钉,为了检验该批检验产品是否合格,可以从中抽取一小部分进行测量检验,通常铁钉的长度服从一个正态分布,这类问题属于一样本正态总体的假设检验问题一般地,设总体X~N(μu,a2),-0;Xi,*,Xn是取自总体X的一个样本.取显著性水平为.(1)方差已知时均值的检验先考虑双侧假设,即要检验Ho:=oH:o由于μ的极大似然估计为文,取“标准化”后的检验统计量X-MOU = u(Xi,**,Xn)= VnO注意到当Ho成立时,U~N(0,1),UI应该较小,反之当|UI的观测值u(r1,,an)较大时,不利于零假设H。应该拒绝之.所以选拒绝域形如[IU > T].要求显著性水平为Q,即PHo(IUI> T) = α解得T=uα/2.于是检验的拒绝域为[[U]>Ua/2]1
1ÔÙ bu §7.2 ëêu !0Äbu¯K: ÚüoNk'þÚu , {üu(0-1 ©Ùëêbu). §7.2.1 oNþÚu y¢¥²~-ÃXda¯K: b^u,^åÜc¹¦Ý10 f, yk²ûl)[¾ 1ùc¹, uT1u¬´ÄÜ, ± l¥ÄÜ©?1ÿþu, Ï~c¹ÝÑl©Ù, ùa¯Káu oNbu¯K. /, oNX ∼ N(µ, σ2 ), −∞ 0; X1, · · · , Xn ´goNX . wÍ5Y²α. (1) ®þu kÄVýb, =u H0 : µ = µ0 ↔ H1 : µ 6= µ0. duµ 4q,OX¯, “IOz”uÚOþ U = u(X1, · · · , Xn) = √ n X¯ − µ0 σ 5¿H0 ¤á, U ∼ N(0, 1), |U| AT, |U| *ÿu(x1, · · · , xn) , Ø|u"bH0 ATáý. ¤±Àáý/X {|U| > τ}. ¦wÍ5Y²α, = PH0 (|U| > τ ) = α, )τ = uα/2 . u´uáý {|U| > uα/2}. 1

即当观测值(a1,,n)满足不等式Vr-0l ta/26时拒绝Ho类似地,检验单侧假设Ho:μ=μoHi:μ>μo或者Ho:μμoHi:μ>μ仍然用统计量U,由于U大时不利于Ho,取拒绝域为[U > ua].而检验另一个单侧假设Ho:=oH:o或者Ho:≤μoH:μo的拒绝域为[Uuα/2-由样本算得检验统计量的值为u~2.16,如显著性水平为0.01,则临界值为u0.005~2.58,跟检验统计量的值比2
=*ÿ(x1, · · · , xn) ÷vت √ n |x¯ − µ0| σ > uα/2 áýH0. aq/, uüýb H0 : µ = µ0 ↔ H1 : µ > µ0 ½ö H0 : µ ≤ µ0 ↔ H1 : µ > µ0 E,^ÚOþU, duU Ø|uH0, áý {U > uα} . u,üýb H0 : µ = µ0 ↔ H1 : µ uα/2 . duÚO þu ≈ 2.16, XwÍ5Y²0.01, K.u0.005 ≈ 2.58, uÚOþ' 2

较发现不能拒绝零假设,即不能推翻铁钉平均长度为3厘米的假设:而如果显著性水平为0.05时,临界值为u0.025=1.96,此时可以拒绝零假设,认为铁钉平均长度不等于3厘米这个例子说明结论可能跟显著性水平的选择有关:显著性水平越小,零假设被保护得越好从而更不容易被拒绝例7.2.2.对正态总体N(μ,a2)(其中2已知)下的假设检验问题Ho:μ=μo→H1:μ≠μo,如果我们还要求“犯第二类错误的概率要小于指定的β>0”该怎么办?解:根据功效函数和两类错误的定义,知道等价的要求(7.2.1)βo(μ)≥1-β, μ tn-1(α/2)] .3
uyØUáý"b, =ØUíc¹²þÝ3 fb; XJwÍ5Y² 0.05, .u0.025 = 1.96, d±áý"b, @c¹²þÝØu3 f. ù~f`²(ØUwÍ5Y²ÀJk': wÍ5Y², "bo Ðl ØN´áý. ~ 7.2.2. éoNN(µ, σ2 )(Ù¥σ 2®)ebu¯KH0 : µ = µ0 ↔ H1 : µ 6= µ0§ XJ·¦/1aØVÇu½β > 00TNoº )µâõ¼êÚüaؽ§d¦ βφ(µ) ≥ 1 − β, µ @o" (2) þu Äu H0 : µ = µ0 ↔ µ 6= µ0, du, ±3òX¯ IOzL§¥^S 2 OoNσ 2 , uÚO þ T = √ n X¯ − µ0 S . du3H0 e, T ∼ tn−1, u´áý¤ {|T| > tn−1(α/2)} . 3

此检验称为t检验类似地可以得到另外两个单侧假设的检验拒绝域,列于表7.2.1中例7.2.3.(例7.2.1续)设方差未知,则在水平0.01和0.05下能否认为铁钉平均长度为3厘米?解:这是方差未知时关于均值的假设检验问题,Ho:μ=3-Hi:μ+3取检验统计量为T=Vn(X-3)/S,检验的拒绝域为|TI>tn-1(α/2).由样本算得检验统计量的值约为2.21,与显著性水平0.01对应临界值t15(0.005)~2.95比较,不能拒绝零假设,而与显著性水平0.05对应临界值t15(0.025)~2.13比较,可以拒绝零假设,即在显著性水平0.01下不能拒绝铁钉平均长度为3厘米的假定,但在显著性水平0.05下可以认为铁钉平均长度不等于3厘米,此结论与方差已知情形一致(3)方差的检验考虑假设检验问题Ho:g2=0-Hi:0?+%对均值已知的情形,由。2的极大似然估计62 =↓(X - μ)2ni=l可以构造检验统计量=1712-0-%在Ho下,x2~x,x2的平均值为n,而在H下,x2=%的均值为%nn,因此当x2的值过于偏离n时应该拒绝Ho,于是拒绝域取成[x2 xn(α/2)) 对均值未知的情形,构造检验统计量x2= (n-1)s2%4
du¡t u. aq/±, üüýbuáý, uL7.2.1¥. ~ 7.2.3. (~7.2.1Y) , K3Y²0.01 Ú0.05 eUÄ@c¹²þÝ3 f ? ): ù´'uþµ bu¯K, H0 : µ = 3 ↔ H1 : µ 6= 3 uÚOþT = √ n(X¯ − 3)/S, uáý|T| > tn−1(α/2). duÚ Oþ2.21, wÍ5Y²0.01 éA.t15(0.005) ≈ 2.95 ', ØUáý"b , wÍ5Y²0.05 éA.t15(0.025) ≈ 2.13 ', ±áý"b, =3wÍ 5Y²0.01 eØUáýc¹²þÝ3 fb½, 3wÍ5Y²0.05 e±@ c¹²þÝØu3 f, d(Ø®/. (3) u Äbu¯K H0 : σ 2 = σ 2 0 ↔ H1 : σ 2 6= σ 2 0 . éþ®/, dσ 2 4q,O σˆ 2 = 1 n Xn i=1 (Xi − µ) 2 ±EuÚOþ χ 2 = 1 σ 2 0 Xn i=1 (Xi − µ) 2 = nσˆ 2 σ 2 0 . 3H0 e, χ 2 ∼ χ 2 n , χ 2 ²þn, 3H1 e, χ 2 = σ 2 σ 2 0 nσˆ 2 σ2 þσ 2 σ 2 0 n 6= n, Ïdχ 2 Lu ln ATáýH0, u´áý¤ χ 2 χ2 n (α/2) . éþ/, EuÚOþ χ 2 = (n − 1)S 2 σ 2 0 , 4

其中s2为样本方差.在H。下,×2~x2-1.拒绝域取成[x2 xn-1(α/2))对于单侧假设,可以类似得到检验的拒绝域,参看表7.2.1.上述检验称为x2检验例7.2.4.(例7.2.1续)在水平0.1下能否认为铁钉的标准差大于0.1厘米?解:这是均值未知时关于方差。2的假设检验问题Ho:g2≤0.1?→H1:g2>0.12取检验统计量为x2=(=1,检验的拒绝域为(x2>x-1(a)。由样本算得检验统计量012的值x2~14.32,与显著性水平0.2对应临界值xis(0.1)~22.31比较,不能拒绝零假设,即在显著性水平0.1下可以认为铁钉的标准差小于0.1.表7.2.1一样本正态总体N(μ,α2)检验对象检验统计量分布拒绝域[U| > ua/2μ(2已知)U = Vn(X - μo)/oN(0, 1)U>uaUtn-1(α/2)μ(o?未知)T = Vn(X - μo)/Stn-1T >tn=1(α)T x(α/2)或者x x(αa)x2 _1(α/2)或者x2 xn-1(a)x2 o和μ%和?%表7.2.1总结了有关一样本正态总体的假设检验5
Ù¥S 2 . 3H0 e, χ 2 ∼ χ 2 n−1 , áý¤ χ 2 χ2 n−1 (α/2) . éuüýb, ±aquáý, ëwL7.2.1. þãu¡χ 2 u. ~ 7.2.4. (~7.2.1Y) 3Y²0.1 eUÄ@c¹IOu0.1 f? ): ù´þ'uσ 2 bu¯K, H0 : σ 2 ≤ 0.1 2 ↔ H1 : σ 2 > 0.1 2 . uÚOþχ 2 = (n−1)S 2 0.1 2 , uáý{χ 2 > χ2 n−1 (α)}. duÚOþ χ 2 ≈ 14.32, wÍ5Y²0.2 éA.χ 2 15(0.1) ≈ 22.31 ', ØUáý"b, = 3wÍ5Y²0.1 e±@c¹IOu0.1. L 7.2.1 oNN(µ, σ2 ). ué uÚOþ ©Ù áý† µ (σ 2®) U = √ n(X¯ − µ0)/σ N(0, 1) |U| > uα/2 U > uα U tn−1(α/2) T > tn−1(α) T χ2 n (α/2)½öχ 2 χ2 n (α) χ 2 χ2 n−1 (α/2)½öχ 2 χ2 n−1 (α) χ 2 µ0 Úµ σ2 0 Úσ 2 < σ2 0 . L7.2.1 o( k'oNbu. 5

87.2.2两样本正态总体的情形为了检验某肥料是否能显著提高玉米产量,可以设计一个随机试验:选择两块条件一样的试验区,把两试验区各分成若干小块,一个试验区的各小块施肥,另一个试验区的各小块不施肥,最后统计收成,可以采用如下的检验方法来检验玉米产量差别,从而知道肥料是否有效设总体X~N(μ,),~N(μ2,2),-000;X1,,X是从总体X中抽取的一个样本,Yi,*,Yn是从总体Y中抽取的一个样本.设来自不同总体的样本相互独立.下面设考虑有关均值差μ1一2和方差比/的检验.取显著性水平为α.举例说明例7.2.5.甲乙两个农业试验区种植玉米,除了甲区施磷肥外,其他试验条件都相同,把两个试验区分别均分成10个和9个小区统计产量(单位:千克),得数据如下甲区6257656063585606058乙区50595657585565557假定甲乙两区中每小块的玉米产量分别服从N(μ1,α2),N(μ2,2),其中μ1,μ2,α2未知试问在显著性水平α三0.1下磷肥对玉米的产量是否有效?解:磷肥对玉米产量有效果等价于μ1>2,故将其设为对立假设,假设检验问题是Hμμ=0Hμ>μ2构造基于μ1-μ2的极大似然估计X-的检验统计量X-YT=SuVi+!+当Ho成立时,T~tm+n-2,于是拒绝域为[T > tm+n-2(α)] .由所得数据算得检验统计量T的观测值为5-9t=:==3.23suVm+I由α=0.1得临界值为tm+n-2(α/2)=t17(0.1)~1.33<3.23,因此拒绝Ho,即可以在显著性水平0.1下认为磷肥对玉米的产量有显著性影响6
§7.2.2 üoN/ u,´ÄUwÍJpþ, ±OÅÁ: ÀJü¬^ Á«, rüÁ«©¤eZ¬, Á«¬, ,Á« ¬Ø, ÚO¤, ±æ^Xeu{5uþO, l ´Äk. oNX ∼ N(µ1, σ2 1 ), Y ∼ N(µ2, σ2 2 ), −∞ 0; X1, · · · , Xn ´l oNX ¥Ä, Y1, · · · , Yn ´loNY ¥Ä. 5gØÓoN pÕá. e¡Äk'þµ1 − µ2 Ú'σ 2 1 /σ2 2 u. wÍ5Y² α. Þ~`². ~ 7.2.5. `¯üàÁ««, Ø `« , Ù¦Á^ÑÓ, r üÁ«©Oþ©¤10 Ú9 «ÚOþ(ü : Z) , êâXe `« 62 57 65 60 63 58 57 60 60 58 ¯« 50 59 56 57 58 57 56 55 57 b½`¯ü«¥z¬þ©OÑlN(µ1, σ2 ), N(µ2, σ2 ), Ù¥µ1, µ2, σ2 . Á¯3wÍ5Y²α = 0.1 eéþ´Äk? ): éþkJduµ1 > µ2, òÙéáb, bu¯K´ H0 : µ1 ≤ µ2 = 0 ↔ H1 : µ1 > µ2. EÄuµ1 − µ2 4q,OX¯ − Y¯ uÚOþ T = X¯ − Y¯ Sw q 1 m + 1 n . H0 ¤á, T ∼ tm+n−2, u´áý {T > tm+n−2(α))} . d¤êâuÚOþT *ÿ t = x¯ − y¯ sw q 1 m + 1 n = 3.23. dα = 0.1 .tm+n−2(α/2) = t17(0.1) ≈ 1.33 < 3.23, ÏdáýH0, =±3wÍ 5Y²0.1 e@éþkwÍ5K. 6

例7.2.6.在例7.2.5中假定了两个正态总体的方差是相等的,即2=a2=α2.现在我们根据样本来检验这个方差齐性的假设,即要检验giHo : =1→ H:+1a2a2解:因为2和的极大似然估计分别是62 =-1(X - X)2, 2 -I(-)2.m=lni=l在=2/的极大似然估计=2/的基础上可以构造检验统计量S_ (m-1)o/mF=S第=(n-1)2/n注意到F中的分子和分母分别是X和Y的样本方差。当零假设成立时,F~Fm-1,n-1于是拒绝域为[F Fm-1,n-1(1-.α/2),由数据算得检验统计量F的观测值f=1.19.如果取显著性水平α=0.2,那么临界值为F9.8(0.1)=2.44,F9.8(0.9)=1/F8.9(0.1)=0.41(如果X~~Fm.n,则1/X~Fn,m).易见0.41<1.19<2.44,因此不能拒绝Ho,即在显著性水平0.2下可以认为上例中所作的方差齐性假定是合理的表7.2.2总结了两样本正态总体的双侧假设检验87.2.3成对数据在上述两样本正态总体的假设检验中,要求两个样本是独立的,但是没有要求样本量相等.有一类数据叫做成对数据[(X1,Yi),*·,(Xn,Yn)),比如一个病人在用药前后测得的指标分别为X和Y,则X与Y总是一起出现的,且由于它们是同一个体的指标,故具有很大的相关性而绝对不是独立的,这与两样本正态总体有本质区别另外,两样本检验问题要求样本X1,·,Xm是同分布的(Y1,,Yn亦然),而成对数据则无此要求,而要求X1-Y1,Xn-Yn是同分布.比如病人可以是来自两个不同性别、种族、年龄层的人要检验用药前后的指标有无显著差别,可以构造一个新的总体Z=Y-X及样本Z1=X1-Yi,**,Zn=XnYn,相应的假设检验是一样本的!在实际问题中,如果发现有两个样本且其样本量是相等的,则要检查独立性和同分布性,否则可能是成对数据7
~ 7.2.6. 3~7.2.5¥b½ üoN´, =σ 2 1 = σ 2 2 = σ 2 . y3· â5uùà5b, =u H0 : σ 2 1 σ 2 2 = 1 ↔ H1 : σ 2 1 σ 2 2 6= 1. ): Ïσ 2 1 Úσ 2 2 4q,O©O´ σˆ 2 1 = 1 m Xm i=1 (Xi − X¯) 2 , σˆ 2 2 = 1 n Xn i=1 (Yi − Y¯ ) 2 . 3θ = σ 2 1 /σ2 2 4q,Oˆθ = ˆσ 2 1 /σˆ 2 2 Ä:þ±EuÚOþ F = S 2 1 S 2 2 = (m − 1)ˆσ 2 1 /m (n − 1)ˆσ 2 2 /n . 5¿F ¥©fÚ©1©O´X ÚY . "b¤á, F ∼ Fm−1,n−1. u´áý {F Fm−1,n−1(1 − α/2)}. dêâuÚOþF *ÿf = 1.19, XJwÍ5Y²α = 0.2, @o. F9,8(0.1) = 2.44, F9,8(0.9) = 1/F8,9(0.1) = 0.41 (XJX ∼ Fm,n, K1/X ∼ Fn,m). ´ 0.41 < 1.19 < 2.44, ÏdØUáýH0, =3wÍ5Y²0.2 e±@þ~¥¤ à5b½´Ün. L7.2.2 o( üoNVýbu. §7.2.3 ¤éêâ 3þãüoNbu¥, ¦ü´Õá, ´vk¦ þ. kaêâ¤éêâ{(X1, Y1), · · · ,(Xn, Yn)}, 'X¾<3^cÿ I©OX ÚY , KX Y o´åÑy, du§´ÓNI, äké'5 ý騴Õá, ùüoNk«O. , , ü u¯K¦X1, · · · , Xm ´Ó©Ù(Y1, · · · , Yn ½,), ¤éêâKÃd¦, ¦X1 − Y1, · · · , Xn − Yn ´Ó©Ù. 'X¾<±´5güØÓ5O!«x!c# <. u^cIkÃwÍO, ±E#oNZ = Y − X 9 Z1 = X1 − Y1, · · · , Zn = Xn − Yn, Abu´! 3¢S¯K¥, XJu ykü Ùþ´, KuÕá5ÚÓ©Ù5, ÄKU´¤éêâ. 7

表7.2.2两样本正态总体的假设检验分布拒绝域检验对象检验统计量[U] > u(α/2)X-Y均值(方差已知)U=N(0,1)U>u(α)V+%U tm+n=2(α/2)x-y均值(方差未知)tT:T >tm+n-2(a)tm+n-2SuVH+ITFm.n(a/2)或F Fm,n(α),(X1-μ2)2/F Fm-1,n-1(a/2)或F Fm-1,n-1(a)Fμ2和μ1和假定方差相等$7.2.40-1分布中未知参数p的假设检验产品验收时,需要检验不合格率是否小于某给定的一个数设(X1,...,Xn)是取自总体X的一个样本,该总体服从0-1分布,取1的概率为p.常见的假设有三种:(1) Ho:p=po →Hi:p≠po;(2) Ho : p= po Hi : p> po 或Ho : p≤po - Hi : p> po:(3)Ho:p=po→H:pUa/2,[T>ua]和[T<-ua]8
L 7.2.2 üoNbu ué uÚOþ ©Ù áý† þ(®) U = X¯−Y¯ r σ2 1 m + σ2 2 n N(0, 1) |U| > u(α/2) U > u(α) U tm+n−2(α/2) T > tm+n−2(α) T Fm,n(α/2)½F Fm,n(α) F Fm−1,n−1(α/2)½F Fm−1,n−1(α) F µ2 Úµ1 σ2 2 Úσ 2 1 p0 ½H0 : p ≤ p0 ↔ H1 : p > p0; (3) H0 : p = p0 ↔ H1 : p uα/2 , {T > uα} Ú {T < −uα} 8

例7.2.7.某厂产品不合格率通常为0.5.厂方希望知道原料产地的改变是否对产品的质量发生显著的影响.现在随机地从原料产地改变后的产品中抽取了80个样品进行检验发现有5个是不合格品试问,在显著性水平0.1下,厂方由此可以得出什么结论?解:总体X~B(1,p),其中p未知.在显著性水平Q=0.1下,产品质量无变化等价于p=0.05,故我们要检验Ho:p=0.05→Hi:p+0.05由于元=5/80=0.0625,因此检验统计量T的观测值-po1t=Vn-=0.513Vpo(1 - po)由α=0.10得临界值u0.05=1.645易见,±) +P(00 <) ≤α按显著性检验的定义,即得其检验为中:当≤6o≤时,接受Ho,不然就拒绝反过来讲,如果假设Ho:0=60→H1:0%检验的接受域有形式(a,..,an)≤0o≤(ri,...,rn)即有P(≤0 ≤0)≥1 - α9
~ 7.2.7. ,¬ØÜÇÏ~0.5. F"/UC´Äé¬ þu)wÍK. y3Å/l/UC¬¥Ä 80 ¬?1u, uyk5 ´ØÜ¬. Á¯, 3wÍ5Y²0.1 e, dd±Ño(Ø? ): oNX ∼ B(1, p), Ù¥p . 3wÍ5Y²α = 0.1 e, ¬þÃCzd up = 0.05, ·u H0 : p = 0.05 ↔ H1 : p 6= 0.05. dux¯ = 5/80 = 0.0625, ÏduÚOþT *ÿ t = √ np x¯ − p0 p0(1 − p0) = 0.513. dα = 0.10 .u0.05 = 1.645. ´, |t| u m'X"X1, · · · , XnloNF(x; θ) ¥Ä§ëêθ1−α&«m[θ, ¯θ],= P(θ ≤ θ ≤ ¯θ) = 1 − α ébH0 : θ = θ0 ↔ H1 : θ 6= θ0§3be§k P(θ ≤ θ0 ≤ ¯θ) = 1 − α du P(θ0 > ¯θ) + P(θ0 < θ) ≤ α UwÍ5u½Â§=Ùu φ : θ ≤ θ0 ≤ ¯θ §ÉH0,Ø,Òáý L5ù,XJbH0 : θ = θ0 ↔ H1 : θ 6= θ0uÉk/ª θ(x1, · · · , xn) ≤ θ0 ≤ ¯θ(x1, · · · , xn) =k P(θ ≤ θ0 ≤ ¯θ) = 1 − α 9