Lec9:假设检验 张伟平 2011年4月11日 假设检验即使用样本对所关心的假设进行推断.假设检验问题大致分为两大类: 1.参数型假设检验:即总体的分布形式已知(如正态、指数、二项分布等),总体分布依赖 于未知参数(或参数向量)9,要检验的是有关未知参数的假设.如X~N(a,σ),a未知,检验 H0:a=a0←→H1:a≠a0或H0:a≤a0←→H1:a>a0 2.非参数型假设检验:如果总体分布形式未知,此时就需要有一种与总体分布族的具体数 学形式无关的统计方法,称为非参数方法.如检验一批数据是否来自某个已知的总体,就属于这 类问题。 1假设检验的若干基本概念 一、检验问题的提法 为了说明假设检验问题的提法,考察下面的例子 例5.1.1某工厂生产的一大批产品,要卖给商店.按规定次品率p不得超过0.01,今在其中 抽取100件,经检验有3件次品,问这批产品可否出厂? 关于这个问题,在我们面前存在两种可能性: 甲:0<p≤0.01;乙:0.01<p<1. 我们要通过从这批产品中抽样来决定甲,乙两种可能性中哪个成立. 这个问题常以下述方式提出:引进一个“假设” Ho:0<p≤0.01 它叫做零假设(null hypothesis)或原假设,有时也简称为假设.另一个可能是 H1:0.01<p<1 叫做对立假设或备择假设(alternative hypothesis): 我们的目的是要通过样本决定接受Ho,还是拒绝Ho.可以形象地把问题写成 Ho:0<p≤0.01←→H1:0.01<p<1
Lec9: bu ‹ï² 2011 c 4 11 F bu=¶^ȧ'%b?1̉. buØKåó©è¸åa: 1. ÎÍ.bu: =oN©Ÿ/™Æ(X!çÍ!ë©Ÿ) , oN©Ÿù6 uôÎÍ(½ÎÍï˛) θ, áu¥k'ôÎÍb. XX ∼ N(a, σ2 ), aô, u H0 : a = a0 ←→ H1 : a 6= a0 ½ H0 : a ≤ a0 ←→ H1 : a > a0 2. öÎÍ.bu: XJoN©Ÿ/™ô, dû“Iákò´ÜoN©Ÿx‰NÍ Æ/™Ã'⁄Oê{, °èöÎÍê{. Xuò1Í‚¥ƒ5g,áÆoN, “·u˘ aØK. 1 bueZƒVg ò!uØKJ{ è `²buØKJ{, e°~f. ~5.1.1 ,ÛÇ)òå1¨, áÒâ˚A. U5½g¨«pÿáL0.01,83Ÿ• ƒ100á, ²uk3ág¨, Ø˘1¨åƒ—Ç? 'u˘áØK, 3·Ç°c3¸´åU5: `: 0 < p ≤ 0.01; Ø: 0.01 < p < 1. ·ÇáœLl˘1¨•ƒ5˚½`, ظ´åU5•=᧷. ˘áØK~±e„ê™J—: ⁄?òá“b” H0 : 0 < p ≤ 0.01 ßâ"b (null hypothesis) ½b, kûè{°èb. ,òáåU¥ H1 : 0.01 < p < 1 âÈ·b½Jb(alternative hypothesis). ·Ç8¥áœL˚½…H0, Ñ¥·˝H0. å±/ñ/rØK§ H0 : 0 < p ≤ 0.01 ←→ H1 : 0.01 < p < 1
注意这个提法中将Ho放在中心位置,它是检验的对象.H和H1的位置不可颠倒.从这个例 子可将假设检验问题一般化,提法如下: 设有参数分布族{F4,0∈日},此处日为参数空间.X1,·,Xn是从上述分布族中抽取 的简单随机样本.在参数假设检验问题中,我们感兴趣的是是否属于参数空间日的 某个真子集日0,则命题Ho:0∈Θ称为零假设或原假设,其确切含义是:存在一 个0∈日0使得X的分布为Fg。.记日1=日-Θ0,则命题H1:9∈日1称为Ho的对立假 设或备择假设(在例5.1.1中,日=(0,1),90=(0,0.01,日1=(0.01,1).则假设检验 问题表为 H0:0∈Θ0←→H1:0∈Θ1, (1.1) 在(5.1.1)式中,若9o或01只包含参数空间日中的一个点,则称为简单假设(simple hypothe- sis):否则,称为复合假设(composite hypothesis).例如,样本抽自N(a,o),后已知,则参数空间 为日={a:-oao,则零假设H和对立假设H1皆为复合假设 二、假设检验的依据-小概率原理 在例5.1.1中,由于这批产品数量很大,故若记X为抽取的100件产品中的次品数,则可以近似 认为X~B(100,p.如果零假设0<p≤0.01是正确的,则 P(X≥3)≤1-∑Cioo0.010.991400--0.079 =0 即如果认为这批产品是合格的,则100件产品中有3件次品或者更多次品的可能性只有7.9%,这 个概率比较小,按照小概率原理,不大可能在一次实验中就发生,但我们偏偏观测到了.因此有 理由怀疑零假设是不正确的. 应用小概率原理只能大体上表达我们对零假设是否成立的大致推断 三、否定域、检验函数和检验统计量 我们仍通过例子来说明这个概念, 例5.1.2设X=(X1,·,Xn)为从总体X~N(a,1)中抽取的随机样本.考虑检验问题: Ho:a=ao←→H1:a≠a0: (1.2) 此处,ao为给定的常数, 这种检验的一种直观上的作法是:先求a的一个估计量,我们知道了=A∑1X:是a的一个 优良估计.若下一ao较大,我们就倾向于否定Ho;反之,如果区-a0较小,我们就认为抽样结 2
5ø˘áJ{•ÚH0ò3•%†ò, ߥuÈñ. H0⁄H1†òÿå6. l˘á~ fåÚbuØKòÑz, J{Xe: kÎÍ©Ÿx{Fθ, θ ∈ Θ},d?ΘèÎÍòm. X1, · · · , Xn¥l˛„©Ÿx•ƒ {¸ëÅ. 3ÎÍbuØK•, ·Ça,¥θ¥ƒ·uÎÍòmΘ ,á˝f8Θ0, K·KH0 : θ ∈ Θ°è"b½b, Ÿ(ɹ¬¥: 3ò áθ0 ∈ Θ0¶X©ŸèFθ0 . PΘ1 = Θ − Θ0,K·KH1 : θ ∈ Θ1°èH0È·b ½Jb(3~5.1.1•,Θ = (0, 1), Θ0 = (0, 0.01], Θ1 = (0.01, 1)) . Kbu ØKLè H0 : θ ∈ Θ0 ←→ H1 : θ ∈ Θ1, (1.1) 3(5.1.1)™•, eΘ0½Θ1êù¹ÎÍòmΘ•òá:, K°è{¸b (simple hypothesis);ƒK, °èE‹b (composite hypothesis). ~X, ƒgN(a, σ2 0 ), σ2 0Æ, KÎÍòm èΘ = {a : −∞ a0, K"bH 0 0⁄È·bH 0 1èE‹b. !buù‚–V«n 3~5.1.1•, du˘1¨Í˛Èå, ePXèƒ100ᨕg¨Í, Kå±Cq @èX ∼ B(100, p). XJ"b0 < p ≤ 0.01¥(, K P(X ≥ 3) ≤ 1 − X 2 i=0 C i 1000.01i 0.99100−i = 0.079 =XJ@è˘1¨¥‹Ç, K100ᨕk3ág¨½ˆçıg¨åU5êk7.9%, ˘ áV«', UÏV«n, ÿååU3òg¢•“u), ·Ç††*ˇ . œdk nd~¶"b¥ÿ(. A^V«nêUåN˛Là·ÇÈ"b¥ƒ§·åó̉. n!ƒ½ç!uºÍ⁄u⁄O˛ ·ÇEœL~f5`²˘áVg. ~5.1.2 X = (X1, · · · , Xn)èloNX ∼ N(a, 1)•ƒëÅ. ƒuØK: H0 : a = a0 ←→ H1 : a 6= a0, (1.2) d?, a0èâ½~Í. ˘´uò´Ü*˛ä{¥: k¶aòáO˛,·ÇX¯ = 1 n Pn i=1 Xi¥aòá `˚O. e|X¯ − a0|å,·Ç“ñïuƒ½H0;áÉ, XJ|X¯ − a0|, ·Ç“@èƒ( 2
果与Ho相接近,因而倾向于接受Ho.具体地说,我们要确定一个数A,对样本X=(X1,.,Xn),算 出X,当|了-ao>A时就否定Ho:当|了-aol≤A时就接受Ho.我们称 D=X=(X1,...;Xn):X-aol>Al (1.3) 为否定域,或叫做拒绝域(reject region).即,否定域是由样本空间X中一切使下-ao>A的 那些样本X=(X1,,X)构成.有了否定域,等价于将样本空间%分成不相交的两部 分X=X-D和X2=D,一旦有了样本X,当X∈名时,就接受Ho;当X∈2=D时,就否定Ho 我们称X1为接受域(acceptance region).只要A定下来了,则否定域(或接受域)也就确定了.因 此,在此问题中检验可视为如下的一种法则: 了当|区-aol>A时,拒绝Ho T: 当|区-aol≤A时,接受H 上式中的T,给定了一种法则,一旦有了样本,我们就可以在接受Ho或否定H。这两个结论中选择 一个.我们称这样一种法则T为检验问题(1.2)的一个检验 为了便于数学上处理,我们引入如下检验函数(x)的概念,(x)与检验T是一一对应的.在 例5.1.2中 当区-aol>A时 (1.4 0 当lx-ao≤A时 我们有如下定义: 定义5.1.1由(5.1.4)给出的检验函数p(x)是定义在样本空间2上,取值于0,1的函数 它表示当有了样本X后,否定Ho的概率, 由定义可见,若p(x)=1,则以概率为1否定Ho,当p(x)=0,则以概率为0否定Ho(即以概率 为1接受Ho)若p(x)只取0,l这两个值,则这种检验称为非随机化检验(non-randomized test).此 时,否定域也可用检验函数表示如下:D={X=(X1,,X):(x)=1 若对某些样本X,有0c时,认为不合 格,拒绝当∑X=c时,若规定拒绝,厂方觉得被拒绝的可能性大了,吃亏了.反之,若 接受Ho,买方(商店)接受不合格产品的可能性大了,也觉得吃亏在双方僵持不下的情况下,下列折 中方案是双方都可以接受的:定下一个数0c p(x 若∑X=c (1.5) 0 若∑X:<c 3
JÜH0ÉC,œ ñïu…H0. ‰N/`,·Çá(½òáÍA,ÈX = (X1, . . . , Xn),é —X, ¯ |X¯ − a0| > Aû“ƒ½H0;|X¯ − a0| ≤ Aû“…H0.·Ç° D = {X = (X1, . . . , Xn) : |X¯ − a0| > A} (1.3) 能ç,½â·˝ç (reject region).=,ƒ½ç¥dòm X•òɶ|X¯ − a0| > A @ X = (X1, . . . , Xn)§. k ƒ½ç,duÚòm X ©§ÿɸ‹ ©X1 = X − D⁄X2 = D,òk X,X ∈ X1û,“…H0; X ∈ X2 = Dû,“ƒ½H0. ·Ç°X1è…ç (acceptance region).êáA½e5 ,Kƒ½ç(½…ç) è“(½ . œ d, 3dØK•uå¿èXeò´{K: T : ( |X¯ − a0| > A û, ·˝ H0 |X¯ − a0| ≤ A û, … H0 ˛™•T,â½ ò´{K,òk ,·Ç“å±3…H0½ƒ½H0 ˘¸á(ÿ•¿J òá. ·Ç°˘ò´{KTèuØK(1.2)òáu. è BuÍÆ˛?n,·Ç⁄\XeuºÍϕ(x)Vg,ϕ(x)ÜuT ¥òòÈA.3 ~5.1.2• ϕ(x) = ( 1 |X¯ − a0| > A û 0 |X¯ − a0| ≤ A û (1.4) ·ÇkXe½¬: ½¬5.1.1 d(5.1.4)â—uºÍ ϕ(x)¥½¬3òm X ˛, äu[0,1]ºÍ. ßL´k X,ƒ½H0V«. d½¬åÑ,eϕ(x) = 1,K±V«è1ƒ½H0,ϕ(x) = 0, K±V«è0ƒ½H0(=±V« è1…H0).eϕ(x)ê0,1˘¸áä, K˘´u°èöëÅzu (non-randomized test).d û,ƒ½çèå^uºÍL´Xe: D = {X = (X1, . . . , Xn) : ϕ(x) = 1}. eÈ, X,k0 cû,@èÿ‹ Ç, ·˝H0. P100 i=1 Xi = cû,e5½·˝H0,Çê˙·˝åU5å , غ . áÉ, e …H0,Ôê(˚A)…ÿ‹Ç¨åU5å ,è˙غ.3Vêð±ÿeú¹e,eÚ •êY¥Vê—å±…: ½eòáÍ0 c r e P100 i=1 Xi = c 0 e P100 i=1 Xi < c. (1.5) 3
在例5.1.2中要确定检验,必须定出(5.1.3)或(5.1.4)式中的A,此处A称为临界值(critical vaue).要定下c的值需要找到检验统计量的分布.在此例中检验统计量是T=灭.同样在 例5.1.1中,检验函数(5.15)中的c称为临界值,检验统计量是T=∑X.确定检验统计量的分 布是解决假设检验问题的关键.当检验统计量的精确分布很难找到时,若其极限分布比较简 单,我们可用极限分布代替精确分布,获得假设检验问题的近似解, 四、两类错误与功效函数 统计推断是以样本为依据的,由于样本的随机性,我们不能保证统计推断方法的绝对正确性, 而只能以一定的概率去保证这种推断的可靠性在假设检验问题中可能出现下列两种情形会犯 错误: 决策 拒绝Ho 接受Ho 假设 Ho为真 犯错 不犯错 H1为真 不犯错 犯错 1.零假设Ho本来是对的,由于样本的随机性,样本观察值落入否定域D,错误地将Ho否定 了,称为弃真.这时犯的错误称为第一类错误(Type I error), 2.零假设H0本来不对,由于样本的随机性,样本观察值落入接受域D,错误地将H接受了, 称为取伪.这时犯的错误称为第二类错误(Type IⅡerrOr). 如在例5.1.1中确定了非随机检验如下: 1 o(x) 若∑10X>3 0 若∑X:≤3. 如果总体的真实次品率为p=0.0050.01,由于样本 的随机性,抽样结果显示∑1X:=1,即样本落入了接受域.这时我们犯第二类错误。 应当注意,在每一具体场合,我们只会犯两类错误中的一个.当检验确定后,犯两类错误的概 率也就确定了.我们希望犯两类错误的概率越小越好,但这一点很难做到.在样本大小固定的 前提下,二者不可兼得.这就如同区间估计问题中可靠度和精度二者不可兼得一样.那么,怎样去 计算犯两类错误的概率呢?为此,引出功效函数的概念。 定义5.1.2设p(x)是H0:0∈日0←→H1:0∈日1的一个检验函数,则 B(0)=Pe{用检验p否定了Ho}=Ea[p(X)儿,0∈Θ 称为p的功效函数(power function),也称为效函数或势函数. 若(x)为非随机化检验,否定域为D,则 B(0)=Po(X=(X1,...,Xn)E D) 4
3~5.1.2•á(½u,7L½—(5.1.3)½(5.1.4)™•A, d?A °è.ä (critical value).á½ecäIáÈu⁄O˛©Ÿ. 3d~•u⁄O˛¥T = X¯. ”3 ~5.1.1•, uºÍ(5.1.5) •c°è.ä,u⁄O˛¥T = P100 i=1 Xi .(½u⁄O˛© Ÿ¥)˚buØK'Ö. u⁄O˛°(©ŸÈJÈû, eŸ4Å©Ÿ'{ ¸,·Çå^4Å©ŸìO°(©Ÿ,ºbuØKCq). o!¸aÜÿÜıºÍ ⁄Ỏ¥±èù‚,duëÅ5,·ÇÿUy⁄Ỏê{˝È(5, êU±ò½V«y˘´Ì‰åÇ5.3buØK•åU—ye¸´ú/¨ã Üÿ: P b P PPPPPPP ˚¸ ·˝H0 …H0 H0è˝ ãÜ ÿãÜ H1è˝ ÿãÜ ãÜ 1. "b H05¥È, duëÅ5, * ä·\ƒ½çD, Üÿ/ÚH0ƒ½ , °èÔ˝. ˘ûãÜÿ°è1òaÜÿ (Type I error). 2. "b H05ÿÈ, duëÅ5, * ä·\…çD, ¯ Üÿ/ÚH0… , °èñ. ˘ûãÜÿ°è1aÜÿ( Type II error). X3~5.1.1•(½ öëÅuXe: ϕ(x) = ( 1 e P100 i=1 Xi > 3; 0 e P100 i=1 Xi ≤ 3. XJoN˝¢g¨«èp = 0.005 0.01, du ëÅ5,ƒ(Jw´ P100 i=1 Xi = 1,=·\ …ç. ˘û·Çã1aÜÿ. A5ø,3zò‰N|‹,·Çê¨ã¸aÜÿ•òá. u(½,ã¸aÜÿV «è“(½ . ·ÇF"ã¸aÜÿV«–,˘ò:ÈJâ. 3ån½ cJe,ˆÿåo. ˘“X”´mOØK•åÇ›⁄°›ˆÿåoò. @o,N Oéã¸aÜÿV«Q?èd, ⁄—ıºÍVg. ½¬5.1.2 ϕ(x)¥H0 : θ ∈ Θ0 ←→ H1 : θ ∈ Θ1òáuºÍ,K βϕ(θ) = Pθ ^u ϕ ƒ½ H0 = Eθ[ϕ(X)], θ ∈ Θ °èϕıºÍ (power function),è°èºÍ½³ºÍ. eϕ(x)èöëÅzu,ƒ½çèD,K βϕ(θ) = Pθ X = (X1, . . . , Xn) ∈ D 4
因此功效函数表示当样本分布参数为9时,否定Ho的概率.对例5.1.1,当检验函数为随机化检 验(1.5)时,利用∑1X,~b(m,),0d+P(x=e) 以下讨论中假定(x)皆为非随机化的检验函数,除非特别申明,不认为(x)为随机化检验函数. 知道了检验(x)的功效函数后,就可以计算犯两类错误的概率.若以α()和B()分别记犯 第一、二类错误的概率,则犯第一类错误的概率可表示为 Be(8)当∈6o 当0∈Θ1, 犯第二类错误的概率可表示为 0 当0∈日0 8*(0) 1-3.(0)当0∈61. 还需要说明的一点是:如前所述,犯两类错误的概率完全由功效函数决定,从这一点上看, 如果两个检验有同一功效函数,则此两检验在性质上也完全相同. 四、检验水平和控制犯第一类错误概率的原则 前面说过,我们希望一个检验犯两类错误的概率都很小,但除极例外情形,一般说来在固 定样本大小时对任何检验都办不到.例如,要使犯第一类错误的概率减小,就要缩小拒绝域,使 接受域增大,这必然导致犯第二类错误概率增大,反之亦然.因此,Neyman-Pearson提出了一 条原则,就是限制犯第一类错误概率的原则.即在保证犯第一类错误的概率不超过指定数值α (0<α<1,通常取较小的数)的检验中,寻找犯第二类错误概率尽可能小的检验.若记 Sa={p:a*(0)=B(0)≤a,当0∈Θo}: S。表示由所有犯第一类错误的概率都不超过α的检验函数构成的类.我们只考虑S。中的检验 在S。中挑选“犯第二类错误的概率尽可能小的检验”,这种法则称为控制犯第一类错误概率的 法则. 根据Neyman-Pearson原则,在原假设Ho为真时,我们作出错误决定(即否定Ho)的 概率受到了控制.这表明,原假设Ho受到保护,不致于轻易被否定.所以在具体问题 中,我们往往将有把握、不能轻易否定的命题作为原假设Ho,而把没有把握的、不 能轻易肯定的命题作为对立假设.因此原假设Ho和对立假设H1的地位是不平等的, 不能相互调换. 5
œdıºÍL´©ŸÎÍèθû,ƒ½H0V«. È~5.1.1,uºÍèëÅzu (1.5)û, |^ Pn i=1 Xi ∼ b(n, θ), 0 c + rPX 100 i=1 Xi = c = X 100 k=c+1 100 k θ k (1 − θ) 100−k + r 100 c θ c (1 − θ) 100−c . ±e?ÿ•b½ϕ(x)èöëÅzuºÍ,ÿöAO², ÿ@èϕ(x)èëÅzuºÍ. uϕ(x)ıºÍ,“å±Oéã¸aÜÿV«. e±α ∗ ϕ(θ) ⁄β ∗ ϕ(θ)©OPã 1ò!aÜÿV«,Kã1òaÜÿV«åL´è α ∗ ϕ(θ) = ( βϕ(θ) θ ∈ Θ0 0 θ ∈ Θ1, ã1aÜÿV«åL´è β ∗ ϕ(θ) = ( 0 θ ∈ Θ0 1 − βϕ(θ) θ ∈ Θ1. ÑIá`²ò:¥: Xc§„, ã¸aÜÿV«dıºÍ˚½, l˘ò:˛w, XJ¸áuk”òıºÍ, Kd¸u35ü˛èÉ”. o!uY²⁄õõã1òaÜÿV«K c°`L, ·ÇF"òáuã¸aÜÿV«—È, ÿ4~ ú/, òÑ`53 ½åûÈ?¤u—çÿ. ~X, á¶ã1òaÜÿV«~, “ᆷ˝ç, ¶ …çOå, ˘7,óã1aÜÿV«Oå, áɽ,. œd, Neyman-PearsonJ— ò ^K, “¥Åõã1òaÜÿV«K. =3yã1òaÜÿV«ÿáLç½Íäα (0 < α < 1,œ~Í) u•, œÈã1aÜÿV«¶åUu. eP Sα = { ϕ : α ∗ ϕ(θ) = βϕ(θ) ≤ α, θ ∈ Θ0}, SαL´d§kã1òaÜÿV«—ÿáLαuºÍ§a. ·ÇêƒSα•u. 3Sα•]¿/ã1aÜÿV«¶åUu0, ˘´{K°èõõã1òaÜÿV« {K. ä‚Neyman-PearsonK, 3bH0è˝û, ·Çä—Üÿ˚½(=ƒ½H0) V«… õõ. ˘L², bH0…o, ÿóu½. §±3‰NØK •, ·Ç Úkrº!ÿU½·KäèbH0, rvkrº!ÿ Uî¥í½·KäèÈ·b. œdbH0⁄È·bH1/†¥ÿ², ÿUÉpNÜ. 5
与犯第一类错误概率相联系的另一个概念是检验水平,其定义如下: 定义5.1.3设p是(1.1)的一个检验,而0≤a≤1.如果p犯第一类错误的概率总不超过a (或等价地说,若p满足:B(0)≤a,对一切0∈日o),则称a是检验p的一个水平,而p称为显著性 水平为a的检验,简称水平为α的检验. 按这一定义,检验的水平不唯一.若a为检验p的水平,而a<a'<1,则a'也是检验p的水平 为避免这一问题,有时称一个检验的最小水平为其真实水平.也就是 检验p的真实水平=sup{Be(0),9∈Θo} (1.6) 至于水平的选择,习惯上把α取得比较小且标准化,如a=0.01,0.05,0.10等.标准化是为了方 便造表 水平的选取,对检验的性质有很大影响.不难了解,如果水平选得很低,那么我们容许犯第一 类错误的概率很小,而为了达到这一点势必大大缩小否定域,而这样就增加了犯第二类错误的可 能性.反之,若水平选得高,则否定域扩大,使接受域缩小,从而犯第二类错误的概率相应的将降 低.这样看来,水平的选择不是一个数学问题,而是一个必须从实际角度来考虑的问题.一般说来 有以下几个因素影响水平的选定 1.当一个检验涉及两方利益时,水平的选定常是双方协议的结果.以例5.1.1为例,商店向工 厂进货,检验其次品率是否超过0.01,若水平选的低,则可能有较多的次品被商店接受:反之,若水 平定的高,则将有较多的合格品被商店拒收.因此水平定的大小涉及商店和工厂双方利益,应由 双方商定.如前所述有时还要采取随机化的方法,使双方利益达到平衡】 2.两种错误的后果一般在性质上有很大的不同.如果第一类错误的后果在性质上很严重,我 们就力求在合理的范围内尽量减少犯这种错误的可能性,这时相应的水平就取得更低一些.例 如,制药厂要生产一种新药代替旧药治疗某种疾病,安排了一些试验,要对新旧药物疗效作出检 验.由于旧药已经长期临床使用,有一定的疗效.新药尚未经长期临床使用,一旦效果不好时,将 危及病人的生命安全,造成的后果会很严重.所以在进行检验时,将原假设Ho设为”旧药不比 新药差”,且使检验水平α定得更小一些,这样使Ho被否定的可能性大大减小了.这样就保证了: “原假设被否定、新药被接受的检验”将是非常严格的。 3.一般说来,试验者在试验前对问题的情况总不是一无所知的.他对问题的了解使他对零假 设是否能成立就有了一定的看法.这种看法可能影响到他对水平的选择.比方说一个物理学家 根据某种理论推定随机变量X应有分布F,而他打算将这一理论付诸检验.很明显,如果他对这一 理论很有信心,他将非常倾向于认为假设能成立,这时只有很有力的证据才可能使他认为这假设 不对.相应地,他将把检验水平取得低一些 在实际问题中,零假设被否定,常常意味着推翻一种理论或用新方法来代替一直使用的 标准方法.在大多数情况下,人们希望这样做时有相当大的根据.从这里可以看到,Neyman- Pearson:控制犯第一类错误的原则,在零假设的选择中有很大的实际意义,而决不单纯是一数学 问题.同时,也进一步理解了在假设检验问题中,零假设处在突出地位的原因 最后要说明的一点是:若水平α很小,原假设H0不会轻易被否定.如果样本观察值落入了否定 域,我们做出“否定原假设Ho”的结论就比较可靠(因为,此时我们只会犯第一类错误,且其概 率很小).反之,当α很小时,如果样本观察值落入接受域,我们做出“接受原假设Ho”的结论未必 可靠.这只能表明:在所选定的水平下没有充分根据认为H不成立,决不意味着有充分根据说明 它正确(因为此时我们只会犯第二类错误,但其概率可能很大)· 6
Üã1òaÜÿV«ÉÈX,òáVg¥uY², Ÿ½¬Xe: ½¬5.1.3 ϕ¥(1.1)òáu, 0 ≤ α ≤ 1. XJϕã1òaÜÿV«oÿáLα (½d/`, eϕ˜v: βϕ(θ) ≤ α,ÈòÉθ ∈ Θ0) , K°α¥uϕòáY², ϕ°èwÕ5 Y²èαu, {°Y²èαu. U˘ò½¬,uY²ÿçò.eαèuϕY², α < α0 < 1,Kα 0è¥uϕY². è;ù˘òØK, kû°òáuÅY²èŸ˝¢Y². è“¥ uϕ˝¢Y² = sup{ βϕ(θ), θ ∈ Θ0} (1.6) ñuY²¿J,S.˛rα'ÖIOz,Xα = 0.01, 0.05, 0.10. IOz¥è ê BEL. Y²¿, Èu5ükÈåKè. ÿJ ),XJY²¿È$, @o·ÇNNã1ò aÜÿV«È, è à˘ò:³7å冃½ç, ˘“O\ ã1aÜÿå U5. áÉ,eY²¿p,Kƒ½ç*å, ¶…ç†, l ã1aÜÿV«ÉAÚ¸ $. ˘w5,Y²¿Jÿ¥òáÍÆØK, ¥òá7Ll¢S›5ƒØK. òÑ`5 k±eAáœÉKèY²¿½. 1. òáu9¸ê|Ãû, Y²¿½~¥VêÆ(J. ±~5.1.1è~,˚AïÛ Ç?¿, uŸg¨«¥ƒáL0.01,eY²¿$,KåUkıg¨˚A…;áÉ,eY ²½p, KÚkı‹Ç¨˚A·¬. œdY²½å9˚A⁄ÛÇVê|Ã,Ad Vê˚½. Xc§„,kûÑáÊëÅzê{,¶Vê|Ãà²Ô. 2. ¸´ÜÿJòÑ35ü˛kÈåÿ”. XJ1òaÜÿJ35ü˛ÈÓ, · Ǔ¶3‹nâåS¶˛~ã˘´ÜÿåU5,˘ûÉAY²“ç$ò . ~ X,õÜÇá)ò´#ÜìOŒÜ£,´;æ, S¸ ò £,áÈ#ŒÜ‘ä—u . duŒÜƲœK¶^,kò½. #ܡô²œK¶^, òJÿ–û,Ú à9æ<)·S, E§J¨ÈÓ. §±3?1uû, ÚbH0蔌Üÿ' #Ü”,Ö¶uY²α½çò , ˘¶H0ƒ½åU5åå~ . ˘“y : /bƒ½!#Ü…u0Ú¥ö~ÓÇ. 3. òÑ`5,£ˆ3£cÈØKú¹oÿ¥òç. ¶ÈØK )¶¶È"b ¥ƒU§·“k ò½w{, ˘´w{åUKè¶ÈY²¿J. 'ê`òá‘nÆ[ ä‚,´nÿ̽ëÅC˛XAk©ŸF, ¶ãéÚ˘ònÿGÃu. Ȳw,XJ¶È˘ò nÿÈk&%,¶Úö~ñïu@èbU§·, ˘ûêkÈkÂy‚‚åU¶¶@è˘b ÿÈ. ÉA/,¶ÚruY²$ò . 3¢SØK•, "bƒ½, ~~øõXÌÄò´nÿ½^#ê{5ìOòܶ^ IOê{. 3åıÍú¹e,<ÇF"˘âûkÉåä‚. l˘på±w, NeymanPearsonõõã1òaÜÿK,3"b¿J•kÈå¢Sø¬, ˚ÿ¸X¥òÍÆ ØK. ”û,è?ò⁄n) 3buØK•,"b?3‚—/†œ. Åá`²ò:¥:eY²αÈ,bH0ÿ¨î¥ƒ½. XJ* ä·\ ƒ½ ç, ·Çâ—/ƒ½bH00(ÿ“'åÇ(œè, dû·Çê¨ã1òaÜÿ, ÖŸV «È). áÉ, αÈû,XJ* ä·\…ç,·Çâ—/…bH00(ÿô7 åÇ. ˘êUL²:3§¿½Y²evkø©ä‚@èH0ÿ§·,˚ÿøõXkø©ä‚`² ß((œèdû·Çê¨ã1aÜÿ, ŸV«åUÈå) . 6
五、求解假设检验问题的一般步骤 1.根据问题的要求提出零假设Ho和备择假设H1; 2.导出否定域的形式,确定检验统计T(X),其中临界值A待定 3.选取适当水平,利用检验统计量的分布求出临界值A 4.由样本X算出检验统计量T(X)的具体值,代入到否定域中,与临界值相比较,作出接受或 者拒绝原假设Ho的结论。 2正态总体参数的假设检验 正态分布是最常见的分布,关于它的参数的假设检验是实际中常遇到的问题,因此也是最重 要的一类检验问题.本节将分下列几种情况来讨论正态总体参数的直观检验方法:单个正态总 体均值和方差的检验;两个正态总体均值差和方差比的检验;极限分布为正态分布的有关大样本 检验 在讨论正态分布总体参数的假设检验问题时,S2.4中的定理2.2.3和推论2.4.2-推论2.4.5在求 检验统计量的分布中起到十分重要的作用. 一、单个正态总体均值的检验 设X=(X1,.·,X)为从正态总体N(山,σ2)中抽取的简单随机样本,给定检验水平α,求下 列三类检验问题: (1)H0:4=0←→H1:μ≠40 (2)H6:μ≤0←→H:μ>0 (3)H6:μ≥0←→H:μA,A待定.当σ2未知时,由推论2.4.2可知,在μ=o条件下, T=(r-0) tn-1 (2.1) 因此取T=四作为检验统计量,则否定域的等价形式可取为 {(Xi,,Xn):T>c},c待定. 7
!¶)buØKòÑ⁄½ 1. ä‚ØKá¶J—"bH0⁄JbH1; 2. —ƒ½ç/™, (½u⁄OT(X), Ÿ•.äAñ½. 3. ¿·Y², |^u⁄O˛©Ÿ¶—.äA. 4. dXé—u⁄O˛T(X)‰Nä, ì\ƒ½ç•, Ü.äÉ', ä—…½ ˆ·˝bH0(ÿ. 2 oNÎÍbu ©Ÿ¥Å~Ñ©Ÿ, 'ußÎÍbu¥¢S•~ëØK, œdè¥Å áòauØK. !Ú©eA´ú¹5?ÿoNÎÍÜ*uê{: ¸áo N˛ä⁄êu; ¸áoN˛ä⁄ê'u; 4Å©Ÿè©Ÿk'å u. 3?ÿ©ŸoNÎÍbuØKû, §2.4•½n2.2.3⁄Ìÿ2.4.2–Ìÿ2.4.53¶ u⁄O˛©Ÿ•Âõ©áä^. ò!¸áoN˛äu X = (X1, . . . , Xn)èloNN(µ, σ2 )•ƒ{¸ëÅ, â½uY²α, ¶e nauØK: (1) H0 : µ = µ0 ←→ H1 : µ 6= µ0; (2) H0 0 : µ ≤ µ0 ←→ H0 1 : µ > µ0; (3) H00 0 : µ ≥ µ0 ←→ H00 1 : µ u (two-side test), °uØK(2)⁄(3)è¸>u (one-side test). ¸áoNêôûuØKá'êÆú¹ç~Ñ, ·ÇÚ:?ÿ˘òú/. 'u˛äÆûuê{, ·ÇÚ3°âòá`². ƒkƒuØK(1), = H0 : µ = µ0 ←→ H1 : µ 6= µ0 ·Ç^Ü*ê{Euƒ½ç. ·ÇX¯ = 1 n Pn i=1 Xi ¥µÃ†O, Ö‰ k˚–5ü. Ü*˛w|X¯ − µ0|å, H0ÿñ§·. œduƒ½çåXe/™: {X = (X1, . . . , Xn) : |X¯ − µ0| > A}, Añ½. σ 2ôû, dÌÿ2.4.2å,3µ = µ0^áe, T = √ n(X¯ − µ0) S ∼ tn−1. (2.1) œdT = √ n(X¯−µ0) S äèu⁄O˛,Kƒ½çd/™åè (X1, . . . , Xn) : |T| > c , c ñ½. 7
由检验水平为α,可知 P(IT]>c|Ho)=P(vn(X-Ho)/S>c Ho)=a, 故得c=tn-1(a/2).因此由否定域 D1={(X1,…,Xn):Wn(r-o)/S>tn-1(a/2)} (2.2) 确定的检验为检验问题(1)的水平为α的检验, 对检验问题(2),取T=√元(区-o)/S作为检验统计量,因此直观上否定域的形式为 {(X1,,Xn):T>c},c待定. 为使检验(2)具有水平α,即要求 P(T>clH6)=P((R-o)/S>c|4≤o)≤a, (2.3) 注意到 P(Va-o/s>cu≤o)=P(VR-/s>c+-巴|u≤o ≤P(V(r-)/S>c,|μ≤o) 因此只需P(V元(-)/S>c,μ≤o)=a则式(2.3)成立.所以c=tn-1(a)故检验问 题(2)的水平为α的检验的否定域是 D2={(X1,.,Xn):T=Vn(r-o)/S>tn-1(a)} (2.4) 类似方法可得检验问题(3)的水平为α的检验的否定域. D3={(X1,,Xn):√m(-o)/Sua/2 μ≤0 μ>0 Ulμ=40~N(0,1) U>ua 知 4≥40 μtn-1(a/2) 未 μ≤o μ>0 Tlμ=o~tn-1 T>tn-1(a) 知 4≥0 4<μ0 T<-tn-1(a) 8
duY²èα,å P(|T| > c | H0) = P √ n(X¯ − µ0)/S > c H0 = α, c = tn−1(α/2).œddƒ½ç D1 = (X1, . . . , Xn) : √ n(X¯ − µ0)/S > tn−1(α/2) (2.2) (½uèuØK(1)Y²èαu. ÈuØK(2), T = √ n(X¯ − µ0)/Säèu⁄O˛,œdÜ*˛ƒ½ç/™è {(X1, . . . , Xn) : T > c}, c ñ½. è¶u(20 )‰kY²α,, =ᶠP(T > c | H0 0 ) = P √ n(X¯ − µ0)/S > c µ ≤ µ0 ≤ α, (2.3) 5ø P √ n(X¯ − µ0)/S > c µ ≤ µ0 = P √ n(X¯ − µ)/S > c + √ n(µ0 − µ) S µ ≤ µ0 ≤ P √ n(X¯ − µ)/S > c, µ ≤ µ0 œdêIP √ n(X¯ − µ)/S > c, µ ≤ µ0 = αK™(2.3)§·. §±c = tn−1(α).uØ K(20 )Y²èαuƒ½ç¥ D∗ 2 = (X1, . . . , Xn) : T = √ n(X¯ − µ0)/S > tn−1(α) . (2.4) aqê{åuØK(3)Y²èαuƒ½ç. D3 = (X1, . . . , Xn) : √ n(X¯ − µ0)/S uα/2 Æ µ ≤ µ0 µ > µ0 U|µ = µ0 ∼ N(0, 1) U > uα µ ≥ µ0 µ tn−1(α/2) ô µ ≤ µ0 µ > µ0 T|µ = µ0 ∼ tn−1 T > tn−1(α) µ ≥ µ0 µ < µ0 T < −tn−1(α) 8
例5.2.1食品厂用自动装罐机装罐头食品,每罐标准重量为500克,每天开工需检查机器的 工作状况.今抽得10罐,测得其重量(单位:克) 495,510,505,498,503,492,502,512,497,506. 假定罐头重量X服从正态分布N(4,σ2),已知o=6.5,问机器是否工作正常?(取检验水平a= 0.05) 解检验问题为 H0:4=500←→H1:4≠500 本题中σ2已知.故否定域由表5.2.1中第一行给出.即 D={K1,,X):I@1>生} 其中n=10,a=0.05,查表得uo.o2s=1.96,由样本算得X=502,因此 1U1=1m(-o1=1602-001=0.973: (6)H:σ2≥←→H:σ2<: 其中σ子和检验水平a给定. 我们将重点讨论,均值未知时单个正态总体时方差的检验方法.当均值已知时如何处理,我 们将在后面给一个说明.首先考虑检验问题(4),即 H0:σ2=o6←→H1:σ2卡o 9
~5.2.1 †¨Ç^gƒC-ÅC-fi†¨,z-IO˛è500é,zUmÛIuÅÏ ÛäG¹. 8ƒ10-,ˇŸ˛(¸†:é) 495, 510, 505, 498, 503, 492, 502, 512, 497, 506. b½-fi˛X—l©ŸN(µ, σ2 ),Æσ = 6.5, ØÅÏ¥ƒÛä~?(uY²α = 0.05) ) uØKè H0 : µ = 500 ←→ H1 : µ 6= 500 K•σ 2Æ,ƒ½çdL5.2.1•1ò1â—,= D = n (X1, . . . , Xn) : | √ n(X¯−µ0) σ | > µ α 2 o Ÿ•n = 10, α = 0.05,Lu0.025 = 1.96,déX¯ = 502, œd |U| = | √ n(X¯−µ0) σ | = | √ 10(502−500) 6.5 | = 0.973 σ2 0 ; (6) H00 0 : σ 2 ≥ σ 2 0 ←→ H00 1 : σ 2 < σ2 0 ; Ÿ•σ 2 0⁄uY²αâ½. ·ÇÚ:?ÿ, ˛äôû¸áoNûêuê{. ˛äÆûX¤?n, · ÇÚ3°âòá`². ƒkƒuØK(4), = H0 : σ 2 = σ 2 0 ←→ H1 : σ 2 6= σ 2 0 9
由于均值μ未知,我们知道S2=品∑1(X,-)2是σ2的一个无偏估计,且具有良好 性质.直观上看S2/o太小或者S2/σ太大时,Ho不象成立.因此检验的否定域可取如下形式: {(X1,,Xn):S2/o行A2},A41,A2待定.在给定o2=o的条件下,由定 理2.2.3可知 (m-1)s21哈~X元-1 (2.6) 故取检验统计量为X2=(n-1)S2/o行.因此,否定域的等价形式可取为 D={(X1,.,Xn):(n-1)S2/o行c2} 记0=(4,σ2),为了确定c1,c2,令 a=P%(n-1)S2/o后c2Ho) 满足上式的c1,c2的对子有很多,存在一对c1,c2是最优的,但计算较复杂,且使用不方便.确 定cC1,c2的一个简单实用的方法是:令 Pe ((n-1)S2/a0C2Ho)=a/2 由上述两式和(2.6)易知临界值c1=X品-1(1-a/2),c2=X品-1(α/2).所以检验问题(4)的水平 为a的接受域为 D4={(X1,.,Xn):Xa-1(1-a/2)≤(n-1)S2/o≤X2-1(a/2)} 此接受域的表达式比否定域简单,使用上也方便,故此处采用接受域代替否定域。 用完全类似于(一)中求检验问题(2)、(3)的方法可分别求得检验问题(⑤)和(6)的水平为α的 否定域如下: D5={(X1,.,Xn):(n-1)S2/o后>Xa-1(a)}, D6={(X1,,Xn):(n-1)S2/o<Xa-1(1-a} 注5.2.2当均值μ已知时,方差σ2的检验方法简述如下:当μ已知时,o2的一个具有良好性 质的无偏估计是5保=员∑”1(X:-4)2.当σ2=时,由推论2.4.1可知 ns21o6-K:-21a6~x2 (2.7) 因此取检验统计量为X:=nS保/o行,用它代替x2=(m-1)S2/o行.采用完全类似于前面μ未知情形 的讨论方法,可得检验问题(4)-(6)的水平为α的否定域,仅注意在否定域中将确定临界值的X分 布的自由度由n-1改成n即可.详细结果见表5.2.2. 这种基于检验统计量服从一定自由度的X2分布的检验方法称为X检验 表5.2.2单个正态总体方差的假设检验 10
du˛äµô, ·ÇS 2 = 1 n−1 Pn i=1 (Xi − X¯) 2 ¥σ 2òáÆO, Ö‰k˚– 5ü. Ü*˛wS 2/σ2 0½ˆS 2/σ2 0åû,H0ÿñ§·. œduƒ½çåXe/™: {(X1, . . . , Xn) : S 2/σ2 0 A2}, A1, A2 ñ½. 3â½σ 2 = σ 2 0^áe, d½ n2.2.3å (n − 1)S 2 /σ2 0 ∼ χ 2 n−1 . (2.6) u⁄O˛èχ 2 = (n − 1)S 2/σ2 0 . œd, ƒ½çd/™åè D = (X1, . . . , Xn) : (n − 1)S 2 /σ2 0 c2 Pθ = (µ, σ2 ),è (½c1, c2,- α = Pθ (n − 1)S 2 /σ2 0 c2 H0 ˜v˛™c1, c2ÈfkÈı,3òÈc1, c2¥Å`,OéE,, Ö¶^ÿêB. ( ½c1, c2òá{¸¢^ê{¥:- Pθ (n − 1)S 2 /σ2 0 c2 H0 = α/2 d˛„¸™⁄(2.6)¥.äc1 = χ 2 n−1 (1 − α/2), c2 = χ 2 n−1 (α/2).§±uØK(4)Y² èα…çè D¯ 4 = (X1, . . . , Xn) : χ 2 n−1 (1 − α/2) ≤ (n − 1)S 2 /σ2 0 ≤ χ 2 n−1 (α/2) d…çLà™'ƒ½ç{¸,¶^˛èêB, d?Ê^…çìOƒ½ç. ^aqu(ò) •¶uØK(2)!(3)ê{å©O¶uØK(5)⁄(6)Y²èα ƒ½çXe: D5 = (X1, . . . , Xn) : (n − 1)S 2 /σ2 0 > χ2 n−1 (α) , D6 = (X1, . . . , Xn) : (n − 1)S 2 /σ2 0 < χ2 n−1 (1 − α) . 55.2.2 ˛äµÆû, êσ 2uê{{„Xe: µÆû,σ 2òá‰k˚–5 üÆO¥S 2 ∗ = 1 n Pn i=1 (Xi − µ) 2 .σ 2 = σ 2 0û,dÌÿ2.4.1 å nS2 ∗/σ2 0 = Xn i=1 (Xi − µ) 2 /σ2 0 ∼ χ 2 n . (2.7) œdu⁄O˛èχ 2 ∗ = nS2 ∗/σ2 0 ,^ßìOχ 2 = (n − 1)S 2/σ2 0 .Ê^aquc°µôú/ ?ÿê{, åuØK(4)-(6)Y²èჽç,=5ø3ƒ½ç•Ú(½.äχ 2© Ÿgd›dn − 1U§n=å. ç[(JÑL5.2.2. ˘´ƒuu⁄O˛—lò½gd›χ 2©Ÿuê{°èχ 2u. L5.2.2 ¸áoNêbu 10