Lec12:非参数统计方法 张伟平 May4,2011 §1一样本问题中的非参数假设检验 在上一章我们讨论了当总体分布族是正态情形,关于均值得一样本检验方法.但是,当 我们无把握认为总体分布族为正态模型时,则必须用其它方法来检验.下面介绍几种常用的 非参数方法,即符号检验法、符号秩和检验法和Fisher置换检验法。 一、符号检验法 例1为比较甲乙两种酒的优劣,找了N个人去品尝.同一个人品尝两种酒后,请他们分 别给两种酒评分.这里,每一个品酒人对甲、乙两种酒的评分结果构成一个对子,正好是一 个成对比较的模型. 以X,记第个品酒人对甲酒的评分,Y:记第个品酒人对乙酒的评分.记Z=X:-Y,i= 1,…,N如果假定Z~N(μ,σ2),则甲、乙两酒是否有优劣的问题将转化为原假设Ho:μ=0 的检验问题,这就是我们在$5.2讨论过的一样本t检验问题.可是在一些情况下,我们不见得 有根据去假定Z:服从正态分布.这时上述方法就失效了.下面是一个替代方法:每一个评就 人的评分给出一个符号 若Z>0 若Z:<0 (1.1) 若Z:=0 即品就人给以“+”号表示他认为“甲酒优于乙酒”,另两个符号的意义类推.如此,我们得 到n个符号S1,·,Sm原假设 Ho:甲乙两种酒一样好 (1.2) 的检验就建立在试验结果的这n个符号的基础上,故称为符号检验(Sig即Tst).下面将会看到: 从统计模型而言,符号检验不过是二项分布参数检验的一个特例.符号检验的具体方法如下: 记N个试验结果S1,·,Sn中“+”号的次数有n+次,出现“-”号的有n_次,其余为0, 记n=n++n-如果Ho成立,即甲乙两种酒一样好,则在n个非0结果中出现“+”或“-”的 机会相同.即每个非0试验结果中出现“+”号的概率p=1/2:若甲、乙两酒确有优劣之分,则 每个非0结果中出现“+”的概率p≠1/2.若记X=n+, 放在这个情况下,n4的分布服从b(n,1/2),若甲乙两种酒确有优劣之分,则每个结果出现 “+”号的概率p≠1/2.则所提问题转化为检验问题:X二项分布b(n,p),0≤p≤1,要检验 :p=专一:P千分 1 (1.3)
Lec12: öÎÍ⁄Oê{ ‹ï² May 4, 2011 §1 òØK•öÎÍbu 3˛òŸ·Ç?ÿ oN©Ÿx¥ú/, 'u˛äòtuê{. ¥, ·ÇÃrº@èoN©Ÿxè.û, K7L^Ÿßê{5u. e°0A´~^ öÎÍê{, =Œ“u{!Œ“ù⁄u{⁄FisheròÜu{" ò!Œ“u{ ~1 è'`ظ´À`, È Ná 0 − eZi < 0 0 eZi = 0 (1.1) =¨“<â±/+0“L´¶@è/`À`uØÀ0, ,¸áŒ“ø¬aÌ. Xd, ·Ç nጓS1, · · · , Sn.b H0 : `ظ´Àò– (1.2) u“Ô·3£(J˘nጓƒ:˛, °èŒ“u(Sign Test).e°Ú¨w: l⁄O. Û, Œ“uÿL¥ë©ŸÎÍuòáA~. Œ“u‰Nê{Xe: PNá£(JS1, · · · , Sn•/+0“gÍkn+g, —y/−0“kn−g, Ÿ{è0. Pn = n+ + n−.XJH0§·, =`ظ´Àò–, K3náö0(J•—y/+0½/−0 Ũɔ. =záö0£(J•—y/+0“V«p = 1/2;e`!ظÀ(k`É©, K záö0(J•—y/+0V«p 6= 1/2. ePX = n+, ò3˘áú¹e, n+©Ÿ—lb(n, 1/2),e`ظ´À(k`É©, Kzá(J—y /+0“V«p 6= 1/2. K§JØK=zèuØK: Xë©Ÿ b(n, p), 0 ≤ p ≤ 1,áu H0 : p = 1 2 ←→ H1 : p 6= 1 2 . (1.3) 1
一个合适的检验为 当|X-n/2>c时否定Ho 临界值c要根据给定的检验水平α,由二项分布来决定(见附表10).为使a为真实水平,必要时 用随机化检验.一个更确当的方法是计算检验的p值(见S5.3,四).在此,令由样本S1,·,S算 得的X=n+的具体值为xo,记x=min{xo,n-xo},则检验的p值为 -()”+三(份() (1.4) 若n为偶数,而xo=n/2,则取p值为p=1.p值越接近1,则H越可信.如给定检验水平a,则 当p<a时否定Ho. 在例1中,给定检验水平α,则检验问题(1.2)的否定域为 {X=n4≥c,或X≤d 其中c和d的值由下式确定: 2()份)s d=n-c. 在例1中,令N=13,S1,·,S13中+号和-号的个数分别是n4=2,n-=10,因此n= n++n_=12.取检验水平a=0.05,查附表10“符号检验临界值表”得c=10,故d=n-c=2.故 检验的否定域D={X=n+≥10,或X≤2}.检验统计量X=n+=2,因此否定原假设.即 认为甲、乙两酒不一样 对这一检验问题,也可通过计算检验的p值来解决.此处,n=12,x0=n+=2,按(1.4), %=min(2,12-2)=2,查二项分布表得 -())”+(留)( =0.0384<0.05 故在0.05显著性水平下应否定H0 例2 工厂的两个化验室,每天同时从工厂的冷却水总取样,测量水中的含氯量一次 下面是n=11天的记录: 2 345678910 11 1.151.860.761.821.141.651.921.011.120.901.40 h1.001.900.901.801.201.701.951.021.230.971.52 其中x:表示化验室A的测量记录,:表示化验室B的测量记录.问两个化验室测定的结果之间 有无显著差异?取a=0.10. 解分别记化验室A和B的测量误差为和7.设和,为连续型随机变量,其分布函数分别 为F(x)和G(x)检验问题是 Ho:F(x)=G(x)←→H1:F(x)≠G(x) (1.5) 3
òá‹·uè |X − n/2| > c ûƒ½ H0. .äcáä‚â½uY²α, dë©Ÿ5˚½(ÑNL10). è¶αè˝¢Y², 7áû ^ëÅzu. òáç(ê{¥Oéupä(ѧ5.3,o). 3d, -dS1, · · · , Sné X = n+‰Näèx0,Px 0 0 = min{x0, n − x0},Kupäè p = x 0 X0 i=0 n i 1 2 n + Xn i=n−x0 n i 1 2 n (1.4) enèÛÍ, x0 = n/2,Kpäèp = 1. päC1, KH0å&. Xâ½uY²α,K p < αûƒ½H0. 3~1•,â½uY²α,KuØK(1.2)ƒ½çè {X = n+ ≥ c, ½ X ≤ d}, Ÿ•c⁄däde™(½: Xn i=c n i 1 2 n ≤ α 2 , d = n − c. 3~1•,-N = 13, S1, · · · , S13•+“⁄−“áÍ©O¥n+ = 2, n− = 10,œdn = n+ + n− = 12.uY²α = 0.05,NL10/Œ“u.äL0c = 10,d = n−c = 2. uƒ½çD = {X = n+ ≥ 10, ½ X ≤ 2}.u⁄O˛X = n+ = 2, œdƒ½b. = @è`!ظÀÿò. È˘òuØK, èåœLOéupä5)˚. d?, n = 12, x0 = n+ = 2,U(1.4), x 0 0 = min(2, 12 − 2) = 2,ë©ŸL p = X 2 i=0 12 i 1 2 n + X 12 i=10 12 i 1 2 n = 0.0384 < 0.05 30.05wÕ5Y²eAƒ½H0. ~2 ÛǸázø, zU”ûlÛÇe%Yo, ˇ˛Y•¹Å˛òg. e°¥n = 11UP¹: i 1 2 3 4 5 6 7 8 9 10 11 xi 1.15 1.86 0.76 1.82 1.14 1.65 1.92 1.01 1.12 0.90 1.40 yi 1.00 1.90 0.90 1.80 1.20 1.70 1.95 1.02 1.23 0.97 1.52 Ÿ•xiL´zøAˇ˛P¹, yiL´zøBˇ˛P¹. ظázøˇ½(JÉm kÃwÕ…? α = 0.10. ) ©OPzøA⁄Bˇ˛ÿèξ⁄η.ξ⁄ηèÎY.ëÅC˛, Ÿ©ŸºÍ©O èF(x)⁄G(x).uØK¥ H0 : F(x) = G(x) ←→ H1 : F(x) 6= G(x). (1.5) 2
显然含氯量的测定值,除了与化验室的不同有关外,还与当日水中含氯量的多少有关.我 们可以认为X:和Y具有数据结构: X=+5,Y=4+i,i=1,2,…,n. 其中山,为第天水中的含氯量,:和n:分别表示第天化验室A、B的测量误差.显然51,·,m 和1,·,m都是不可观察的独立同分布的随机变量。前者与ξ~F(x)同分布,后者与)~ G(x)同分布 不同日的两个数据X:与Y显然不一定是同分布的,而且X:与X,以及Y与Y也不一定 是同分布的.它们之间的差异不但与测量误差有关,而且也与山:和4的差异有关.因此虽 然X1,…,Xn相互独立,但不能假定它们同分布,Y,·,Y也是如此.所以两样本的统计比 较方法,如两正态样本的检验方法以及后面要介绍的两样本非参数检验方法都不能用于这 类数据的检验工作.我们在S5.2中也提到过成对数据的上述特点. 处理成对数据检验问题,很自然地想到如何把:的影响消除掉.由于对每个i,X,与Y之间 可比,若将同一天的两个数据相减,从而把的影响消除掉.令 Z=Xi-Y=5-7i,i=1,2,…,n. (1.6) 显然Z仅与化验室A、B在第日的测量误差之差有关.记Z=-n,则Z1,·,Zn可看成来自 总体Z的随机样本,即Z1,·,Zm是独立同分布的样本.由于Z是两个测量误差之差,因此Z的 均值为0,且可证明它是关于原点对称的, 令n+为Z1,·,Zn中取正值的个数,n-为Z1,…,Zn中取负值的个数,它们都是r.v由于 假定了和n是连续型随机变量,故Z1,·,Zn中取值为0的个数以概率为1取0.因此可记n= n++n_当Ho,即(1.5)成立时,则在n个试验单元中Z,取“+”和取“-”的可能性皆为.因此 检验问题转化为:n+~b(n,p),0≤p≤1,检验 B:n-专一所:p≠对 否定域D={n+≥c或n+≤d. 因此,在给定显著性水平α之后,c和d的值由 三月”号 d=n-c 所确定 在本例中n=11,a=0.10,查二项分布表知 () 11 =0.0327, 0 () 11 =0.113, =0 所以d=2,c=11-2=9(也可查附表10得c=9,d=n-c=2).故水平a=0.10的符号检 验的否定域为 {n+≤2或n+≥9} 2
w,¹Å˛ˇ½ä, ÿ Üzøÿ”k' , ÑÜFY•¹Å˛ık'. · Çå±@èXi⁄Yi‰kÍ‚(: Xi = µi + ξi , Yi = µi + ηi , i = 1, 2, · · · , n. Ÿ•µiè1iUY•¹Å˛, ξi⁄ηi©OL´1iUzøA!Bˇ˛ÿ. w,ξ1, · · · , ξn ⁄η1, · · · , ηn —¥ÿå* ’·”©ŸëÅC˛. cˆÜξ ∼ F(x)”©Ÿ, ˆÜη ∼ G(x)”©Ÿ. ÿ”F¸áÍ‚XiÜYiw,ÿò½¥”©Ÿ, ÖXiÜXj , ±9YiÜYjèÿò½ ¥”©Ÿ. ßÇÉm…ÿܡ˛ÿk', Öèܵi⁄µj…k'. œdè ,X1, · · · , XnÉp’·, ÿUb½ßÇ”©Ÿ, Y1, · · · , Ynè¥Xd. §±¸⁄O' ê{, X¸tuê{±9°á0¸öÎÍuê{—ÿU^u˘ aÍ‚uÛä. ·Ç3§5.2•èJL§ÈÍ‚˛„A:. ?n§ÈÍ‚uØK, Èg,/éX¤rµiKèûÿK. duÈzái,XiÜYiÉm å', eÚ”òU¸áÍ‚É~, l rµiKèûÿK. - Zi = Xi − Yi = ξi − ηi , i = 1, 2, · · · , n. (1.6) w,Zi=ÜzøA!B31iFˇ˛ÿÉk'. PZ = ξ − η, KZ1, · · · , Znåw§5g oNZëÅ, =Z1, · · · , Zn ¥’·”©Ÿ. duZ¥¸áˇ˛ÿÉ, œdZ ˛äè0, Öåy²ß¥'u:È°. -n+èZ1, · · · , Zn•äáÍ, n−èZ1, · · · , Zn•KäáÍ, ßÇ—¥r.v..du b½ ξ⁄η¥ÎY.ëÅC˛, Z1, · · · , Zn•äè0áͱV«è10. œdåPn = n+ + n− .H0,=(1.5)§·û, K3n᣸•Zi/+0⁄/−0åU5è1 2 . œd uØK=zè: n+ ∼ b(n, p), 0 ≤ p ≤ 1,u H0 0 : p = 1 2 ←→ H0 1 : p 6= 1 2 ƒ½çD = {n+ ≥ c ½ n+ ≤ d}. œd, 3â½wÕ5Y²αÉ, c⁄däd Xn k=c n k 1 2 n ≤ α 2 , d = n − c §(½. 3~•n = 11, α = 0.10, ë©ŸL X 2 k=0 11 k 1 2 11 = 0.0327, X 3 k=0 11 k 1 2 11 = 0.113, §±d = 2, c = 11 − 2 = 9 (èåNL10c = 9, d = n − c = 2). Y²α = 0.10 Œ“u ƒ½çè {n+ ≤ 2 ½ n+ ≥ 9} 3
作差值=1-,得 0.15,-0.04,-0.14,0.02,-0.06,-0.05, -0.03,-0.01,-0.11,-0.07,-0.12 其中取正数的个数为m+=2,因此在水平a=0.10下否定Ho,即认为化验室A、B测定结果之 间有显著差异 符号检验的另一个重要应用是分位数(特别是中位数)检验.请看下例. 例3检验某种维尼纶的纤度,测得100个数据如下表所示试问该维尼纶纤度的中位 表1.1 编号 1 3 456 > 8 9 10 纤度 1.261.291.321.351.381.411.441.471.501.53 频数 14 722232510 6 1 数me是否为1.40?(a=0.05) 解本题在显著水平a=0.05下,检验假设 H0:me=1.40←→H1:me≠1.40 若令表中所列100个数据的纤度值为X,i=1,…,100,令Y=X-1.40,i=1,…,100.计 算Y取正值得个数n+和取负值的个数n-,取值为0的个数为0,因此n,+n_=l00.在Ho成立 的前提下,则每个Y为正或负的可能性皆为1/2,故100个数据中n+和n_-应差别不大,若记X= n+,易见X~b(100,1/2),因此检验问题转化为:X~b(100,p),0≤p≤1,要检验 1 1 0:p=2←→l:p≠2a=0.05 否定域为D={X≥c2或X≤.利用中心极限定理可知:当Ho成立,且n→∞时有 X-n2_2X-n乡N0,1) Vn/4 本题中n=100,令 含(9)4(9)-号=a 查表得(c1-50)/5=-1.96,解得c1=40.2 类似地由 三()r1-4e:9 =0.025 查表得(c2-50)/5=1.96,解得c2=59.8,故否定域为 {X:X≤40.2或X≥59.8} 由表1.1算得X=n+=43,它介于(40.2,59.8)之间,故不足以否定Ho,故认为该维尼纶的纤维 度的中位数是1.40. 符号检验与二项分布参数检验的关系: 4
ääzi = xi − yi , 0.15, −0.04, −0.14, 0.02, −0.06, −0.05, −0.03, −0.01, −0.11, −0.07, −0.12, Ÿ•ÍáÍèn+ = 2, œd3Y²α = 0.10eƒ½H0,=@èzøA!Bˇ½(JÉ mkwÕ…. Œ“u,òááA^¥©†Í(AO¥•†Í)u. ûwe~. ~3 u,´ëZ×n›, ˇ100áÍ‚XeL§´ £ØTëZ×n›•† L 1.1 ?“ 1 2 3 4 5 6 7 8 9 10 n› 1.26 1.29 1.32 1.35 1.38 1.41 1.44 1.47 1.50 1.53 ™Í 1 4 7 22 23 25 10 6 1 1 Íme¥ƒè1.40? (α = 0.05) ) K3wÕY²α = 0.05e, ub H0 : me = 1.40 ←→ H1 : me 6= 1.40 e-L•§100áÍ‚n›äèXi , i = 1, · · · , 100, -Yi = Xi − 1.40, i = 1, · · · , 100. O éYiäáÍn+⁄KäáÍn−, äè0áÍè0, œdn+ + n− = 100.3H0§· cJe, KzáYiè½KåU5è1/2, 100áÍ‚•n+⁄n−AOÿå, ePX = n+,¥ÑX ∼ b(100, 1/2),œduØK=zè: X ∼ b(100, p), 0 ≤ p ≤ 1,áu H0 : p = 1 2 ←→ H1 : p 6= 1 2 , α = 0.05 ƒ½çèD = {X ≥ c2 ½ X ≤ c1}. |^•%4Žnå: H0§·, Ön → ∞ûk X − n/2 p n/4 = 2X − n √ n L −→ N(0, 1) K•n = 100, - Xc1 i=0 100 i 1 2 100 ≈ Φ c1 − 50 5 = α 2 = 0.025, L(c1 − 50)/5 = −1.96, )c1 = 40.2 aq/d X 100 i=c2 100 i 1 2 n ≈ 1 − Φ c2 − 50 5 = 0.025 L(c2 − 50)/5 = 1.96,)c2 = 59.8,ƒ½çè {X : X ≤ 40.2 ½ X ≥ 59.8} dL1.1éX = n+ = 43,ß0u(40.2, 59.8)Ém, ÿv±ƒ½H0, @èTëZ×në ›•†Í¥1.40. Œ“uÜë©ŸÎÍu'X: 4
假设我们感兴趣一个实值连续型随机变量U,记其p0分位数为mg,即 po=P(U≤mg) 实际中我们往往不知道m的值,即便是指定p的值,这是由于我们不知道U的分布.对某个特 定的mo,记 p=P(U≤mo) 此时由于U的分布未知,故而p未知.由于U为连续型随机变量,故而 mg=m0当且仅当p=p0 mg≤m0当且仅当p≥p0 mg≥mo当且仅当p≤po 于是关于m的假设等价于关于p的假设.记U的一组样本为U1,·,Un,从而符号检验统 计量为 T-∑1(U≤mo) 显然T~B(,p).于是由二项分布的检验容易得到此时关于U的分位数的假设检验法则. 二、符号秩和检验 让我们再回顾一下符号检验,仍就例1中品酒的问题来说明.在计算Z=X:-Y后,我 们放弃Z:的具体数值而取其符号S:时,丢失了一些信息.这种信息的丢失,使符号检验的效率 有所降低.为此提出了符号秩和检验,它是符号检验的改进 例4仍看例1,设想请了13个人品尝甲、乙两种酒,评分结果如下: 表1.2 品酒人 12345678910111213 甲(x) 55324150.560483945484652.24544 乙()353743.1553450.34346.15147.35546.544 符号()+- 一一十 -0 此处=x:一.试问甲乙两种酒是否一样好?一共12个非0符号中,有两个“+”号,显示 多数品酒人认为乙酒好.在符号检验中我们就只能根据“+”、“-”号的数目去下结论.但细 看一下结果,我们发现,在认为“乙酒比甲酒优”的10人中,乙酒的得分比甲酒高得不多,而 在认为“甲酒优于乙酒”的2人中,甲的得分远远高于乙.这个事实给2:10这个表面结果,打 了一个折扣,它启示我们:除了考虑符号外,还应当把这一点考虑进来.符号秩的概念提供了 一种作法 定义6.2.1设X1,…,Xn为两两不相等的一组样本,将其大小排列为X)<…<X(m 若X=X(B),则称X,在样本(X1,…,Xn)中的秩为R. 显然,若X1,…,Xn为来自连续型分布F(x)的样本,则以概率为1保证X1,…,Xn中两两 互不相等 5
b·Ça,òá¢äÎY.ëÅC˛U, PŸp0©†Íèmq,= p0 = P(U ≤ mq) ¢S•·Ç ÿmqä, =B¥ç½p0ä,˘¥du·ÇÿU©Ÿ. È,áA ½m0, P p = P(U ≤ m0) dûduU©Ÿô, pô. duUèÎY.ëÅC˛, mq = m0 Ö= p = p0 mq ≤ m0 Ö= p ≥ p0 mq ≥ m0 Ö= p ≤ p0 u¥'umqbdu'upb. PUò|èU1, · · · , Un, l Œ“u⁄ O˛è T = XI(Ui ≤ m0) w,T ∼ B(n, p). u¥dë©ŸuN¥dû'uU©†Íbu{K. !Œ“ù⁄u 4·Ç2£òeŒ“u, E“~1•¨ÀØK5`². 3OéZi = Xi − Yi, · ÇòÔZi‰NÍä ŸŒ“Siû, øî ò &E. ˘´&Eøî, ¶Œ“u« k§¸$. èdJ— Œ“ù⁄u, ߥŒ“uU?. ~4 Ew~1, éû 13á<¨}`!ظ´À, µ©(JXe: L 1.2 ¨À< 1 2 3 4 5 6 7 8 9 10 11 12 13 ` (xi) 55 32 41 50.5 60 48 39 45 48 46 52.2 45 44 Ø (yi) 35 37 43.1 55 34 50.3 43 46.1 51 47.3 55 46.5 44 Œ“(zi) + − − − + − − − − − − − 0 d?zi = xi −yi .£Ø`ظ´À¥ƒò–? ò12áö0Œ“•, k¸á/+0“, w´ ıͨÀ<@èØÀ–. 3Œ“u•·Ç“êUä‚/+0!/−0“Í8e(ÿ. [ wòe(J, ·Çuy, 3@è/ØÀ'`À`010<•, ØÀ©'`Àpÿı, 3@è/`À`uØÀ02<•, `©puØ. ˘áØ¢â2 : 10˘áL°(J, ã òáÚû, ßÈ´·Ç: ÿ ƒŒ“ , ÑAr˘ò:ƒ?5. Œ“ùVgJ¯ ò´ä{. ½¬6.2.1 X1, · · · , Xn踸ÿÉò|, ÚŸå¸èX(1) < · · · < X(n) , eXi = X(Ri) , K°Xi3(X1, · · · , Xn)•ùèRi . w,, eX1, · · · , Xnè5gÎY.©ŸF(x), K±V«è1yX1, · · · , Xn •¸¸ pÿÉ. 5
定义6.22设X1,·,Xm为来自单个连续型总体的样本,或来自多个连续型总体的合 样本.则R=(R1,R2,·,Rn)称为(X1,…,Xn)的秩统计量,其中R为X的秩.由R导出的统 计量也称为秩统计量.基于秩统计量的检验方法称为秩检验 现在仍回到例4,把表1.2扩充成下表.我们把符号为“+”的那两个秩(即11和12)括起 表1.3 品酒人() 甲(a) 乙() 符号(z)IZ=z- 秩 1 55 35 20 [11 2 32 37 $ 10 3 41 43.1 2.1 4 4 50.5 55 4.5 9 5 60 34 26 [12 6 48 50.3 2.3 6 7 39 43 4 8 45 46.1 1.1 9 48 51 3 7 10 46 47.3 1.3 2 11 52.2 55 2.8 6 12 45 46.5 1.5 3 13 44 44 0 0 不定秩 来,它们的和是W+=11+12=23,叫做“符号秩和”.一般它可以用下列方式来定义: 记Z=X:-Y,令 若Z>0: 其它 R,为Z在(Z1,·,|Zn)中的秩,则Wilcoxon符号秩和(the sum of Wilcoxon signed rank)检 验统计量定义为 W+=∑R (1.7) =1 容易理解:在例6.2.5中,若甲优于乙,则不仅“+”号会多,且“+”号观察相应的秩,一般 也偏大,故总的效果是W+应偏大.反之,若乙优于甲,则W+将偏小.因此检验问题(1.2),即 H:甲、乙两酒一样好 成立时,W+应当不大不小.检验的否定域是 {W+≤d或W+≥c}, (1.8) 此处d和c取决于n(本例中n=12),及指定的检验水平a.即,当给定a时,c,d分别由下列两式 决定: P(W+≤dlHo)≤a/2,P(W+≥clHo)≤a/2. Ho为真时W+的分布见参考文献[4P246.对某些特定的a及不大的n,c和d可以查表求得,见 书末附表11.表中仅可查到c,而d=n(n+1)/2-c. 6
½¬6.2.2 X1, · · · , Xnè5g¸áÎY.oN, ½5gıáÎY.oN‹ . KR = (R1, R2, · · · , Rn)°è(X1, · · · , Xn)ù⁄O˛, Ÿ•RièXiù. dR—⁄ O˛è°èù⁄O˛. ƒuù⁄O˛uê{°èùu. y3E£~4, rL1.2*ø§eL. ·ÇrŒ“è/+0@¸áù(=11⁄12) ) L 1.3 ¨À 0; 0 Ÿß. Riè|Zi |3(|Z1|, · · · , |Zn|)•ù, KWilcoxon Œ“ù⁄ (the sum of Wilcoxon signed rank)u ⁄O˛½¬è W+ = Xn i=1 ViRi . (1.7) N¥n): 3~6.2.5•, e``uØ, Kÿ=/+0“¨ı, Ö/+0“* ÉAù, òÑ è†å, oJ¥W+A†å. áÉ, eØ`u`, KW+Ú†. œduØK(1.2), = H0 : `!ظÀò– §·û, W+Aÿåÿ. uƒ½ç¥ {W+ ≤ d ½ W+ ≥ c}, (1.8) d?d⁄c˚un (~•n = 12), 9ç½uY²α. =, â½αû, c, d©Ode¸™ ˚½: P(W+ ≤ d |H0) ≤ α/2, P(W+ ≥ c |H0) ≤ α/2. H0è˝ûW+©ŸÑΩz[4] P246. È, A½α9ÿån, c⁄då±L¶, Ñ ÷"NL11. L•=åc, d = n(n + 1)/2 − c. 6
由表1.3可知本题中n=12,W+=23.取a=0.05,查表中a/2那一栏,在n=12处得c=65, 算得d=13,按(1.8)得否定域为 {W+≤13或W+≥65}. 而13<W+=23<65,故应接受Ho,即所得观察结果不构成甲、乙有优劣之分的充分证据. 这个检验称为Vilcoxo双侧符号秩和检验(以下简称双侧W+检验),之所以取a/2,也是 由于这个“双侧”而来 可以证明: E(w+)=nn+) 4 D(w+)=24nn+12m+) 与下节的秩和统计量W类似,当n→o∞时,W+的标准化随机变量 W生= W+-n(n+1)/4 乡N0,1) (1.9) vVn(n+1)2n+1)/24 故例6.2.5的水平近似为a的双侧W+检验的否定域为 {IW*1≥ua/2} 取a=0.05,算得1W1=1.26<1.96=42s,故接受H0,根据现有观察值不足以否定H- 我们可以看到例1和例6.2.5中的同一个检验问题用符号检验和符号秩和检验得到两种不 同的结论.按符号检验否定Ho,即认为甲、乙两酒有优劣之分,且乙优于甲.按符号秩和检验 的小样本和大样本方法,都接受H,即表明无充分证据否定“甲、乙两酒一样好”.这里我们 看到:同一个问题,同一批数据,用不同方法,检验结果不同,这不足为怪.正如用同一批数 据去估计正态总体的数学期望值,用样本均值估计与用中位数估计,两者结果不同.这就产 生了一个问题:这两种检验法哪一种好?这个问题不能一概而论,有兴趣的读者可查看参考 文献9]P16中表9.1所列的结果.可以指出的是:符号检验全然不看数值而只看符号:基于正 态假定的检验则要看数值.W+检验介于二者之间:它既不忽视数值.也不全看数值(数值只 用于决定秩,而不用其本身值)· 三、Fisher的置换检验 例5为比较A、B两种施肥方法何种为优,选择15块一样大的地,把每块分成形状大小 一样的两小块,随机地将其中的一块分给A,另一小块给B.收获时得到各小块的产量如下: 块号 1 2 3 45 678 A 188 96168176153172177163 B 139163160160147149149 122 A-B 49 -67 8166 23 28 双 块号 9 1011 12131415 A 146173 18616817718496 B 132144130144102124144 A-B 1429 562475 60-48 算出∑(A-B)=314,现在要检验假设 Ho:A、B的效果一样. (1.10)
dL1.3åK•n = 12, W+ = 23.α = 0.05,L•α/2@ò9, 3n = 12?c = 65, éd = 13,U(1.8)ƒ½çè {W+ ≤ 13 ½ W+ ≥ 65}. 13 < W+ = 23 < 65,A…H0, =§* (Jÿ§`!Øk`É©ø©y‚. ˘áu°èWilcoxonV˝Œ“ù⁄u (±e{°V˝W+u) , ɧ±α/2, è¥ du˘á/V˝0 5. å±y²: E(W+) = n(n + 1) 4 , D(W+) = 1 24 n(n + 1)(2n + 1) Üe!ù⁄⁄O˛Waq, n → ∞û, W+IOzëÅC˛ W+ ∗ = W+ − n(n + 1)/4 p n(n + 1)(2n + 1)/24 L −→ N(0, 1) (1.9) ~6.2.5Y²CqèαV˝W+uƒ½çè |W+ ∗ | ≥ uα/2 α = 0.05,é|W+ ∗ | = 1.26 < 1.96 = u0.025 ,…H0, ä‚yk* äÿv±ƒ½H0. ·Çå±w~1⁄~6.2.5•”òáuØK^Œ“u⁄Œ“ù⁄u¸´ÿ ”(ÿ. UŒ“uƒ½H0,=@è`!ظÀk`É©, ÖØ`u`. UŒ“ù⁄u ⁄åê{, —…H0, =L²Ãø©y‚ƒ½/`!ظÀò–0. ˘p·Ç w: ”òáØK, ”ò1Í‚, ^ÿ”ê{, u(Jÿ”, ˘ÿvè%. X^”ò1Í ‚OoNÍÆœ"ä, ^˛äOÜ^•†ÍO, ¸ˆ(Jÿ”. ˘“ ) òáØK: ˘¸´u{=ò´–? ˘áØKÿUòV ÿ, k,÷ˆåwÎ ©z[9] P156•L9.1§(J. å±ç—¥: Œ“u,ÿwÍä êwŒ“; ƒu b½tuKáwÍä, W+u0uˆÉm: ßQÿ¿Íä, èÿwÍä(Íäê ^u˚½ù, ÿ^Ÿä) . n!FisheròÜu∗ ~5 è'A!B¸´ñùê{¤´è`, ¿J15¨òå/, rz¨©§/Gå ò¸¨, ëÅ/ÚŸ•ò¨©âA,,ò¨âB. ¬ºûà¨˛Xe: ¨“ 1 2 3 4 5 6 7 8 A 188 96 168 176 153 172 177 163 B 139 163 160 160 147 149 149 122 A − B 49 -67 8 16 6 23 28 41 ¨“ 9 10 11 12 13 14 15 A 146 173 186 168 177 184 96 B 132 144 130 144 102 124 144 A − B 14 29 56 24 75 60 -48 é— P(A − B) = 314,y3áub H0 : A!B Jò. (1.10) 7
若(1.10)成立,每块内A-B值(即49,-67,.等)不一样,并非由于A、B效果不同,而是由 于其两小块的差别.但随机化的结果,每一小块有同等可能分给A或B.因此,如在第一块,依 随机化的结果不同,A-B可以是49,也可以是-49,要看较好的那块派给A还是B.这样一来, 这个试验的全部可能的∑(A-B)值有215个: ±(49),±(-67),土(8),·,±(60),±(-48) 实际得出的∑(A-B)=314是215中的一个.当A、B效果有较大差别时1∑(A-B)川应取大值 对215个可能结果中的每一个算出∑(A-B),用x记之,i=1,2,·,25.将它们按照它们的绝 对值从大到小的顺序排列,不妨记为 E1;工2,··;T215 (1.11) 即满足 z1>z2l>…>lz2sl (1.11)中的215个值中,在Ho成立前提下,为等可能发生,即每个出现的概率都是1/2.检 验问题(1.10)的否定域为 {I∑(A-BI>c 观测到得∑(A-B)川=314,从而检验的P值为 P0∑(A-B>314)=0 其中m为排序(1.11)中满足xm=314. 具体计算可知p314<0.0001因此有理由否定Ho 置换检验的缺点是:在具体实施时计算量大,使用起来不方便.但现在有了高速计算机, 利用计算机来实施也不算难事了 Fisher自己和其它许多学者,都研究过这样的问题:当n很大时,可否找到一种近似的方 法去实施置换检验,以大大简化计算?研究结果证明了:在很一般的条件下,这种简化的方法 不仅存在,且就是通常的检验!这是一个很有意思的结果.因为一开始,检验是局限在正态 模型中导出的.通过这个途径发现,即使在更为广泛的模型下,只要试验次数足够大,t检验 仍是适用的,因此可以说,置换检验的理论从一个侧面加强了t检验的地位. §2两样本问题中的非参数假设检验 在两样本的比较问题中,当样本的随机误差不服从正态分布时,就需要提出更一般得 假设,并使用相应的非参数检验方法.这方面的理论和方法较多,但大都很专门,这里只 对Vilcoxon秩和检验和置换检验作一简略介绍. 一、引言及定义 我们首先来看一看这一检验的实际背景.两样本检验问题的一般提法如下:设X1,·,Xm 和Y,·,Y分别是从具有分布为F和F的一维总体中抽取的简单样本,且假定合样本X1,·,Xm, Y,·,Yn全体相互独立.要检验下列假设 H0:F=F2←→H1:F≠F (2.1)
e(1.10)§·, z¨SA − Bä(=49, −67, · · ·)ÿò, øöduA!BJÿ”, ¥d uŸ¸¨O. ëÅz(J, zò¨k”åU©âA½B. œd, X31ò¨, ù ëÅz(Jÿ”, A − Bå±¥49, èå±¥−49,áw–@¨âAÑ¥B. ˘ò5, ˘á£‹åU P(A − B)äk2 15á: ±(49), ±(−67), ±(8), · · · , ±(60), ±(−48), ¢S— P(A − B) = 314¥2 15•òá. A!BJkåOû| P(A − B)|Aåä. È2 15áåU(J•zòáé— P(A − B),^xiPÉ, i = 1, 2, · · · , 2 15 . ÚßÇUÏßÇ˝ Èälå^S¸, ÿîPè x1, x2, · · · , x2 15 (1.11) =˜v |x1| > |x2| > · · · > |x2 15 | (1.11)•2 15áä•, 3H0§·cJe, èåUu), =zá—yV«—¥1/2 15 .u ØK(1.10)ƒ½çè {|X(A − B)| > c} *ˇ| P(A − B)| = 314, l uPäè P(| X(A − B)| > 314|H0) = m 2 15 Ÿ•mè¸S(1.11)•˜vxm = 314. ‰NOéåp314 < 0.0001 œdkndƒ½H0. òÜu":¥: 3‰N¢ñûOé˛å, ¶^Â5ÿêB. y3k pÑOéÅ, |^OéÅ5¢ñèÿéJØ . FishergC⁄ŸßNıƈ, —ÔƒL˘ØK: nÈåû, åƒÈò´Cqê {¢ñòÜu, ±åå{zOé? Ôƒ(Jy² : 3ÈòÑ^áe, ˘´{zê{ ÿ=3, Ö“¥œ~tuú˘¥òáÈkøg(J. œèòm©, tu¥¤Å3 .•—. œL˘áªuy, =¶3çè2ç.e, êá£gÍv å, tu E¥·^, œdå±`, òÜunÿlòá˝°\r tu/†. §2 ¸ØK•öÎÍbu 3¸'ØK•, ëÅÿÿ—l©Ÿû, “IáJ—çòÑ b, ø¶^ÉAöÎÍuê{. ˘ê°nÿ⁄ê{ı, å—È;Ä, ˘pê ÈWilcoxonù⁄u⁄òÜuäò{—0. ò!⁄Û9½¬ ·Çƒk5wòw˘òu¢Sµ. ¸uØKòÑJ{Xe: X1, · · · , Xm ⁄Y1, · · · , Yn©O¥l‰k©ŸèF1⁄F2òëoN•ƒ{¸, Öb½‹X1, · · · , Xm, Y1, · · · , YnNÉp’·. áueb H0 : F1 = F2 ←→ H1 : F1 6= F2. (2.1) 8
在数理统计学中,习惯上称这个检验问题为“两样本问题”.我们来分别考虑下列几种请况: 1.设根据问题的实际背景,如果我们有理由假定F和F2为具有相同方差的正态分布,即 假定 F1~N(a,o2),F2~N(6,02) 其中a、b和σ2皆未知,-00,这时检验问题转化为 H0:a=b←→H1:a≠b. (2.2) 在这个假定下,总体分布F1和F2只依赖于三个未知参数a、b和σ2,检验问题(2.1)归结为检验 这些未知参数是否满足(2.2).按$5.1所述这属于“参数型假设检验问题”.这就是$5.2中讨论 的两样本t检验. 2.如果我们对问题的实际背景所知甚少,我们只好认为对F和F2完全未知.在这样宽 广的假定下,我们再不能使用通常的两样本检验.处理这个问题的一种方法是“斯米尔洛 夫”(Smirnov)检验,这将在本章第五节中讨论. 在这一情形下,总体分布F和F2不能用有限个实参数去刻画,因此称为非参数检验问题. 3.现在我们讨论一种中间情况.设X是一种产品在一定生产工艺下的质量指标,而Y是 该产品在另一生产工艺下的质量指标.有理由认为,改变生产工艺不影响产品质量指标的概 率分布,而只能使此分布发生一些平移.也就是说,若以F记X的分布,则Y分布为F(红-), 这里是一个未知的位置参数.在这个假定下,“X、Y同分布”的假设相当“0=0”,而对立 假设为“0≠0”.因此检验(2.1)归结为检验 H0:8=0←→H1:0≠0. (2.3) (2.3)是一个很重要的假设检验问题.在这一模型中,我们假定F未知,因而比正态模型为广。 另外这一模型又比“斯米尔洛夫检验”中的模型窄一些,因为对后者而言,两分布F和F毫 无关系,而在此F和F之间有F(x)=(x-) 虽然表面上看(2.3)象一个参数检验问题:假设中只涉及0,而它是一个实参数.其实不然 因为总体的分布与F和都有关,而℉的分布未知,因此按非参数统计问题的定义,(23)应视为 非参数检验问题」 一般地,两样本问题(2.1)还有一些具有实际背景的中间情况.例如F2(x)=乃(z/o), 此。>0为未知的刻度参数,分布F也未知.检验问题(21)在此情况下转化为 H0:o=1←→H1:o≠1. (2.4) Vilcoxon两样本秩和检验就是考虑(2.3)的假设检验问题.下面首先给出Vilcoxon两样本 秩和统计量的定义 定义6.3.1设X1,…,Xm,Y1,…,Yn这n+m个值两两不相同,把它们按大小排列,结 果为 Z<Z2<…<ZN,N=m+n, (2.5) 显然,每个Y必为(2.5)中的某一个.若Y=Zr,则Y在合样本X1,…,Xm Yi,·,Yn中的秩为R.而Y,…,Yn的秩和为 W=R1+…+Rn, (2.6) 它称为Wilcoroni两样本秩和统计量.这是Wilcoxon在1945年的一项工作中引进的, 9
3Ín⁄OÆ•, S.˛°˘áuØKè/¸ØK0. ·Ç5©OƒeA´û¹: 1. ä‚ØK¢Sµ, XJ·Çkndb½F1⁄F2è‰kɔ꩟, = b½ F1 ∼ N(a, σ2 ), F2 ∼ N(b, σ2 ) Ÿ•a!b⁄σ 2ô, −∞ 0,˘ûuØK=zè H0 0 : a = b ←→ H0 1 : a 6= b. (2.2) 3˘áb½e, oN©ŸF1⁄F2êù6unáôÎÍa!b⁄σ 2 , uØK(2.1)8(èu ˘ ôÎÍ¥ƒ˜v(2.2). U§5.1§„˘·u/ÎÍ.buØK0. ˘“¥§5.2•?ÿ ¸tu. 2. XJ·ÇÈØK¢Sµ§$, ·Çê–@èÈF1⁄F2ô. 3˘° 2b½e, ·Ç2ÿU¶^œ~¸tu. ?n˘áØKò´ê{¥/dí‚ Å0(Smirnov)u, ˘Ú3Ÿ1 !•?ÿ. 3˘òú/e, oN©ŸF1⁄F2ÿU^kÅá¢ÎÍèx, œd°èöÎÍuØK. 3. y3·Ç?ÿò´•mú¹. X¥ò´¨3ò½)Û²eü˛çI, Y¥ T¨3,ò)Û²eü˛çI. knd@è, UC)Û²ÿKè¨ü˛çIV «©Ÿ, êU¶d©Ÿu)ò ²£. è“¥`, e±FPX©Ÿ, KY ©ŸèF(x − θ), ˘pθ¥òáô†òÎÍ. 3˘áb½e,/X!Y ”©Ÿ0bÉ/θ = 00, È· bè/θ 6= 00. œdu(2.1)8(èu H0 : θ = 0 ←→ H1 : θ 6= 0. (2.3) (2.3)¥òáÈábuØK. 3˘ò.•, ·Çb½Fô, œ '.è2. , ˘ò.q'/dí‚Åu0•.ƒò , œèȈ Û, ¸©ŸF1⁄F2Œ Ã'X, 3dF1⁄F2ÉmkF2(x) = F1(x − θ). è,L°˛w(2.3)ñòáÎÍuØK: b•ê9θ, ߥòá¢ÎÍ. Ÿ¢ÿ,, œèoN©ŸÜF⁄θ—k', F©Ÿô, œdUöÎÍ⁄OØK½¬, (2.3)A¿è öÎÍuØK. òÑ/, ¸ØK(2.1)Ñkò ‰k¢Sµ•mú¹. ~XF2(x) = F1(x/σ), dσ > 0èôè›ÎÍ, ©ŸFèô. uØK(2.1)3dú¹e=zè H∗ 0 : σ = 1 ←→ H∗ 1 : σ 6= 1. (2.4) Wilcoxon¸ù⁄u“¥ƒ(2.3)buØK. e°ƒkâ—Wilcoxon ¸ ù⁄⁄O˛½¬. ½¬6.3.1 X1, · · · , Xm, Y1, · · · , Yn˘n + má丸ÿÉ”, rßÇUå¸, ( Jè Z1 < Z2 < · · · < ZN , N = m + n, (2.5) w,, záYi7è(2.5)•,òá. eYi = ZRi ,KYi3‹X1, · · · , Xm, Y1, · · · , Yn•ùèRi . Y1, · · · , Ynù⁄è W = R1 + · · · + Rn, (2.6) ß°èWilcoxon¸ù⁄⁄O˛. ˘¥Wilcoxon31945còëÛä•⁄?. 9
二、Wilcoxon两样本秩和检验一小样本方法 Wilcoxoni两样本秩和检验就是考虑(2.3)的假设检验问题,即设X1,·,Xmii.d.~F(z),Yi,·,Yn ii.d.~F(z-),且合样本独立.要检验(2.3),即 H0:8=0←→H1:8≠0. 设样本Y1,·,Yn的秩和W由(2.6)给出.现在这样推理:每个R都可取1,2,…,N之一为值。 若原假设H0成立,则全部样本来自同一总体,每个都不占特殊位置,不会取较小或较大的值, W所取之值应集中在平均数n(N+1)/2附近.故得到下列检验: 当W≤d或W≥c否定Ho (2.7) 如何确定c和d?它们的确在原则上可以解决:当Ho成立时,合样本独立同分布,由此根据对 称性的考虑,易知(R1,·,R)的联合分布为 1 N(N-1).(N-n+1 当r1,…,Tn≤N为 P(R1=Tn1,·,Rn=Tn) 互不相同的自然数, 0 其它 由此不难形式地写出W的分布.从而由 a=P(W≤d或W≥c|Ho) 定出c和d.对较小的m、n己制成表. 如果假设检验是单边的,即要检验 H0:0≤0←→H1:0>0, (2.8) 由于W=左R,是y,…,y在合样本中的秩和,若0>0则因每个y,的分布与X+9的分布相 i✉1 同,Y与X:相比较倾向于取更大的值.即Y取值大于X:的“机会”更多,而小于它的机会则少 这样一来R1,…,R当9>0时倾向于取集合{1,2,·,N}中较大的值(此处N=m+n),同 样00时倾向于取较大 的值,在00 W≥c 0≥00<0 w≤d 10
! Wilcoxon¸ù⁄u—ê{ Wilcoxon¸ù⁄u“¥ƒ(2.3)buØK, =X1, · · · , Xm i.i.d. ∼ F(x), Y1, · · · , Yn i.i.d. ∼ F(x − θ),Ö‹’·. áu(2.3), = H0 : θ = 0 ←→ H1 : θ 6= 0. Y1, · · · , Ynù⁄Wd(2.6)â—. y3˘Ìn: záRi—å1, 2, · · · , NÉòèä. ebH0§·, K‹5g”òoN, zá—ÿ”Aœ†ò, ÿ¨½åä, W§ÉäA8•3²˛Ín(N + 1)/2NC. eu: W ≤ d ½ W ≥ c ƒ½ H0 (2.7) X¤(½c⁄d ? ßÇ(3K˛å±)˚: H0§·û, ‹’·”©Ÿ, ddä‚È °5ƒ, ¥(R1, · · · , Rn)È‹©Ÿè P(R1 = r1, · · · , Rn = rn) = 1 N(N−1)···(N−n+1) r1, · · · , rn ≤ Nè pÿÉ”g,Í, 0 Ÿß. ddÿJ/™/—W©Ÿ. l d α = P(W ≤ d ½ W ≥ c |H0) ½—c⁄d. Èm!nÆõ§L. XJbu¥¸>, =áu H 0 0 : θ ≤ 0 ←→ H 0 1 : θ > 0, (2.8) duW = Pn i=1 Ri¥Y1, · · · , Yn3‹•ù⁄. eθ > 0KœzáYi©ŸÜXi + θ©ŸÉ ”, YiÜXiÉ'ñïuçåä. =YiäåuXi/Ũ0çı, ußŨK. ˘ò5R1, · · · , Rnθ > 0ûñïu8‹{1, 2, · · · , N} •åä(d?N = m + n), ” θ 0ûñïuå ä, 3θ 0 W ≥ c θ ≥ 0 θ < 0 W ≤ d 10