中国科学技术大学：《数理统计》课程教学资源（课件讲义）第十二讲非参数检验（一）.pdf_大学文库

Lec12:非参数统计方法张伟平 May4,2011 §1一样本问题中的非参数假设检验在上一章我们讨论了当总体分布族是正态情形，关于均值得一样本检验方法.但是，当我们无把握认为总体分布族为正态模型时，则必须用其它方法来检验.下面介绍几种常用的非参数方法，即符号检验法、符号秩和检验法和Fisher置换检验法。一、符号检验法例1为比较甲乙两种酒的优劣，找了N个人去品尝.同一个人品尝两种酒后，请他们分别给两种酒评分.这里，每一个品酒人对甲、乙两种酒的评分结果构成一个对子，正好是一个成对比较的模型. 以X,记第个品酒人对甲酒的评分，Y:记第个品酒人对乙酒的评分.记Z=X:-Y,i= 1,…,N如果假定Z~N(μ，σ2)，则甲、乙两酒是否有优劣的问题将转化为原假设Ho：μ=0 的检验问题，这就是我们在$5.2讨论过的一样本t检验问题.可是在一些情况下，我们不见得有根据去假定Z:服从正态分布.这时上述方法就失效了.下面是一个替代方法：每一个评就人的评分给出一个符号若Z>0 若Z:<0 (1.1) 若Z:=0 即品就人给以“+”号表示他认为“甲酒优于乙酒”，另两个符号的意义类推.如此，我们得到n个符号S1,·,Sm原假设 Ho：甲乙两种酒一样好 (1.2) 的检验就建立在试验结果的这n个符号的基础上，故称为符号检验(Sig即Tst).下面将会看到：从统计模型而言，符号检验不过是二项分布参数检验的一个特例.符号检验的具体方法如下：记N个试验结果S1,·,Sn中“+”号的次数有n+次，出现“-”号的有n_次，其余为0，记n=n++n-如果Ho成立，即甲乙两种酒一样好，则在n个非0结果中出现“+”或“-”的机会相同.即每个非0试验结果中出现“+”号的概率p=1/2:若甲、乙两酒确有优劣之分，则每个非0结果中出现“+”的概率p≠1/2.若记X=n+, 放在这个情况下，n4的分布服从b(n,1/2),若甲乙两种酒确有优劣之分，则每个结果出现 “+”号的概率p≠1/2.则所提问题转化为检验问题：X二项分布b(n,p),0≤p≤1，要检验 :p=专一：P千分 1 (1.3)

显然含氯量的测定值，除了与化验室的不同有关外，还与当日水中含氯量的多少有关.我们可以认为X:和Y具有数据结构： X=+5,Y=4+i,i=1,2,…,n. 其中山，为第天水中的含氯量，：和n:分别表示第天化验室A、B的测量误差.显然51，·，m 和1，·，m都是不可观察的独立同分布的随机变量。前者与ξ~F(x)同分布，后者与)~ G(x)同分布不同日的两个数据X:与Y显然不一定是同分布的，而且X:与X,以及Y与Y也不一定是同分布的.它们之间的差异不但与测量误差有关，而且也与山：和4的差异有关.因此虽然X1,…,Xn相互独立，但不能假定它们同分布，Y,·,Y也是如此.所以两样本的统计比较方法，如两正态样本的检验方法以及后面要介绍的两样本非参数检验方法都不能用于这类数据的检验工作.我们在S5.2中也提到过成对数据的上述特点. 处理成对数据检验问题，很自然地想到如何把：的影响消除掉.由于对每个i,X,与Y之间可比，若将同一天的两个数据相减，从而把的影响消除掉.令 Z=Xi-Y=5-7i,i=1,2,…,n. (1.6) 显然Z仅与化验室A、B在第日的测量误差之差有关.记Z=-n,则Z1,·,Zn可看成来自总体Z的随机样本，即Z1,·,Zm是独立同分布的样本.由于Z是两个测量误差之差，因此Z的均值为0，且可证明它是关于原点对称的，令n+为Z1,·,Zn中取正值的个数，n-为Z1,…,Zn中取负值的个数，它们都是r.v由于假定了和n是连续型随机变量，故Z1,·,Zn中取值为0的个数以概率为1取0.因此可记n= n++n_当Ho,即(1.5)成立时，则在n个试验单元中Z,取“+”和取“-”的可能性皆为.因此检验问题转化为：n+~b(n,p),0≤p≤1，检验 B:n-专一所：p≠对否定域D={n+≥c或n+≤d. 因此，在给定显著性水平α之后，c和d的值由三月”号 d=n-c 所确定在本例中n=11,a=0.10,查二项分布表知 () 11 =0.0327, 0 () 11 =0.113, =0 所以d=2,c=11-2=9(也可查附表10得c=9,d=n-c=2).故水平a=0.10的符号检验的否定域为 {n+≤2或n+≥9} 2

假设我们感兴趣一个实值连续型随机变量U,记其p0分位数为mg,即 po=P(U≤mg) 实际中我们往往不知道m的值，即便是指定p的值，这是由于我们不知道U的分布.对某个特定的mo,记 p=P(U≤mo) 此时由于U的分布未知，故而p未知.由于U为连续型随机变量，故而 mg=m0当且仅当p=p0 mg≤m0当且仅当p≥p0 mg≥mo当且仅当p≤po 于是关于m的假设等价于关于p的假设.记U的一组样本为U1,·,Un,从而符号检验统计量为 T-∑1(U≤mo) 显然T~B(,p).于是由二项分布的检验容易得到此时关于U的分位数的假设检验法则. 二、符号秩和检验让我们再回顾一下符号检验，仍就例1中品酒的问题来说明.在计算Z=X:-Y后，我们放弃Z:的具体数值而取其符号S:时，丢失了一些信息.这种信息的丢失，使符号检验的效率有所降低.为此提出了符号秩和检验，它是符号检验的改进例4仍看例1，设想请了13个人品尝甲、乙两种酒，评分结果如下：表1.2 品酒人 12345678910111213 甲(x) 55324150.560483945484652.24544 乙()353743.1553450.34346.15147.35546.544 符号()+- 一一十 -0 此处=x:一.试问甲乙两种酒是否一样好？一共12个非0符号中，有两个“+”号，显示多数品酒人认为乙酒好.在符号检验中我们就只能根据“+”、“-”号的数目去下结论.但细看一下结果，我们发现，在认为“乙酒比甲酒优”的10人中，乙酒的得分比甲酒高得不多，而在认为“甲酒优于乙酒”的2人中，甲的得分远远高于乙.这个事实给2：10这个表面结果，打了一个折扣，它启示我们：除了考虑符号外，还应当把这一点考虑进来.符号秩的概念提供了一种作法定义6.2.1设X1,…,Xn为两两不相等的一组样本，将其大小排列为X)<…<X(m 若X=X(B),则称X,在样本(X1,…,Xn)中的秩为R. 显然，若X1,…,Xn为来自连续型分布F(x)的样本，则以概率为1保证X1,…,Xn中两两互不相等 5

由表1.3可知本题中n=12,W+=23.取a=0.05,查表中a/2那一栏，在n=12处得c=65, 算得d=13,按(1.8)得否定域为 {W+≤13或W+≥65}. 而13<W+=23<65,故应接受Ho,即所得观察结果不构成甲、乙有优劣之分的充分证据. 这个检验称为Vilcoxo双侧符号秩和检验（以下简称双侧W+检验），之所以取a/2,也是由于这个“双侧”而来可以证明： E(w+)=nn+) 4 D(w+)=24nn+12m+）与下节的秩和统计量W类似，当n→o∞时，W+的标准化随机变量 W生= W+-n(n+1)/4 乡N0,1) (1.9) vVn(n+1)2n+1)/24 故例6.2.5的水平近似为a的双侧W+检验的否定域为 {IW*1≥ua/2} 取a=0.05,算得1W1=1.26<1.96=42s,故接受H0,根据现有观察值不足以否定H- 我们可以看到例1和例6.2.5中的同一个检验问题用符号检验和符号秩和检验得到两种不同的结论.按符号检验否定Ho,即认为甲、乙两酒有优劣之分，且乙优于甲.按符号秩和检验的小样本和大样本方法，都接受H,即表明无充分证据否定“甲、乙两酒一样好”.这里我们看到：同一个问题，同一批数据，用不同方法，检验结果不同，这不足为怪.正如用同一批数据去估计正态总体的数学期望值，用样本均值估计与用中位数估计，两者结果不同.这就产生了一个问题：这两种检验法哪一种好？这个问题不能一概而论，有兴趣的读者可查看参考文献9]P16中表9.1所列的结果.可以指出的是：符号检验全然不看数值而只看符号：基于正态假定的检验则要看数值.W+检验介于二者之间：它既不忽视数值.也不全看数值（数值只用于决定秩，而不用其本身值)· 三、Fisher的置换检验例5为比较A、B两种施肥方法何种为优，选择15块一样大的地，把每块分成形状大小一样的两小块，随机地将其中的一块分给A,另一小块给B.收获时得到各小块的产量如下：块号 1 2 3 45 678 A 188 96168176153172177163 B 139163160160147149149 122 A-B 49 -67 8166 23 28 双块号 9 1011 12131415 A 146173 18616817718496 B 132144130144102124144 A-B 1429 562475 60-48 算出∑(A-B)=314,现在要检验假设 Ho:A、B的效果一样. (1.10)

若(1.10)成立，每块内A-B值（即49，-67，.等）不一样，并非由于A、B效果不同，而是由于其两小块的差别.但随机化的结果，每一小块有同等可能分给A或B.因此，如在第一块，依随机化的结果不同，A-B可以是49，也可以是-49，要看较好的那块派给A还是B.这样一来，这个试验的全部可能的∑(A-B)值有215个： ±(49)，±(-67)，土(8)，·，±(60)，±(-48) 实际得出的∑(A-B)=314是215中的一个.当A、B效果有较大差别时1∑(A-B)川应取大值对215个可能结果中的每一个算出∑(A-B),用x记之，i=1,2,·,25.将它们按照它们的绝对值从大到小的顺序排列，不妨记为 E1;工2，··；T215 (1.11) 即满足 z1>z2l>…>lz2sl (1.11)中的215个值中，在Ho成立前提下，为等可能发生，即每个出现的概率都是1/2.检验问题(1.10)的否定域为 {I∑(A-BI>c 观测到得∑(A-B)川=314，从而检验的P值为 P0∑(A-B>314)=0 其中m为排序(1.11)中满足xm=314. 具体计算可知p314<0.0001因此有理由否定Ho 置换检验的缺点是：在具体实施时计算量大，使用起来不方便.但现在有了高速计算机，利用计算机来实施也不算难事了 Fisher自己和其它许多学者，都研究过这样的问题：当n很大时，可否找到一种近似的方法去实施置换检验，以大大简化计算？研究结果证明了：在很一般的条件下，这种简化的方法不仅存在，且就是通常的检验！这是一个很有意思的结果.因为一开始，检验是局限在正态模型中导出的.通过这个途径发现，即使在更为广泛的模型下，只要试验次数足够大，t检验仍是适用的，因此可以说，置换检验的理论从一个侧面加强了t检验的地位. §2两样本问题中的非参数假设检验在两样本的比较问题中，当样本的随机误差不服从正态分布时，就需要提出更一般得假设，并使用相应的非参数检验方法.这方面的理论和方法较多，但大都很专门，这里只对Vilcoxon秩和检验和置换检验作一简略介绍. 一、引言及定义我们首先来看一看这一检验的实际背景.两样本检验问题的一般提法如下：设X1,·,Xm 和Y,·,Y分别是从具有分布为F和F的一维总体中抽取的简单样本，且假定合样本X1,·,Xm, Y,·,Yn全体相互独立.要检验下列假设 H0:F=F2←→H1:F≠F (2.1)

在数理统计学中，习惯上称这个检验问题为“两样本问题”.我们来分别考虑下列几种请况： 1.设根据问题的实际背景，如果我们有理由假定F和F2为具有相同方差的正态分布，即假定 F1~N(a,o2),F2~N(6,02) 其中a、b和σ2皆未知，-00，这时检验问题转化为 H0:a=b←→H1:a≠b. (2.2) 在这个假定下，总体分布F1和F2只依赖于三个未知参数a、b和σ2，检验问题(2.1)归结为检验这些未知参数是否满足(2.2).按$5.1所述这属于“参数型假设检验问题”.这就是$5.2中讨论的两样本t检验. 2.如果我们对问题的实际背景所知甚少，我们只好认为对F和F2完全未知.在这样宽广的假定下，我们再不能使用通常的两样本检验.处理这个问题的一种方法是“斯米尔洛夫”(Smirnov)检验，这将在本章第五节中讨论. 在这一情形下，总体分布F和F2不能用有限个实参数去刻画，因此称为非参数检验问题. 3.现在我们讨论一种中间情况.设X是一种产品在一定生产工艺下的质量指标，而Y是该产品在另一生产工艺下的质量指标.有理由认为，改变生产工艺不影响产品质量指标的概率分布，而只能使此分布发生一些平移.也就是说，若以F记X的分布，则Y分布为F(红-)，这里是一个未知的位置参数.在这个假定下，“X、Y同分布”的假设相当“0=0”，而对立假设为“0≠0”.因此检验(2.1)归结为检验 H0:8=0←→H1:0≠0. (2.3) (2.3)是一个很重要的假设检验问题.在这一模型中，我们假定F未知，因而比正态模型为广。另外这一模型又比“斯米尔洛夫检验”中的模型窄一些，因为对后者而言，两分布F和F毫无关系，而在此F和F之间有F(x)=(x-) 虽然表面上看(2.3)象一个参数检验问题：假设中只涉及0，而它是一个实参数.其实不然因为总体的分布与F和都有关，而℉的分布未知，因此按非参数统计问题的定义，(23)应视为非参数检验问题」一般地，两样本问题(2.1)还有一些具有实际背景的中间情况.例如F2(x)=乃(z/o), 此。>0为未知的刻度参数，分布F也未知.检验问题(21)在此情况下转化为 H0:o=1←→H1:o≠1. (2.4) Vilcoxon两样本秩和检验就是考虑(2.3)的假设检验问题.下面首先给出Vilcoxon两样本秩和统计量的定义定义6.3.1设X1,…,Xm,Y1,…,Yn这n+m个值两两不相同，把它们按大小排列，结果为 Z<Z2<…<ZN,N=m+n, (2.5) 显然，每个Y必为(2.5)中的某一个.若Y=Zr,则Y在合样本X1,…,Xm Yi,·,Yn中的秩为R.而Y,…,Yn的秩和为 W=R1+…+Rn, (2.6) 它称为Wilcoroni两样本秩和统计量.这是Wilcoxon在1945年的一项工作中引进的， 9

中国科学技术大学：《数理统计》课程教学资源（课件讲义）第十二讲 非参数检验（一）

中国科学技术大学：《数理统计》课程教学资源（课件讲义）第十二讲非参数检验（一）