生物统计学：《生物统计附试验设计》课程教材（第三版）第十一章非参数检验.doc_大学文库

第十一章非参数检验前面有关章节讨论的参数检验都要求总体服从一定的分布,对总体参数的检验是建立在这种分布基础上的。例如,两样本平均数比较的t检验和多个样本平均数比较的F检验,都要求总体服从正态分布,推断两个或多个总体平均数是否相等。本章引入另一类检验—一—非参数检验(non- parametric test)。非参数检验是一种与总体分布状况无关的检验方法,它不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知。非参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。当样本观测值的总体分布类型未知或知之甚少,无法肯定其性质,特别是观测值明显偏离正态分布,不具备参数检验的应用条件时,常用非参数检验。非参数检验具有计算简便、直观,易于掌握,检验速度较快等优点非参数检验法从实质上讲,只是检验总体分布的位置(中位数)是否相同,所以对于总体分布已知的样本也可以采用非参数检验法,但是由于它不能充分利用样本内所有的数量信息,检验的效率一般要低于参数检验方法。例如,非配对资料的秩和检验,其效率为检验的864%,就是说以相同概率判断出差异显著,t检验所需的样本个数要少13.6%。非参数检验内容很多,本章只介绍常用的符号检验( sign test),秩和检验(rank- sum test)和等级相关分析( rank correlation analysis)三种第一节符号检验、配对资料的符号检验 )配对资料符号检验的意义配对资料符号检验是根据样本各对数据之差的正负符号多少来检验两个总体分布位置的异同,而不去考虑差值的大小。每对数据之差为正值用“+”表示,负值用“一”表示。可以设想如果两个总体分布位置相同,则正或负出现的次数应该相等。若不完全相等,至少不应相差过大,否则超过一定的临界值就认为两个样本所来自的两个总体差异显著,分布的位置不同。显然这种检验比较的是中位数而不是平均数,当分布对称时,中位数与平均数相等 (二)配对资料符号检验的基本步骤 1、提出无效假设与备择假设 Ho:甲、乙两处理差值d总体中位数=0 H4:甲、乙两处理差值d总体中位数≠0 此时进行两尾检验。若将HA中的“≠”改为“”,则进行一尾检验 2、计算差值并赋予符号求甲、乙两个处理的配对数据的差值d,d>0者记为“+”, d<0者记为“-”,d=0记为“0”。统计“+”“-”、“0”的个数,分别记为n1,n,n0,令 n=n+n。检验的统计量为K,等于n、n中的较小者,即K=mn{m4,n}。 207

207 第十一章非参数检验前面有关章节讨论的参数检验都要求总体服从一定的分布，对总体参数的检验是建立在这种分布基础上的。例如，两样本平均数比较的 t 检验和多个样本平均数比较的 F 检验，都要求总体服从正态分布，推断两个或多个总体平均数是否相等。本章引入另一类检验——非参数检验（non-parametric test）。非参数检验是一种与总体分布状况无关的检验方法，它不依赖于总体分布的形式，应用时可以不考虑被研究的对象为何种分布以及分布是否已知。非参数检验主要是利用样本数据之间的大小比较及大小顺序，对两个或多个样本所属总体是否相同进行检验，而不对总体分布的参数如平均数、标准差等进行统计推断。当样本观测值的总体分布类型未知或知之甚少，无法肯定其性质，特别是观测值明显偏离正态分布，不具备参数检验的应用条件时，常用非参数检验。非参数检验具有计算简便、直观，易于掌握，检验速度较快等优点。非参数检验法从实质上讲，只是检验总体分布的位置（中位数）是否相同，所以对于总体分布已知的样本也可以采用非参数检验法，但是由于它不能充分利用样本内所有的数量信息，检验的效率一般要低于参数检验方法。例如，非配对资料的秩和检验，其效率为 t 检验的 86.4%，就是说以相同概率判断出差异显著，t 检验所需的样本个数要少 13.6%。非参数检验内容很多，本章只介绍常用的符号检验（sign test），秩和检验（rank-sum test）和等级相关分析（rank correlation analysis）三种。第一节符号检验一、配对资料的符号检验（一）配对资料符号检验的意义配对资料符号检验是根据样本各对数据之差的正负符号多少来检验两个总体分布位置的异同，而不去考虑差值的大小。每对数据之差为正值用“+”表示，负值用“－”表示。可以设想如果两个总体分布位置相同，则正或负出现的次数应该相等。若不完全相等，至少不应相差过大，否则超过一定的临界值就认为两个样本所来自的两个总体差异显著，分布的位置不同。显然这种检验比较的是中位数而不是平均数，当分布对称时，中位数与平均数相等。（二）配对资料符号检验的基本步骤 1、提出无效假设与备择假设 HO：甲、乙两处理差值 d 总体中位数=0； HA：甲、乙两处理差值 d 总体中位数≠0。此时进行两尾检验。若将 HA 中的“≠”改为“＜”或“＞”，则进行一尾检验。 2、计算差值并赋予符号求甲、乙两个处理的配对数据的差值 d，d＞0 者记为“+”， d＜0 者记为“－”，d=0 记为“0”。统计“+”、“－”、“0”的个数，分别记为 0 n+ ,n− ,n ，令 n = n+ + n− 。检验的统计量为 K，等于 + n 、 − n 中的较小者，即 min{ , } K = n+ n−

208 3、统计推断由 n 查附表 11 符号检验用 K 临界值表（表中 P(2)表示两尾概率，用于两尾检验，P(1)表示一尾概率，用于一尾检验）得临界值 K0.05(n)，K0.01(n)。如果 K＞K0.05(n) ， P＞0.05，则不能否定 HO，表明两个试验处理差异不显著；如果 K0.01(n) ＜K≤K0.05(n) ，0.01 ＜P≤0.05，则否定 HO，接受 HA，表明两个试验处理差异显著；如果 K≤K0.01(n)，P≤0.01，则否定 HO，接受 HA，表明两个试验处理差异极显著（注意：当 K 恰好等于临界 K 值时，其确切概率常小于附表 11 中列出的相应概率）。【例 11.1】某研究测定了噪声刺激前后 15 头猪的心率，结果见表 11-1。问噪声对猪的心率有无影响？表 11-1 猪噪声刺激前后的心率（次/分钟）猪号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 刺激前 61 70 68 73 85 81 65 62 72 84 76 60 80 79 71 刺激后 75 79 85 77 84 87 88 76 74 81 85 78 88 80 84 差值 -14 -9 -17 -4 1 -6 -23 -14 -2 3 -9 -18 -8 -1 -13 符号 - - - - + - - - - + - - - - - 这是一个配对资料两尾检验的问题。 1、提出无效假设与备择假设 HO ：噪声刺激前后猪的心率差值 d 总体中位数=0； HA ：噪声刺激前后猪的心率差值 d 总体中位数≠0。 2、计算差值并赋予符号噪声刺激前后的差值及符号列于表 11-1 第 4 行和第 5 行，从而得 n+ = 2、 n− =13 ， n = n+ + n− = 2 +13 =15 ， K = min{n+ ,n− } = n+ = 2。 3、统计推断当 n=15 时，查附表 11 得临界值 K0.05(15)=3，K0.01(15)=2，因为 K=2= K0.01(15)， P≤0.01，表明噪声刺激对猪的心率影响极显著。值得注意的是，虽然符号检验方法简单，但是，由于利用的信息较少，所以效率较低，且样本的配对数少于 6 时，不能检验出差别，在 7—12 时也不敏感，配对数在 20 以上时符号检验才较为有用。二、样本中位数与总体中位数比较的符号检验为了判断一个样本是否来自某已知中位数的总体，即样本所在总体的中位数是否等于某一已知总体的中位数，就需要进行样本中位数与总体中位数的差异显著性检验。其符号检验的基本步骤为： 1、提出无效假设与备择假设 HO：样本所在的总体中位数=已知总体中位数； HA：样本所在的总体中位数≠已知总体中位数。此时进行两尾检验。如果将备择假设 HA 中的“≠”改为“＜”或“＞”，则进行一尾检验。 2、计算差值、确定符号及其个数将样本各观测值中大于已知总体中位数者记为 “+”，小于者记为“－”，等于者记为“0”。统计“+”、 “－”、 “0” 的个数，分别记为 n+ 、 − n 、 0 n ，令 n = n+ + n− 。假设检验的统计量 K 为 + n 、 − n 中的较小者，即 min{ , } K = n+ n− 。 3、统计推断由 n 查附表 11 符号检验用 K 临界值表，得临界值 K0.05(n)，K0.01(n)。如

209 果 K＞K0.05(n) ，P＞0.05，则不能否定 HO，表明样本中位数与已知总体中位数差异不显著；如果 K0.01(n) ＜K≤K0.05(n) ，0.01＜P≤0.05，则否定 HO，接受 HA，表明样本中位数与已知总体中位数差异显著；如果 K≤K0.01(n)，P≤0.01，则否定 HO，接受 HA，表明样本中位数与已知总体中位数差异极显著。【例 11.2】已知某品种成年公黄牛胸围平均数为 140 厘米，今在某地随机抽取 10 头该品种成年公黄牛，测得一组胸围数字：128.1, 144.4, 150.3, 146.2, 140.6, 139.7, 134.1, 124.3, 147.9, 143.0（cm）。问该地成年公黄牛胸围与该品种胸围平均数是否有显著差异？表 11-2 成年公黄牛胸围测定值符号检验表牛号 1 2 3 4 5 6 7 8 9 10 胸围 128.1 144.4 150.3 146.2 140.6 139.7 134.1 124.3 147.9 143 差值 -11.9 4.4 6.3 6.2 0.6 -0.3 -5.9 -15.7 7.9 3 符号 - + + + + - - - + + 1、提出无效假设与备择假设 HO ：该地成年公黄牛胸围的平均数=140 厘米, HA ：该地成年公黄牛胸围的平均数≠140 厘米。 2、计算差值、确定符号及其个数样本各观测值与总体平均数的差值及其符号列于表 11-3，并由此得 = 6, = 4, n+ n− n = 6 + 4 = 10， K = min{n+ ,n− } = n− = 4 。 3、统计推断由 n=10，查附表 11，得 K0.05(10)=1，K＞K0.05(10) ，P＞0.05，不能否定 HO，表明样本平均数与总体平均数差异不显著，可以认为该地成年公黄牛胸围的平均数与该品种胸围总体平均数相同。第二节秩和检验秩和检验也叫做符号秩和检验（signed rank-sum test），是一种经过改进的符号检验，或称 Wilcoxon 检验，其统计效率远较符号检验为高。因为它除了比较各对数据差值的符号外，还要比较各对数据差值大小的秩次高低。方法是通过将观测值按由小到大的次序排列，编定秩次，求出秩和进行假设检验。秩和检验与符号检验法不同，要求差数来自某些对称分布的总体，但并不要求每一差数来自相同的分布。一、配对试验资料的符号秩和检验（Wilcoxon 配对法）（一）基本步骤 1、提出无效假设与备择假设 HO：差值 d 总体的中位数=0； HA：差值 d 总体的中位数≠0。此时进行两尾检验。若将 HA 中的“≠”改为“＜”或“＞”，则进行一尾检验。 2、编秩次、定符号先求配对数据的差值 d，然后按 d 的绝对值从小到大编秩次。再根据原差值正负在各秩次前标上正负号，若差值 d=0，则舍去不记，若有若干个差值 d 的绝对值相等，则取其平均秩次

3、确定统计量T分别计算正秩次及负秩次的和,并以绝对值较小的秩和绝对值为检验的统计量T。 4、统计推断记正、负差值的总个数为n,根据n查附表101)符号秩和检验用T 临界值表,得T0sm,Taom。如果T>sm,P>O05,则不能否定Ho,表明两个试验处理差异不显著:如果Tmm<T≤7sm,0.01<P≤0.05,则否定Ho,接受H,表明两个试验处理差异显著:如果T≤0m,P≤001,则否定Ho,接受HA,表明两个试验处理差异极显著(注意:当T恰好等于临界T值时,其确切概率常小于附表10(1)中列出的相应概率)。【例11.3】某试验用大白鼠研究饲料维生素E缺乏与肝脏中维生素A含量的关系,先将大白鼠按性别、月龄、体重等配为10对,再把每对中的两只大白鼠随机分配到正常饲料组和维生素E缺乏饲料组,试验结束后测定大白鼠肝中维生素A的含量如表11-4。试检验两组大白鼠肝中维生素A的含量是否有显著差异表11-3不同饲料鼠肝维生素A含量资料(国际单位/克) 鼠对别 E常饲料组3550200031003000395038003620375034503050 维生素E缺乏组2450240031001800320032503620270027001750 差值d 1200750550 10507501300 秩次 7 3.5 1、提出无效假设与备择假设 HO:差值d总体的中位数=0 H4:差值d总体的中位数≠0。 2、编秩次、定符号计算表113中配对数据差值d,将d=0的舍去,共有差值n=8 个。按绝对值从小到大排列秩次并标上相应的符号,差值绝对值为750的有两个,它们的秩次为3和4,所以其平均秩次为(3+4)/2=3.5,结果见表11-3。 3、确定统计量T此例,正号有7个,其秩次为2,3.5,35,5,6,7,8,秩次和为:2+3.5+3.5+5+6+7=35 负号只有1个,其秩次为1,秩次和等于1 负号秩次和较小,所以7=1 4、统计推断由=8查附表10(1)得,TD08=3,Tam=0,因为8<7<700(p, 0.01<P<0.05,否定Ho,接受H4,表明两个试验处理差异显著二、非配对试验资料的秩和检验( Wilcoxon非配对法) 非配对试验资料的秩和检验是关于分别抽自两个总体的两个独立样本之间秩和的成组比较,它比配对资料的秩和检验的应用更为普遍。 (一)基本步骤 1、提出无效假设与备择假设 HO:甲样本所在的总体的中位数=乙样本所在的总体的中位数 HA:甲样本所在的总体的中位数≠乙样本所在的总体的中位数

210 3、确定统计量 T 分别计算正秩次及负秩次的和，并以绝对值较小的秩和绝对值为检验的统计量 T。 4、统计推断记正、负差值的总个数为 n，根据 n 查附表 10(1)符号秩和检验用 T 临界值表，得 T0.05(n)，T0.01(n)。如果 T＞T0.05(n) ，P＞0.05，则不能否定 HO，表明两个试验处理差异不显著；如果 T0.01(n) ＜T≤T0.05(n) ，0.01＜P≤0.05，则否定 HO，接受 HA，表明两个试验处理差异显著；如果 T≤T0.01(n)，P≤0.01，则否定 HO，接受 HA，表明两个试验处理差异极显著（注意：当 T 恰好等于临界 T 值时，其确切概率常小于附表 10(1)中列出的相应概率）。【例 11.3】某试验用大白鼠研究饲料维生素 E 缺乏与肝脏中维生素 A 含量的关系，先将大白鼠按性别、月龄、体重等配为 10 对，再把每对中的两只大白鼠随机分配到正常饲料组和维生素 E 缺乏饲料组，试验结束后测定大白鼠肝中维生素 A 的含量如表 11-4。试检验两组大白鼠肝中维生素 A 的含量是否有显著差异。表 11-3 不同饲料鼠肝维生素 A 含量资料（国际单位/克）鼠对别 1 2 3 4 5 6 7 8 9 10 正常饲料组 3550 2000 3100 3000 3950 3800 3620 3750 3450 3050 维生素E缺乏组 2450 2400 3100 1800 3200 3250 3620 2700 2700 1750 差值di 1100 -400 0 1200 750 550 0 1050 750 1300 秩次 +6 -1 +7 +3.5 +2 +5 +3.5 +8 1、提出无效假设与备择假设 HO：差值 d 总体的中位数=0； HA：差值 d 总体的中位数≠0。 2、编秩次、定符号计算表 11-3 中配对数据差值 di，将 d =0 的舍去，共有差值 n=8 个。按绝对值从小到大排列秩次并标上相应的符号，差值绝对值为 750 的有两个，它们的秩次为 3 和 4，所以其平均秩次为（3+4）/2=3.5，结果见表 11-3。 3、确定统计量 T 此例，正号有 7 个，其秩次为 2，3.5，3.5，5，6，7，8，秩次和为：2+3.5+3.5+5+6+7=35；负号只有 1 个，其秩次为 1，秩次和等于 1。负号秩次和较小，所以 T=1。 4、统计推断由 n=8 查附表 10(1)得，T0.05(8)=3，T0.01(n)=0，因为 T0.01(8) ＜T＜T0.05(8) ， 0.01＜P＜0.05，否定 HO，接受 HA，表明两个试验处理差异显著。二、非配对试验资料的秩和检验（Wilcoxon 非配对法）非配对试验资料的秩和检验是关于分别抽自两个总体的两个独立样本之间秩和的成组比较，它比配对资料的秩和检验的应用更为普遍。（一）基本步骤 1、提出无效假设与备择假设 HO：甲样本所在的总体的中位数=乙样本所在的总体的中位数； HA：甲样本所在的总体的中位数≠乙样本所在的总体的中位数

此时进行两尾检验。若将H4中的“≠”改为“”,则进行一尾检验 2、求两个样本合并数据的秩次假设两个样本的含量分别为m和n2,则将两样本的观测值合并后,总的数据为n+m2个。将合并后的数据按从小到大的顺序排列,与每个数据对应的序号即为该数据的秩次,最小数值的秩次为“1”,最大数值的秩次为“m+n2”。遇不同样本的相同观测值时,其秩次取原秩次的平均秩次,但是同一样本内遇相同的观测值时则不必求平均秩次,秩次孰先孰后都可以。 3、确定统计量T将两个样本重新分开,并计算各自的秩和。将较小的那个样本含量作为m,其秩和作为检验的统计量T。若n=m2,则任取一组的秩和为T 4、统计推断由n、(n2-n)查附表10(3),得接受区域rs-7o0s,Tio1-7o0。若 T在T05-105之内,P>005,则不能否定Ho,表明两个试验处理差异不显著;若T在 705-705之外但在T1-之内,0.01<P≤0.05,则否定Ho,接受H4,表明两个试验处理差异显著:若T在T0-1o之外,P<001,则否定Ho,接受HA,表明两个试验处理差异极显著。【例11.4】研究两种不同能量水平饲料对5-6周龄肉仔鸡增重(克)的影响,资料如表11-4所示。问两种不同能量水平的饲料对肉仔鸡增重的影响有无差异? 表11-4两种不同能量水平饲料的肉仔鸡增重及秩和检验肉仔鸡增重(g) 高能量603585598620617650 秩次128.51114 T1=73.5 低能量489457512567512585591531467n2=9 秩次3 8.5106 2T2=46.5 1、提出无效假设与备择假设 Ho:髙能量饲料增重总体的中位数=低能量饲料增重总体的中位数 H:高能量饲料增重总体的中位数≠低能量饲料增重总体的中位数 2、编秩次将两组数据混合从小到大排列为秩次。在低能量组有两个“512”,不求平均秩次,其秩次分别为4和5;在高、低两组有一对数据为“585”,需求它们的平均秩次: (8+9)/2=8.5。结果见表11-4 3、确定统计量T以较小样本的秩次和为统计量T,即T=73.5 4统计推断由n=6,nm=96=3查附表103)得,o05-To5.31-65,7o1-7o 为26-70。7=73.5在01-To,即26-70之外,P<0.01,否定hb,接受H,表明饲料能量高低对肉仔鸡増重的影响差异极显著、多个样本比较的秩和检验( Kruskal-wallis法,H法多个样本比较的秩和检验的 Kruskal- Wallis法,又称H检验法。该法的前提是假设抽样总体是连续的和相同的,利用多个样本的秩和来推断它们分别代表的总体之分布位置是否相同,检验的基本步骤是: 1、提出无效假设与备择假设 211

211 此时进行两尾检验。若将 HA 中的“≠”改为“＜”或“＞”，则进行一尾检验。 2、求两个样本合并数据的秩次假设两个样本的含量分别为 n1 和 n2，则将两样本的观测值合并后，总的数据为 n1+n2 个。将合并后的数据按从小到大的顺序排列，与每个数据对应的序号即为该数据的秩次，最小数值的秩次为“1”，最大数值的秩次为“n1+n2”。遇不同样本的相同观测值时，其秩次取原秩次的平均秩次，但是同一样本内遇相同的观测值时则不必求平均秩次，秩次孰先孰后都可以。 3、确定统计量 T 将两个样本重新分开，并计算各自的秩和。将较小的那个样本含量作为 n1，其秩和作为检验的统计量 T。若 n1=n2，则任取一组的秩和为 T。 4、统计推断由 n1、(n2–n1)查附表 10(3)，得接受区域 0.05 ' T0.05 − T ， 0.01 ' T0.01 −T 。若 T 在 0.05 ' T0.05 − T 之内，P＞0.05，则不能否定 HO，表明两个试验处理差异不显著；若 T 在 0.05 ' T0.05 −T 之外但在 0.01 ' T0.01 −T 之内，0.01＜P≤0.05，则否定 HO，接受 HA，表明两个试验处理差异显著；若 T 在 0.01 ' T0.01 −T 之外，P＜0.01，则否定 HO，接受 HA，表明两个试验处理差异极显著。【例 11.4】研究两种不同能量水平饲料对 5-6 周龄肉仔鸡增重（克）的影响，资料如表 11-4 所示。问两种不同能量水平的饲料对肉仔鸡增重的影响有无差异？表 11-4 两种不同能量水平饲料的肉仔鸡增重及秩和检验饲料肉仔鸡增重（g）高能量秩次 603 12 585 8.5 598 11 620 14 617 13 650 15 n1=6 T1=73.5 低能量秩次 489 3 457 1 512 4 567 7 512 5 585 8.5 591 10 531 6 467 2 n2=9 T2=46.5 1、提出无效假设与备择假设 HO：高能量饲料增重总体的中位数=低能量饲料增重总体的中位数； HA：高能量饲料增重总体的中位数≠低能量饲料增重总体的中位数。 2、编秩次将两组数据混合从小到大排列为秩次。在低能量组有两个“512”，不求平均秩次，其秩次分别为 4 和 5；在高、低两组有一对数据为“585”，需求它们的平均秩次： (8+9)/2=8.5。结果见表 11-4。 3、确定统计量 T 以较小样本的秩次和为统计量 T，即 T= 73.5。 4、统计推断由n1=6, n2-n1=9-6=3查附表10（3）得， 0.05 ' T0.05 −T 为31—65， 0.01 ' T0.01 −T 为 26—70。T=73.5 在 0.01 ' T0.01 −T ，即 26—70 之外，P＜0.01, 否定 HO，接受 HA，表明饲料能量高低对肉仔鸡增重的影响差异极显著。三、多个样本比较的秩和检验（Kruskal-Wallis 法，H 法）多个样本比较的秩和检验的 Kruskal-Wallis 法，又称 H 检验法。该法的前提是假设抽样总体是连续的和相同的，利用多个样本的秩和来推断它们分别代表的总体之分布位置是否相同，检验的基本步骤是： 1、提出无效假设与备择假设

212 HO：各个样本所分别代表的各总体分布位置相同； HA：各个样本所分别代表的各总体分布位置不完全相同。 2、编秩次、求秩和将各个样本的所有观测值混合后，按照由小到大的顺序排成 1， 2，…，n 个秩次。不同样本的相同观测值，取平均秩次；一个样本内的相同观测值，不求平均秩次。按样本把每个观测值的秩次一一相加，求出各样本的秩和。 3、求 H 值  − + + = 3( 1) ( 1) 12 2 n n R n n H i i （11-1）式中，Ri 为第 i 个样本的秩次之和； ni 为第 i 个样本的含量；n=∑ni 4、统计推断根据 n, ni 查附表 10（2），得临界值：H0.05，H0.01。若 H＜H0.05，P＞ 0.05，不能否定 HO，可以认为各样本代表的各总体分布位置相同；若 H0.05≤H＜H0.01, 0.01 ＜P≤0.05，否定 HO，接受 HA，表明各样本所代表的各总体分布位置显著不同；若 H≥H0.01, P≤0.01，表明各样本所代表的各总体分布位置极显著不同。当样本数 k＞3，ni＞5 时，不能从附表 10（2）中查得 H 值。这时 H 近似地呈自由度为 k－1 的 2  分布，可对 H 进行 2  检验。当相同的秩次较多时，按（11-1）式计算的 H 值常常偏低，此时应按（11-2）式求校正的 H 值 HC：         − − − =  n n t t H H j j C 3 3 ( ) 1 （11-2）式中，tj 表示某个数重复的次数。【例 11.5】某试验研究三种不同制剂治疗钩虫的效果，用 11 只大白鼠做试验，分为三组。每只鼠先人工感染 500 条钩蚴，感染后第 8 天，三组分别给服用甲、乙、丙三种制剂，第 10 天全部解剖检查各鼠体内活虫数，试验结果如表 11-5 所示。试检验三种制剂杀灭钩虫的效果有无差异。表 11-7 三种制剂杀灭钩虫效果及秩和检验制剂甲组（a）制剂乙组（b）制剂丙组（c）活虫数秩次活虫数秩次活虫数秩次 279 6 229 4 210 3 338 11 274 5 285 7 334 10 310 9 117 1 198 2 303 8 ni 5 3 3 Ri 37 18 11 1、提出无效假设与备择假设 HO：三种制剂活虫数总体分布位置相同；

213 HA：三种制剂活虫数总体分布位置不完全相同。 2、编秩次、求秩和三个组观测值混合后的秩次如表 11-5 所示，最后一行为各组秩次之和。 3、求 H 值由（11-1）式，得 ) 3(11 1) 2.38 3 11 3 18 5 37 ( 11(11 1) 12 2 2 2 − + =         + + + H = 4、统计推断当 n=11, n1=5, n2=3, n3=3 时，查附表 10（2），得 H0.05=5.65。因为 H ＜H0.05, P＞0.05，不能否定 HO，表明三种制剂杀灭钩虫的效果差异不显著。【例 11.6】对某种疾病采用一穴、二穴、三穴作针刺治疗，治疗效果分为控制、显效、有效、无效 4 级。治疗结果见表 11-6 第（2）、（3）、（4）栏。问 3 种针刺治疗方式疗效有无显著差异？表 11-6 3 种针刺方式治疗效果及秩和检验等级一穴二穴三穴合计秩次范围平均秩次各组秩和 ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ 一穴 ⑻ 二穴 ⑼ 三穴 ⑽ 控制 21 30 10 61 1~61 31.0 651.0 930.0 310.0 显效 18 10 22 50 62~111 86.5 1557.0 865.0 1903.0 有效 15 8 11 34 112~145 128.5 1927.5 1028.0 1413.5 无效 5 2 8 15 146~160 153.0 765.0 306.0 1224.0 合计 59 （n1） 50 (n2) 51 (n3) 160 (n) 4900.5 (R1) 3129.0 (R2) 4850.5 (R3) 1、提出无效假设与备择假设 HO：三种针刺方式治疗效果相同； HA：三种针刺方式治疗效果不完全相同。 2、编秩次、求秩和秩次、秩和等的计算结果列于表 11-6。其中的合计栏（5）=（2） +（3）+（4）栏；秩次范围栏（6）为每一等级组应占的秩次；平均秩次栏（7），是因为同一组所包含的秩次同属一个等级，不能分列出高低，故一律以其平均秩次为代表，平均秩次等于各等级组秩次下限与上限之和的平均；各组秩和 R1、R2、R3 分别等于第（2）、（3）、（4）栏乘以第（7）栏所得第（8）、（9）、（10）栏各自的和。 3、求 H 值因为各等级组段均以平均秩次作为代表，视为相同秩次，其相同秩次的个数 j t 等于各自的秩次合计，见第（5）栏。显然相同秩次较多，宜用（11-2）式求 HC。先按（11-1）式计算 H 值： 3 (160 1) 12.7293 51 4850.5 50 3129.0 59 4900.5 160 (160 1) 12 2 2 2 −  + =         + +  + H = 而 ( − )= (61 − 61) + (50 − 50) + (34 − 34) + (15 −15) = 394500 3 3 3 3 3 j j t t 于是利用（11-2）式，得：

214 14.0858 0.9037 12.7293 160 160 394500 1 12.7293 3 = = − − HC = 此试验处理数为 3，所以 df=3－1=2，查 2  值表得 9.21 2  0.01(2) = 。因为 HC ＞ 2  0.01(2) ， P＜0.01,表明 3 种针刺方式的治疗效果差异极显著。四、多个样本两两比较的秩和检验（Nemenyi-Wilcoxson-Wilcox法）当多组计量资料或等级资料经多个样本比较的秩和检验，认为各总体的分布位置不完全相同时，常需要进一步作两两比较的秩和检验，以推断哪两个总体的分布位置不同，哪两个总体分布位置并无不同。这个方法类似方差分析中的多重比较，常用 q 法： Ri Rj i j S R R q − − = （11-3）式中， Ri Rj S − 为秩和差异标准误，计算公式为： 12 ( )( +1) − = n nk nk SRi Rj （11-4） n 为样本含量即处理的重复数；k 为比较的两秩和差数范围内所包含的处理数。可见，这里的 q 法只适用于重复数相等的试验资料。计算 q 值后，以 df=∞和 k 查附表 5，得临界值 q(,k ) ，作出统计推断。【例 11.7】某种激素 4 种剂量对大白鼠耻骨间隙宽度增加量的影响试验，结果见表 11-7。问 4 种剂量大白鼠耻骨间隙的增加量是否有显著差异？表 11-7 四种剂量大白鼠耻骨间隙增加量及秩和检验剂量增加量（单位：mm） Ri 1 0.15 (1) 0.30 (2) 0.40 (3) 0.40 (4) 0.50 (5) 15 2 1.20 (6.5) 1.35 (8) 1.40 (9.5) 1.50 (11) 1.90 (14) 49 3 2.50 (19.5) 1.20 (6.5) 1.40 (9.5) 2.00 (15) 2.20 (16.5) 67 4 1.80 (13) 1.60 (12) 2.50 (19.5) 2.20 (16.5) 2.30 (18) 79 1、提出无效假设与备择假设 HO：四种剂量大白鼠耻骨间隙宽度增加量的总体分布位置相同； HA：四种剂量大白鼠耻骨间隙宽度增加量的总体分布位置不全相同。 2、编秩次、求秩和将四组观测值混合，由小到大编秩次，见表 11-7 括号内数字。不同组的相同观测值取平均秩次，如第 2、3 组各有一个 1.20，取它们原来秩次 6 和 7 的平均 6.5，余此类推；同一组内相同观测值不求平均秩次。各组秩和见表 11-7 最后一栏。 3、求 H 值因为本例有 2 个 1.20，2 个 1.40，2 个 2.20，2 个 2.50 ，所以用（11-2）式求校正 HC。先按（11-2）式计算 H

差异极显著:第2种剂量与第3、4种剂量,第3种剂量与第4种剂量差异不显著。第三节等级相关分析第八章所述的相关、回归分析法适用于变量为正态分布的资料。在实际工作中,经常遇到有些资料并不呈正态分布。对于这样的资料的分析只能用非参数法。分析两个变量间是否相关的非参数法,最常用的是等级相关分析等级相关是一种分析x、y两个变量的等级间是否相关的方法。先按x、y两变量的大小次序,分别由小到大编上等级(秩次),再看两个变量的等级间是否相关。等级相关程度的大小和相关性质用等级相关系数( coefficient of rank correlation)表示。等级相关系数亦称为秩相关系数。样本等级相关系数记为r,它是总体等级相关系数ps的估计值。等级相关系数r3具有与相关系数r相同的特性,它的值介于-1与1之间,r为正表示正相关,r为负表示负相关,等于零为零相关。常用的等级相关分析方法有 Spearman等级相关和 Kendall 等级相关等,本节只介绍 Spearman等级相关系数的计算及其显著性检验。其基本分析步骤 1、计算等级相关系数rs先将变量x、y分别由小到大列出等级,相邻两数相同时, 取平均等级;再求出每对等级之差d,利用(11-5)式计算等级相关系数: (11-5) n2-1) 式中,n为变量的对子数,d秩次之差。当相同秩次较多时,会影响∑d2值,应采用(116)式计算校正的等级相关系数r; (t r +ty Is n -n 式中,l2、1,的计算公式相同,均为:-1。在计算1时,4为x变量的相同秩次数 12 在计算时,为y变量的相同秩次数。 2、rs的显著性检验 (1)提出无效假设与备择假设Ho;ps=0;HA:ps≠0 (2)统计推断根据n查附表1,得临界r1a值。若;|005,不能否定Bo,表明两变量x、y等级相关不显著:若r10y≤<r00,001<P≤00,否定 H,接受H,表明两变量x、y等级相关显著:若≥00,P≤00l,否定ho,接受 HA,表明两变量x、y等级相关极显著。【例11.8】研究含有必需氨基酸添加剂的某种饲料的营养价值时,用大白鼠做试验获 216

216 差异极显著；第 2 种剂量与第 3、4 种剂量，第 3 种剂量与第 4 种剂量差异不显著。第三节等级相关分析第八章所述的相关、回归分析法适用于变量为正态分布的资料。在实际工作中，经常遇到有些资料并不呈正态分布。对于这样的资料的分析只能用非参数法。分析两个变量间是否相关的非参数法，最常用的是等级相关分析。等级相关是一种分析 x、y 两个变量的等级间是否相关的方法。先按 x、y 两变量的大小次序，分别由小到大编上等级（秩次），再看两个变量的等级间是否相关。等级相关程度的大小和相关性质用等级相关系数（coefficient of rank correlation）表示。等级相关系数亦称为秩相关系数。样本等级相关系数记为 rs，它是总体等级相关系数  S 的估计值。等级相关系数 rs 具有与相关系数 r 相同的特性，它的值介于-1 与 1 之间，rs 为正表示正相关，rs 为负表示负相关，rs 等于零为零相关。常用的等级相关分析方法有 Spearman 等级相关和 Kendall 等级相关等，本节只介绍 Spearman 等级相关系数的计算及其显著性检验。其基本分析步骤是： 1、计算等级相关系数 rs 先将变量 x、y 分别由小到大列出等级，相邻两数相同时，取平均等级；再求出每对等级之差 d，利用（11-5）式计算等级相关系数： ( 1) 6 1 2 2 − = −  n n d rs （11-5）式中，n 为变量的对子数，d 秩次之差。当相同秩次较多时，会影响  2 d 值，应采用（11-6）式计算校正的等级相关系数 ' s r ：         − −         − − − + − − =  x y x y s t n n t n n t t d n r 2 6 2 6 ( ) 6 3 3 3 2 3 ' （11-6）式中， x t 、 y t 的计算公式相同，均为：  − 12 3 i i t t 。在计算 x t 时， i t 为 x 变量的相同秩次数；在计算 y t 时， i t 为 y 变量的相同秩次数。 2、rs 的显著性检验（1）提出无效假设与备择假设 HO：  S =0；HA：  S ≠0 （2）统计推断根据 n 查附表 12，得临界 s( ) r 值。若 s r ＜ s(0.05) r ，P＞0.05，不能否定 HO，表明两变量 x、y 等级相关不显著；若 s(0.05) r ≤ s r ＜ s(0.01) r ，0.01＜P≤0.05，否定 HO，接受 HA，表明两变量 x、y 等级相关显著；若 s r ≥ s(0.01) r ，P≤0.01，否定 HO，接受 HA，表明两变量 x、y 等级相关极显著。【例 11.8】研究含有必需氨基酸添加剂的某种饲料的营养价值时，用大白鼠做试验获

生物统计学：《生物统计附试验设计》课程教材（第三版）第十一章 非参数检验

生物统计学：《生物统计附试验设计》课程教材（第三版）第十一章非参数检验