第十一章非参数检验 前面有关章节讨论的参数检验都要求总体服从一定的分布,对总体参数的检验是建立在 这种分布基础上的。例如,两样本平均数比较的t检验和多个样本平均数比较的F检验,都 要求总体服从正态分布,推断两个或多个总体平均数是否相等。本章引入另一类检验—一—非 参数检验(non- parametric test)。非参数检验是一种与总体分布状况无关的检验方法,它不 依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知。非 参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否 相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。当样本观测值的 总体分布类型未知或知之甚少,无法肯定其性质,特别是观测值明显偏离正态分布,不具备 参数检验的应用条件时,常用非参数检验。非参数检验具有计算简便、直观,易于掌握,检 验速度较快等优点 非参数检验法从实质上讲,只是检验总体分布的位置(中位数)是否相同,所以对于总 体分布已知的样本也可以采用非参数检验法,但是由于它不能充分利用样本内所有的数量信 息,检验的效率一般要低于参数检验方法。例如,非配对资料的秩和检验,其效率为检验 的864%,就是说以相同概率判断出差异显著,t检验所需的样本个数要少13.6%。非参数 检验内容很多,本章只介绍常用的符号检验( sign test),秩和检验(rank- sum test)和等级 相关分析( rank correlation analysis)三种。 第一节符号检验 、配对资料的符号检验 )配对资料符号检验的意义配对资料符号检验是根据样本各对数据之差的 正负符号多少来检验两个总体分布位置的异同,而不去考虑差值的大小。每对数据之差为正 值用“+”表示,负值用“一”表示。可以设想如果两个总体分布位置相同,则正或负出现 的次数应该相等。若不完全相等,至少不应相差过大,否则超过一定的临界值就认为两个样 本所来自的两个总体差异显著,分布的位置不同。显然这种检验比较的是中位数而不是平均 数,当分布对称时,中位数与平均数相等。 (二)配对资料符号检验的基本步骤 1、提出无效假设与备择假设 HO:甲、乙两处理差值d总体中位数=0; H4:甲、乙两处理差值d总体中位数≠0。 此时进行两尾检验。若将HA中的“≠”改为“”,则进行一尾检验。 2、计算差值并赋予符号求甲、乙两个处理的配对数据的差值d,d>0者记为“+”, d<0者记为“-”,d=0记为“0”。统计“+”、“-”、“0”的个数,分别记为n,n-,n0,令 n=n+n。检验的统计量为K,等于n、n中的较小者,即K=mn{m4,n}。 207
207 第十一章 非参数检验 前面有关章节讨论的参数检验都要求总体服从一定的分布,对总体参数的检验是建立在 这种分布基础上的。例如,两样本平均数比较的 t 检验和多个样本平均数比较的 F 检验,都 要求总体服从正态分布,推断两个或多个总体平均数是否相等。本章引入另一类检验——非 参数检验(non-parametric test)。非参数检验是一种与总体分布状况无关的检验方法,它不 依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知。非 参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否 相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。当样本观测值的 总体分布类型未知或知之甚少,无法肯定其性质,特别是观测值明显偏离正态分布,不具备 参数检验的应用条件时,常用非参数检验。非参数检验具有计算简便、直观,易于掌握,检 验速度较快等优点。 非参数检验法从实质上讲,只是检验总体分布的位置(中位数)是否相同,所以对于总 体分布已知的样本也可以采用非参数检验法,但是由于它不能充分利用样本内所有的数量信 息,检验的效率一般要低于参数检验方法。例如,非配对资料的秩和检验,其效率为 t 检验 的 86.4%,就是说以相同概率判断出差异显著,t 检验所需的样本个数要少 13.6%。非参数 检验内容很多,本章只介绍常用的符号检验(sign test),秩和检验(rank-sum test)和等级 相关分析(rank correlation analysis)三种。 第一节 符号检验 一、配对资料的符号检验 (一)配对资料符号检验的意义 配对资料符号检验是根据样本各对数据之差的 正负符号多少来检验两个总体分布位置的异同,而不去考虑差值的大小。每对数据之差为正 值用“+”表示,负值用“-”表示。可以设想如果两个总体分布位置相同,则正或负出现 的次数应该相等。若不完全相等,至少不应相差过大,否则超过一定的临界值就认为两个样 本所来自的两个总体差异显著,分布的位置不同。显然这种检验比较的是中位数而不是平均 数,当分布对称时,中位数与平均数相等。 (二)配对资料符号检验的基本步骤 1、提出无效假设与备择假设 HO:甲、乙两处理差值 d 总体中位数=0; HA:甲、乙两处理差值 d 总体中位数≠0。 此时进行两尾检验。若将 HA 中的“≠”改为“<”或“>”,则进行一尾检验。 2、计算差值并赋予符号 求甲、乙两个处理的配对数据的差值 d,d>0 者记为“+”, d<0 者记为“-”,d=0 记为“0”。统计“+”、“-”、“0”的个数,分别记为 0 n+ ,n− ,n ,令 n = n+ + n− 。检验的统计量为 K,等于 n+ 、 n− 中的较小者,即 min{ , } K = n+ n−
3、统计推断由n查附表11符号检验用K临界值表(表中Pa表示两尾概率,用 于两尾检验,Pu表示一尾概率,用于一尾检验)得临界值K0sm,Kaom。如果K> Ko.05m P>0.05,则不能否定Ho,表明两个试验处理差异不显著:如果K0mm”,则进行一尾检 2、计算差值、确定符号及其个数将样本各观测值中大于已知总体中位数者记为 “+”,小于者记为“一”,等于者记为“0”。统计“+”、“一”、“0”的个数,分别记为 n、n、n,令n=n4+n。假设检验的统计量K为n,、n中的较小者,即K=min{m+,n} 3、统计推断由n查附表11符号检验用K临界值表,得临界值 Ko.osini,Knmm。如
208 3、统计推断 由 n 查附表 11 符号检验用 K 临界值表(表中 P(2)表示两尾概率,用 于两尾检验,P(1)表示一尾概率,用于一尾检验)得临界值 K0.05(n),K0.01(n)。如果 K>K0.05(n) , P>0.05,则不能否定 HO,表明两个试验处理差异不显著;如果 K0.01(n) <K≤K0.05(n) ,0.01 <P≤0.05,则否定 HO,接受 HA,表明两个试验处理差异显著;如果 K≤K0.01(n),P≤0.01, 则否定 HO,接受 HA,表明两个试验处理差异极显著(注意:当 K 恰好等于临界 K 值时, 其确切概率常小于附表 11 中列出的相应概率)。 【例 11.1】某研究测定了噪声刺激前后 15 头猪的心率,结果见表 11-1。问噪声对猪的 心率有无影响? 表 11-1 猪噪声刺激前后的心率(次/分钟) 猪 号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 刺激前 61 70 68 73 85 81 65 62 72 84 76 60 80 79 71 刺激后 75 79 85 77 84 87 88 76 74 81 85 78 88 80 84 差 值 -14 -9 -17 -4 1 -6 -23 -14 -2 3 -9 -18 -8 -1 -13 符 号 - - - - + - - - - + - - - - - 这是一个配对资料两尾检验的问题。 1、提出无效假设与备择假设 HO :噪声刺激前后猪的心率差值 d 总体中位数=0; HA :噪声刺激前后猪的心率差值 d 总体中位数≠0。 2、计算差值并赋予符号 噪声刺激前后的差值及符号列于表 11-1 第 4 行和第 5 行, 从而得 n+ = 2、 n− =13 , n = n+ + n− = 2 +13 =15 , K = min{n+ ,n− } = n+ = 2。 3、统计推断 当 n=15 时,查附表 11 得临界值 K0.05(15)=3,K0.01(15)=2,因为 K=2= K0.01(15), P≤0.01,表明噪声刺激对猪的心率影响极显著。 值得注意的是,虽然符号检验方法简单,但是,由于利用的信息较少,所以效率较低, 且样本的配对数少于 6 时,不能检验出差别,在 7—12 时也不敏感,配对数在 20 以上时符 号检验才较为有用。 二、样本中位数与总体中位数比较的符号检验 为了判断一个样本是否来自某已知中位数的总体,即样本所在总体的中位数是否等于某 一已知总体的中位数,就需要进行样本中位数与总体中位数的差异显著性检验。其符号检验 的基本步骤为: 1、提出无效假设与备择假设 HO:样本所在的总体中位数=已知总体中位数; HA:样本所在的总体中位数≠已知总体中位数。 此时进行两尾检验。如果将备择假设 HA 中的“≠”改为“<”或“>”,则进行一尾检 验。 2、计算差值、确定符号及其个数 将样本各观测值中大于已知总体中位数者记为 “+”,小于者记为“-”,等于者记为“0”。统计“+”、 “-”、 “0” 的个数,分别记为 n+ 、n−、 0 n ,令 n = n+ + n− 。假设检验的统计量 K 为 n+ 、n− 中的较小者,即 min{ , } K = n+ n− 。 3、统计推断 由 n 查附表 11 符号检验用 K 临界值表,得临界值 K0.05(n),K0.01(n)。如
果K>K0sm),P>0.05,则不能否定Ho,表明样本中位数与已知总体中位数差异不显著 如果Km)kasn0,P>0.05,不能否定 Ho,表明样本平均数与总体平均数差异不显著,可以认为该地成年公黄牛胸围的平均数与 该品种胸围总体平均数相同。 第二节秩和检验 秩和检验也叫做符号秩和检验( signed rank- sum test),是一种经过改进的符号检验 或称 Wilcoxon检验,其统计效率远较符号检验为高。因为它除了比较各对数据差值的符号 外,还要比较各对数据差值大小的秩次高低。方法是通过将观测值按由小到大的次序排列, 编定秩次,求出秩和进行假设检验。秩和检验与符号检验法不同,要求差数来自某些对称分 布的总体,但并不要求每一差数来自相同的分布 、配对试验资料的符号秩和检验( Wilcoxon配对法) (一)基本步骤 1、提出无效假设与备择假设 :差值d总体的中位数=0 HA:差值d总体的中位数≠0 此时进行两尾检验。若将H1中的“≠”改为“”,则进行一尾检验。 2、编秩次、定符号先求配对数据的差值d,然后按d的绝对值从小到大编秩次 再根据原差值正负在各秩次前标上正负号,若差值d=0,则舍去不记,若有若干个差值d的 绝对值相等,则取其平均秩次 209
209 果 K>K0.05(n) ,P>0.05,则不能否定 HO,表明样本中位数与已知总体中位数差异不显著; 如果 K0.01(n) <K≤K0.05(n) ,0.01<P≤0.05,则否定 HO,接受 HA,表明样本中位数与已知总 体中位数差异显著;如果 K≤K0.01(n),P≤0.01,则否定 HO,接受 HA,表明样本中位数与已 知总体中位数差异极显著。 【例 11.2】已知某品种成年公黄牛胸围平均数为 140 厘米,今在某地随机抽取 10 头该 品种成年公黄牛,测得一组胸围数字:128.1, 144.4, 150.3, 146.2, 140.6, 139.7, 134.1, 124.3, 147.9, 143.0(cm)。 问该地成年公黄牛胸围与该品种胸围平均数是否有显著差异? 表 11-2 成年公黄牛胸围测定值符号检验表 牛号 1 2 3 4 5 6 7 8 9 10 胸围 128.1 144.4 150.3 146.2 140.6 139.7 134.1 124.3 147.9 143 差值 -11.9 4.4 6.3 6.2 0.6 -0.3 -5.9 -15.7 7.9 3 符号 - + + + + - - - + + 1、提出无效假设与备择假设 HO :该地成年公黄牛胸围的平均数=140 厘米, HA :该地成年公黄牛胸围的平均数≠140 厘米。 2、计算差值、确定符号及其个数 样本各观测值与总体平均数的差值及其符号列 于表 11-3,并由此得 = 6, = 4, n+ n− n = 6 + 4 = 10, K = min{n+ ,n− } = n− = 4 。 3、统计推断 由 n=10,查附表 11,得 K0.05(10)=1,K>K0.05(10) ,P>0.05,不能否定 HO,表明样本平均数与总体平均数差异不显著,可以认为该地成年公黄牛胸围的平均数与 该品种胸围总体平均数相同。 第二节 秩和检验 秩和检验也叫做符号秩和检验(signed rank-sum test),是一种经过改进的符号检验, 或称 Wilcoxon 检验,其统计效率远较符号检验为高。因为它除了比较各对数据差值的符号 外,还要比较各对数据差值大小的秩次高低。方法是通过将观测值按由小到大的次序排列, 编定秩次,求出秩和进行假设检验。秩和检验与符号检验法不同,要求差数来自某些对称分 布的总体,但并不要求每一差数来自相同的分布。 一、配对试验资料的符号秩和检验(Wilcoxon 配对法) (一)基本步骤 1、提出无效假设与备择假设 HO:差值 d 总体的中位数=0; HA:差值 d 总体的中位数≠0。 此时进行两尾检验。若将 HA 中的“≠”改为“<”或“>”,则进行一尾检验。 2、编秩次、定符号 先求配对数据的差值 d,然后按 d 的绝对值从小到大编秩次。 再根据原差值正负在各秩次前标上正负号,若差值 d=0,则舍去不记,若有若干个差值 d 的 绝对值相等,则取其平均秩次
3、确定统计量T分别计算正秩次及负秩次的和,并以绝对值较小的秩和绝对值为 检验的统计量T。 4、统计推断记正、负差值的总个数为n,根据n查附表101)符号秩和检验用T 临界值表,得T0msm,Taom。如果T>sm,P>O05,则不能否定Ho,表明两个试验处 理差异不显著:如果Tmm<T≤7sm,0.01<P≤0.05,则否定Ho,接受H,表明两个 试验处理差异显著:如果T≤0m,P≤001,则否定Ho,接受HA,表明两个试验处理差 异极显著(注意:当T恰好等于临界T值时,其确切概率常小于附表10()中列出的相应概 率)。 【例11.3】某试验用大白鼠研究饲料维生素E缺乏与肝脏中维生素A含量的关系,先 将大白鼠按性别、月龄、体重等配为10对,再把每对中的两只大白鼠随机分配到正常饲料 组和维生素E缺乏饲料组,试验结束后测定大白鼠肝中维生素A的含量如表11-4。试检验 两组大白鼠肝中维生素A的含量是否有显著差异。 表11-3不同饲料鼠肝维生素A含量资料(国际单位/克) 鼠对别 E常饲料组3550200031003000395038003620375034503050 维生素E缺乏组2450240031001800320032503620270027001750 差值d 1200750550 10507501300 秩次 7 3.5 1、提出无效假设与备择假设 HO:差值d总体的中位数=0 H4:差值d总体的中位数≠0。 2、编秩次、定符号计算表113中配对数据差值d,将d=0的舍去,共有差值n=8 个。按绝对值从小到大排列秩次并标上相应的符号,差值绝对值为750的有两个,它们的秩 次为3和4,所以其平均秩次为(3+4)/2=3.5,结果见表11-3。 3、确定统计量T此例,正号有7个,其秩次为2,3.5,35,5,6,7,8,秩次 和为:2+3.5+3.5+5+6+7=35 负号只有1个,其秩次为1,秩次和等于1 负号秩次和较小,所以7=1 4、统计推断由=8查附表10(1)得,TD08=3,Taom=0,因为8<7<700(p, 0.01<P<0.05,否定Ho,接受H4,表明两个试验处理差异显著 二、非配对试验资料的秩和检验( Wilcoxon非配对法) 非配对试验资料的秩和检验是关于分别抽自两个总体的两个独立样本之间秩和的成组 比较,它比配对资料的秩和检验的应用更为普遍。 (一)基本步骤 1、提出无效假设与备择假设 HO:甲样本所在的总体的中位数=乙样本所在的总体的中位数 HA:甲样本所在的总体的中位数≠乙样本所在的总体的中位数
210 3、确定统计量 T 分别计算正秩次及负秩次的和,并以绝对值较小的秩和绝对值为 检验的统计量 T。 4、统计推断 记正、负差值的总个数为 n,根据 n 查附表 10(1)符号秩和检验用 T 临界值表,得 T0.05(n),T0.01(n)。如果 T>T0.05(n) ,P>0.05,则不能否定 HO,表明两个试验处 理差异不显著;如果 T0.01(n) <T≤T0.05(n) ,0.01<P≤0.05,则否定 HO,接受 HA,表明两个 试验处理差异显著;如果 T≤T0.01(n),P≤0.01,则否定 HO,接受 HA,表明两个试验处理差 异极显著(注意:当 T 恰好等于临界 T 值时,其确切概率常小于附表 10(1)中列出的相应概 率)。 【例 11.3】某试验用大白鼠研究饲料维生素 E 缺乏与肝脏中维生素 A 含量的关系,先 将大白鼠按性别、月龄、体重等配为 10 对,再把每对中的两只大白鼠随机分配到正常饲料 组和维生素 E 缺乏饲料组,试验结束后测定大白鼠肝中维生素 A 的含量如表 11-4。试检验 两组大白鼠肝中维生素 A 的含量是否有显著差异。 表 11-3 不同饲料鼠肝维生素 A 含量资料(国际单位/克) 鼠对别 1 2 3 4 5 6 7 8 9 10 正常饲料组 3550 2000 3100 3000 3950 3800 3620 3750 3450 3050 维生素E缺乏组 2450 2400 3100 1800 3200 3250 3620 2700 2700 1750 差值di 1100 -400 0 1200 750 550 0 1050 750 1300 秩次 +6 -1 +7 +3.5 +2 +5 +3.5 +8 1、提出无效假设与备择假设 HO:差值 d 总体的中位数=0; HA:差值 d 总体的中位数≠0。 2、编秩次、定符号 计算表 11-3 中配对数据差值 di,将 d =0 的舍去,共有差值 n=8 个。按绝对值从小到大排列秩次并标上相应的符号,差值绝对值为 750 的有两个,它们的秩 次为 3 和 4,所以其平均秩次为(3+4)/2=3.5,结果见表 11-3。 3、确定统计量 T 此例,正号有 7 个,其秩次为 2,3.5,3.5,5,6,7,8,秩次 和为:2+3.5+3.5+5+6+7=35; 负号只有 1 个,其秩次为 1,秩次和等于 1。 负号秩次和较小,所以 T=1。 4、统计推断 由 n=8 查附表 10(1)得,T0.05(8)=3,T0.01(n)=0,因为 T0.01(8) <T<T0.05(8) , 0.01<P<0.05,否定 HO,接受 HA,表明两个试验处理差异显著。 二、非配对试验资料的秩和检验(Wilcoxon 非配对法) 非配对试验资料的秩和检验是关于分别抽自两个总体的两个独立样本之间秩和的成组 比较,它比配对资料的秩和检验的应用更为普遍。 (一)基本步骤 1、提出无效假设与备择假设 HO:甲样本所在的总体的中位数=乙样本所在的总体的中位数; HA:甲样本所在的总体的中位数≠乙样本所在的总体的中位数
此时进行两尾检验。若将H4中的“≠”改为“”,则进行一尾检验 2、求两个样本合并数据的秩次假设两个样本的含量分别为m和n2,则将两样 本的观测值合并后,总的数据为n+m2个。将合并后的数据按从小到大的顺序排列,与每个 数据对应的序号即为该数据的秩次,最小数值的秩次为“1”,最大数值的秩次为“m+n2”。 遇不同样本的相同观测值时,其秩次取原秩次的平均秩次,但是同一样本内遇相同的观测值 时则不必求平均秩次,秩次孰先孰后都可以。 3、确定统计量T将两个样本重新分开,并计算各自的秩和。将较小的那个样本 含量作为m,其秩和作为检验的统计量T。若n=m2,则任取一组的秩和为T 4、统计推断由n、(n-m)查附表10(3),得接受区域705-105,Tio-7o。若 T在T05-105之内,P>005,则不能否定Ho,表明两个试验处理差异不显著;若T在 705-705之外但在T1-70之内,0.01<P≤0.05,则否定Ho,接受H4,表明两个试验 处理差异显著;若T在T0-70之外,P<0.01,则否定Ho,接受H,表明两个试验处理 差异极显著。 【例11.4】研究两种不同能量水平饲料对5-6周龄肉仔鸡增重(克)的影响,资料 如表11-4所示。问两种不同能量水平的饲料对肉仔鸡增重的影响有无差异? 表11-4两种不同能量水平饲料的肉仔鸡增重及秩和检验 肉仔鸡增重(g) 高能量603585598620617650 秩次128.51114 T1=73.5 低能量489457512567512585591531467n2=9 秩次3 8.5106 2T2=46.5 1、提出无效假设与备择假设 Ho:髙能量饲料增重总体的中位数=低能量饲料增重总体的中位数 H:高能量饲料增重总体的中位数≠低能量饲料增重总体的中位数 2、编秩次将两组数据混合从小到大排列为秩次。在低能量组有两个“512”,不求 平均秩次,其秩次分别为4和5;在高、低两组有一对数据为“585”,需求它们的平均秩次: (8+9)2=85。结果见表11-4 3、确定统计量T以较小样本的秩次和为统计量T,即T=73.5 4统计推断由n=6,nm=96=3查附表103)得,o05-To5为31-65,7o1-7o 为26-70。7=73.5在01-To,即26-70之外,P<0.01,否定hb,接受H,表明饲料 能量高低对肉仔鸡増重的影响差异极显著 、多个样本比较的秩和检验( Kruskal-wallis法,H法) 多个样本比较的秩和检验的 Kruskal- Wallis法,又称H检验法。该法的前提是假设抽 样总体是连续的和相同的,利用多个样本的秩和来推断它们分别代表的总体之分布位置是否 相同,检验的基本步骤是: 1、提出无效假设与备择假设 211
211 此时进行两尾检验。若将 HA 中的“≠”改为“<”或“>”,则进行一尾检验。 2、求两个样本合并数据的秩次 假设两个样本的含量分别为 n1 和 n2,则将两样 本的观测值合并后,总的数据为 n1+n2 个。将合并后的数据按从小到大的顺序排列,与每个 数据对应的序号即为该数据的秩次,最小数值的秩次为“1”,最大数值的秩次为“n1+n2”。 遇不同样本的相同观测值时,其秩次取原秩次的平均秩次,但是同一样本内遇相同的观测值 时则不必求平均秩次,秩次孰先孰后都可以。 3、确定统计量 T 将两个样本重新分开,并计算各自的秩和。将较小的那个样本 含量作为 n1,其秩和作为检验的统计量 T。若 n1=n2,则任取一组的秩和为 T。 4、统计推断 由 n1、(n2–n1)查附表 10(3),得接受区域 0.05 ' T0.05 − T , 0.01 ' T0.01 −T 。若 T 在 0.05 ' T0.05 − T 之内,P>0.05,则不能否定 HO,表明两个试验处理差异不显著;若 T 在 0.05 ' T0.05 −T 之外但在 0.01 ' T0.01 −T 之内,0.01<P≤0.05,则否定 HO,接受 HA,表明两个试验 处理差异显著;若 T 在 0.01 ' T0.01 −T 之外,P<0.01,则否定 HO,接受 HA,表明两个试验处理 差异极显著。 【例 11.4】 研究两种不同能量水平饲料对 5-6 周龄肉仔鸡增重(克)的影响,资料 如表 11-4 所示。问两种不同能量水平的饲料对肉仔鸡增重的影响有无差异? 表 11-4 两种不同能量水平饲料的肉仔鸡增重及秩和检验 饲 料 肉仔鸡增重(g) 高能量 秩 次 603 12 585 8.5 598 11 620 14 617 13 650 15 n1=6 T1=73.5 低能量 秩 次 489 3 457 1 512 4 567 7 512 5 585 8.5 591 10 531 6 467 2 n2=9 T2=46.5 1、提出无效假设与备择假设 HO:高能量饲料增重总体的中位数=低能量饲料增重总体的中位数; HA:高能量饲料增重总体的中位数≠低能量饲料增重总体的中位数。 2、编秩次 将两组数据混合从小到大排列为秩次。在低能量组有两个“512”,不求 平均秩次,其秩次分别为 4 和 5;在高、低两组有一对数据为“585”,需求它们的平均秩次: (8+9)/2=8.5。结果见表 11-4。 3、确定统计量 T 以较小样本的秩次和为统计量 T,即 T= 73.5。 4、统计推断 由n1=6, n2-n1=9-6=3查附表10(3)得, 0.05 ' T0.05 −T 为31—65, 0.01 ' T0.01 −T 为 26—70。T=73.5 在 0.01 ' T0.01 −T ,即 26—70 之外,P<0.01, 否定 HO,接受 HA,表明饲料 能量高低对肉仔鸡增重的影响差异极显著。 三、多个样本比较的秩和检验(Kruskal-Wallis 法,H 法) 多个样本比较的秩和检验的 Kruskal-Wallis 法,又称 H 检验法。该法的前提是假设抽 样总体是连续的和相同的,利用多个样本的秩和来推断它们分别代表的总体之分布位置是否 相同,检验的基本步骤是: 1、提出无效假设与备择假设
各个样本所分别代表的各总体分布位置相同 HA:各个样本所分别代表的各总体分布位置不完全相同。 2、编秩次、求秩和将各个样本的所有观测值混合后,按照由小到大的顺序排成1, ,…,n个秩次。不同样本的相同观测值,取平均秩次;一个样本内的相同观测值,不求 平均秩次。按样本把每个观测值的秩次一一相加,求出各样本的秩和。 3、求H值 H= 3(n+1) (11-1) n(n+1)n1 式中,R1为第i个样本的秩次之和; n为第i个样本的含量:m=∑n 4、统计推断根据n,n查附表10(2),得临界值:Hn,H。若H 0.05,不能否定Ho,可以认为各样本代表的各总体分布位置相同:若Hns≤H3,m>5时,不能从附表10(2)中查得H值。这时H近似地呈自由度为 k-1的x2分布,可对H进行x2检验。 当相同的秩次较多时,按(11-1)式计算的H值常常偏低,此时应按(11-2)式求校正 的H值 H (11-2) ∑(-t,) 式中,表示某个数重复的次数。 【例11.5】某试验研究三种不同制剂治疗钩虫的效果,用11只大白鼠做试验,分为三 组。每只鼠先人工感染500条钩蚴,感染后第8天,三组分别给服用甲、乙、丙三种制剂, 第10天全部解剖检查各鼠体内活虫数,试验结果如表11-5所示。试检验三种制剂杀灭钩虫 的效果有无差异 表11-7三种制剂杀灭钩虫效果及秩和检验 制剂甲组(a) 制剂乙组(b) 制剂丙组(c) 活虫数 秩次 活虫数 秩次 活虫数 279 1、提出无效假设与备择假设 HO:三种制剂活虫数总体分布位置相
212 HO:各个样本所分别代表的各总体分布位置相同; HA:各个样本所分别代表的各总体分布位置不完全相同。 2、编秩次、求秩和 将各个样本的所有观测值混合后,按照由小到大的顺序排成 1, 2,…,n 个秩次。不同样本的相同观测值,取平均秩次;一个样本内的相同观测值,不求 平均秩次。按样本把每个观测值的秩次一一相加,求出各样本的秩和。 3、求 H 值 − + + = 3( 1) ( 1) 12 2 n n R n n H i i (11-1) 式中,Ri 为第 i 个样本的秩次之和; ni 为第 i 个样本的含量;n=∑ni 4、统计推断 根据 n, ni 查附表 10(2),得临界值:H0.05,H0.01。若 H<H0.05,P> 0.05,不能否定 HO,可以认为各样本代表的各总体分布位置相同;若 H0.05≤H<H0.01, 0.01 <P≤0.05,否定 HO,接受 HA,表明各样本所代表的各总体分布位置显著不同;若 H≥H0.01, P≤0.01,表明各样本所代表的各总体分布位置极显著不同。 当样本数 k>3,ni>5 时,不能从附表 10(2)中查得 H 值。这时 H 近似地呈自由度为 k-1 的 2 分布,可对 H 进行 2 检验。 当相同的秩次较多时,按(11-1)式计算的 H 值常常偏低,此时应按(11-2)式求校正 的 H 值 HC: − − − = n n t t H H j j C 3 3 ( ) 1 (11-2) 式中,tj 表示某个数重复的次数。 【例 11.5】某试验研究三种不同制剂治疗钩虫的效果,用 11 只大白鼠做试验,分为三 组。每只鼠先人工感染 500 条钩蚴,感染后第 8 天,三组分别给服用甲、乙、丙三种制剂, 第 10 天全部解剖检查各鼠体内活虫数,试验结果如表 11-5 所示。试检验三种制剂杀灭钩虫 的效果有无差异。 表 11-7 三种制剂杀灭钩虫效果及秩和检验 制剂甲组(a) 制剂乙组(b) 制剂丙组(c) 活虫数 秩次 活虫数 秩次 活虫数 秩次 279 6 229 4 210 3 338 11 274 5 285 7 334 10 310 9 117 1 198 2 303 8 ni 5 3 3 Ri 37 18 11 1、提出无效假设与备择假设 HO:三种制剂活虫数总体分布位置相同;
HA4:三种制剂活虫数总体分布位置不完全相同。 2、编秩次、求秩和三个组观测值混合后的秩次如表115所示,最后一行为各组 秩次之和。 3、求H值由(11)式,得 H=1mn+s+3+3y-1+)=238 4、统计推断当r=11,n1=5,n2=3,n=3时,查附表10(2),得H0s=565。因为H 0.05,不能否定Ho,表明三种制剂杀灭钩虫的效果差异不显著。 【例11.6】对某种疾病采用一穴、二穴、三穴作针刺治疗,治疗效果分为控制、显效、 有效、无效4级。治疗结果见表11-6第(2)(3)、(4)栏。问3种针刺治疗方式疗效有无 显著差异? 表11-63种针刺方式治疗效果及秩和检验 等级一穴二穴三穴合计秩次范围平均秩次 各组秩和 穴二穴三穴 (6) 控制21 61 31.0651.0930.0310.0 显效18 62~1ll 86.51557.0865.01903.0 有效1581134112~145128.51927.51028.01413.5 2815146-1601530765:0306012240 合计595051160 4900.53129.04850.5 (R1)(R2)(R3) 1、提出无效假设与备择假设 :三种针刺方式治疗效果相同 HA4:三种针刺方式治疗效果不完全相同。 2、编秩次、求秩和秩次、秩和等的计算结果列于表11-6。其中的合计栏(5)=(2) +(3)+(4)栏;秩次范围栏(6)为每一等级组应占的秩次;平均秩次栏(7),是因为同 一组所包含的秩次同属一个等级,不能分列出高低,故一律以其平均秩次为代表,平均秩次 等于各等级组秩次下限与上限之和的平均:各组秩和R、R、R3分别等于第(2)、(3)、(4) 栏乘以第(7)栏所得第(8)、(9)、(10)栏各自的和。 3、求H值因为各等级组段均以平均秩次作为代表,视为相同秩次,其相同秩次的 个数t,等于各自的秩次合计,见第(5)栏。显然相同秩次较多,宜用(11-2)式求HC。先 按(11-1)式计算H值: 4900.523129024850.5 H 3×(160+1)=12.7293 而∑(-)=(612-61)+(32-30)+(43-34)+(5-15)=3450 于是利用(11-2)式,得: 213
213 HA:三种制剂活虫数总体分布位置不完全相同。 2、编秩次、求秩和 三个组观测值混合后的秩次如表 11-5 所示,最后一行为各组 秩次之和。 3、求 H 值 由(11-1)式,得 ) 3(11 1) 2.38 3 11 3 18 5 37 ( 11(11 1) 12 2 2 2 − + = + + + H = 4、统计推断 当 n=11, n1=5, n2=3, n3=3 时,查附表 10(2),得 H0.05=5.65。因为 H <H0.05, P>0.05,不能否定 HO,表明三种制剂杀灭钩虫的效果差异不显著。 【例 11.6】对某种疾病采用一穴、二穴、三穴作针刺治疗,治疗效果分为控制、显效、 有效、无效 4 级。治疗结果见表 11-6 第(2)、(3)、(4)栏。问 3 种针刺治疗方式疗效有无 显著差异? 表 11-6 3 种针刺方式治疗效果及秩和检验 等 级 一穴 二穴 三穴 合计 秩次范围 平均秩次 各组秩和 ⑴ ⑵ ⑶ ⑷ ⑸ ⑹ ⑺ 一穴 ⑻ 二穴 ⑼ 三穴 ⑽ 控 制 21 30 10 61 1~61 31.0 651.0 930.0 310.0 显 效 18 10 22 50 62~111 86.5 1557.0 865.0 1903.0 有 效 15 8 11 34 112~145 128.5 1927.5 1028.0 1413.5 无 效 5 2 8 15 146~160 153.0 765.0 306.0 1224.0 合 计 59 (n1) 50 (n2) 51 (n3) 160 (n) 4900.5 (R1) 3129.0 (R2) 4850.5 (R3) 1、提出无效假设与备择假设 HO:三种针刺方式治疗效果相同; HA:三种针刺方式治疗效果不完全相同。 2、编秩次、求秩和 秩次、秩和等的计算结果列于表 11-6。其中的合计栏(5)=(2) +(3)+(4)栏;秩次范围栏(6)为每一等级组应占的秩次;平均秩次栏(7),是因为同 一组所包含的秩次同属一个等级,不能分列出高低,故一律以其平均秩次为代表,平均秩次 等于各等级组秩次下限与上限之和的平均;各组秩和 R1、R2、R3 分别等于第(2)、(3)、(4) 栏乘以第(7)栏所得第(8)、(9)、(10)栏各自的和。 3、求 H 值 因为各等级组段均以平均秩次作为代表,视为相同秩次,其相同秩次的 个数 j t 等于各自的秩次合计,见第(5)栏。显然相同秩次较多,宜用(11-2)式求 HC。先 按(11-1)式计算 H 值: 3 (160 1) 12.7293 51 4850.5 50 3129.0 59 4900.5 160 (160 1) 12 2 2 2 − + = + + + H = 而 ( − )= (61 − 61) + (50 − 50) + (34 − 34) + (15 −15) = 394500 3 3 3 3 3 j j t t 于是利用(11-2)式,得:
12.7293 12.7293 =14.0858 39450009037 此试验处理数为3,所以3-1=2,查x2值表得z02)=92l。因为Hc>x02, P<0.01,表明3种针刺方式的治疗效果差异极显著 四、多个样本两两比较的秩和检验( Nemenvi-Wilcoxson-Wilcox法) 当多组计量资料或等级资料经多个样本比较的秩和检验,认为各总体的分布位置不完全 相同时,常需要进一步作两两比较的秩和检验,以推断哪两个总体的分布位置不同,哪两个 总体分布位置并无不同。这个方法类似方差分析中的多重比较,常用q法 R-R (l1-3) R-R 式中,SB为秩和差异标准误,计算公式为: n(nk)(nk+1) (11-4) n为样本含量即处理的重复数:k为比较的两秩和差数范围内所包含的处理数。可见 这里的q法只适用于重复数相等的试验资料。 计算q值后,以∞和k查附表5,得临界值qa∞k)’作出统计推断 【例11.7】某种激素4种剂量对大白鼠耻骨间隙宽度增加量的影响试验,结果见表 117。问4种剂量大白鼠耻骨间隙的增加量是否有显著差异? 表11-7四种剂量大白鼠耻骨间隙增加量及秩和检验 剂量增加量(单位:m) 0.15(1)0.30(2)0.40(3)0.40(4)0.50(5)15 2 1.20 (6.5)1.35 8)1.40(9.5)1.50(11)1.90(14)49 32.50(19.5)1.20(6.5)1.40(9.5)200(15)2.20(16.5)67 41.80(13)1.60(12)2.50(19.5)2.20(16.5)2.30(18)79 1、提出无效假设与备择假设 HO:四种剂量大白鼠耻骨间隙宽度增加量的总体分布位置相同 HA:四种剂量大白鼠耻骨间隙宽度增加量的总体分布位置不全相同 编秩次、求秩和将四组观测值混合,由小到大编秩次,见表11-7括号内数字 不同组的相同观测值取平均秩次,如第2、3组各有一个1.20,取它们原来秩次6和7的平 均6.5,余此类推;同一组内相同观测值不求平均秩次。各组秩和见表117最后一栏。 3、求H值因为本例有2个1.20,2个1.40,2个2,20,2个2.50,所以用(112) 式求校正H。先按(11-2)式计算H 214
214 14.0858 0.9037 12.7293 160 160 394500 1 12.7293 3 = = − − HC = 此试验处理数为 3,所以 df=3-1=2,查 2 值表得 9.21 2 0.01(2) = 。因为 HC > 2 0.01(2) , P<0.01,表明 3 种针刺方式的治疗效果差异极显著。 四、多个样本两两比较的秩和检验(Nemenyi-Wilcoxson-Wilcox法) 当多组计量资料或等级资料经多个样本比较的秩和检验,认为各总体的分布位置不完全 相同时,常需要进一步作两两比较的秩和检验,以推断哪两个总体的分布位置不同,哪两个 总体分布位置并无不同。这个方法类似方差分析中的多重比较,常用 q 法: Ri Rj i j S R R q − − = (11-3) 式中, Ri Rj S − 为秩和差异标准误,计算公式为: 12 ( )( +1) − = n nk nk SRi Rj (11-4) n 为样本含量即处理的重复数;k 为比较的两秩和差数范围内所包含的处理数。可见, 这里的 q 法只适用于重复数相等的试验资料。 计算 q 值后,以 df=∞和 k 查附表 5,得临界值 q(,k ) ,作出统计推断。 【例 11.7】 某种激素 4 种剂量对大白鼠耻骨间隙宽度增加量的影响试验,结果见表 11-7。问 4 种剂量大白鼠耻骨间隙的增加量是否有显著差异? 表 11-7 四种剂量大白鼠耻骨间隙增加量及秩和检验 剂 量 增加量(单位:mm) Ri 1 0.15 (1) 0.30 (2) 0.40 (3) 0.40 (4) 0.50 (5) 15 2 1.20 (6.5) 1.35 (8) 1.40 (9.5) 1.50 (11) 1.90 (14) 49 3 2.50 (19.5) 1.20 (6.5) 1.40 (9.5) 2.00 (15) 2.20 (16.5) 67 4 1.80 (13) 1.60 (12) 2.50 (19.5) 2.20 (16.5) 2.30 (18) 79 1、提出无效假设与备择假设 HO:四种剂量大白鼠耻骨间隙宽度增加量的总体分布位置相同; HA:四种剂量大白鼠耻骨间隙宽度增加量的总体分布位置不全相同。 2、编秩次、求秩和 将四组观测值混合,由小到大编秩次,见表 11-7 括号内数字。 不同组的相同观测值取平均秩次,如第 2、3 组各有一个 1.20,取它们原来秩次 6 和 7 的平 均 6.5,余此类推;同一组内相同观测值不求平均秩次。各组秩和见表 11-7 最后一栏。 3、求 H 值 因为本例有 2 个 1.20,2 个 1.40,2 个 2.20,2 个 2.50 ,所以用(11-2) 式求校正 HC。先按(11-2)式计算 H
H 0(20+1)(55 5s|-320+1)=13 ∑(-1,)=(23-2)+(23-2)+(23-2)+(23-2)=24 所以 13.32 09970=13 4、统计推断本例k=4,超出附表10(2)的范围,故用x2值(附表7)进行统计 推断。当44-1=3时,查附表,得x0=134.因为HCc>x20y,P<00,表明 用4种剂量的大白鼠耻骨间隙宽度的增加量差异极显著 5、多个样本的两两比较列出两两比较表(表118)。 表11-84种剂量大白鼠耻骨间隙宽度增加量秩和两两比较 比较差数R-R秩次距kS-8q值临界q值检验结果 a=0.05a=0.01 (2) (3) (4) (5) (6) (7) (8) 1与 13.22884.84 4.40 与3 10.00005.20 3.324.12 1与2 2 6.77005.02 2.773.64 2与4 10.00002. 3.32 4.12 2与3 2 6.7700266 2.77 3.64 6.7700 1.77 2.7 3.64 用表117中相应的秩和R栏求秩和差数R-R,见第(2)栏:确定秩次距k,例如1 与4的比较,其秩和差数64范围内有4个处理,k=4;1与3的比较,其秩和差数52范围 内有3个处理,k=3,余此类推,见第(3)栏。利用(1l-4)式计算各秩和差异标准误S=R k=4 5(5×4)(5×4+1) 13.2288 12 55×35×3+1)=10000 12 5(5×2)(5×2+1) =6.7700 见第(4)栏。用(11-3)式计算q值,即(2(4)得(5)栏。然后根据∞和k查临界q值, 列于第(6)、(7)栏。当q<1者,差异必不显著,该行的临界q值不必列出。最后将各q 值与相应的临界q值比较,作出统计推断。检验结果表明:第1种剂量与第2、3、4种剂量 215
215 3(20 1) 13.32 5 79 5 67 5 49 5 15 20(20 1) 12 2 2 2 2 − + = + + + + H = 而 ( − ) = (2 − 2) + (2 − 2) + (2 − 2) + (2 − 2) = 24 3 3 3 3 3 j j t t 所以 13.36 0.9970 13.32 20 20 24 1 13.32 3 = = − − HC = 4、统计推断 本例 k=4,超出附表 10(2)的范围,故用 2 值(附表 7)进行统计 推断。当 df=4-1=3 时,查附表 7,得 11.34 2 0.01(3) = 。因为 HC > 2 0.01(3) ,P<0.01,表明 用 4 种剂量的大白鼠耻骨间隙宽度的增加量差异极显著。 5、多个样本的两两比较 列出两两比较表(表 11-8)。 表 11-8 4 种剂量大白鼠耻骨间隙宽度增加量秩和两两比较 比 较 差数 Ri-Rj 秩次距 k Ri Rj S − q 值 临界 q 值 检验结果 (1) (2) (3) (4) (5) α=0.05 α=0.01 (6) (7) (8) 1 与 4 64 4 13.2288 4.84 3.63 4.40 ** 1 与 3 52 3 10.0000 5.20 3.32 4.12 ** 1 与 2 34 2 6.7700 5.02 2.77 3.64 ** 2 与 4 20 3 10.0000 2.00 3.32 4.12 ns 2 与 3 18 2 6.7700 2.66 2.77 3.64 ns 3 与 4 12 2 6.7700 1.77 2.77 3.64 ns 用表 11-7 中相应的秩和 R 栏求秩和差数 Ri − Rj ,见第(2)栏;确定秩次距 k,例如 1 与 4 的比较,其秩和差数 64 范围内有 4 个处理,k=4;1 与 3 的比较,其秩和差数 52 范围 内有 3 个处理,k=3,余此类推,见第(3)栏。利用(11-4)式计算各秩和差异标准误 Ri Rj S − : k=4 时, 13.2288 12 5(5 4)(5 4 1) 1 4 = + SR −R = k=3 时, 10.0000 12 5(5 3)(5 3 1) 1 3 = + SR −R = k=2 时, 6.7700 12 5(5 2)(5 2 1) 1 3 = + SR −R = 见第(4)栏。用(11-3)式计算 q 值,即(2)/(4)得(5)栏。然后根据 df=∞和 k 查临界 q 值, 列于第(6)、(7)栏。当 q<1 者,差异必不显著,该行的临界 q 值不必列出。最后将各 q 值与相应的临界 q 值比较,作出统计推断。检验结果表明:第 1 种剂量与第 2、3、4 种剂量
差异极显著:第2种剂量与第3、4种剂量,第3种剂量与第4种剂量差异不显著。 第三节等级相关分析 第八章所述的相关、回归分析法适用于变量为正态分布的资料。在实际工作中,经常遇 到有些资料并不呈正态分布。对于这样的资料的分析只能用非参数法。分析两个变量间是否 相关的非参数法,最常用的是等级相关分析 等级相关是一种分析x、y两个变量的等级间是否相关的方法。先按x、y两变量的大小 次序,分别由小到大编上等级(秩次),再看两个变量的等级间是否相关。等级相关程度的 大小和相关性质用等级相关系数( coefficient of rank correlation)表示。等级相关系数亦称 为秩相关系数。样本等级相关系数记为r,它是总体等级相关系数ps的估计值。等级相关 系数r3具有与相关系数r相同的特性,它的值介于-1与1之间,r为正表示正相关,r为负 表示负相关,等于零为零相关。常用的等级相关分析方法有 Spearman等级相关和 Kendall 等级相关等,本节只介绍 Spearman等级相关系数的计算及其显著性检验。其基本分析步骤 1、计算等级相关系数rs先将变量x、y分别由小到大列出等级,相邻两数相同时, 取平均等级;再求出每对等级之差d,利用(11-5)式计算等级相关系数: (11-5) n2-1) 式中,n为变量的对子数,d秩次之差。 当相同秩次较多时,会影响∑d2值,应采用(16)式计算校正的等级相关系数r;: (1x+t1)-∑ Is n -n 式中,l1、1,的计算公式相同,均为:厂>6 12 在计算t2时,l1为x变量的相同秩次数 在计算时,l为y变量的相同秩次数。 2、rs的显著性检验 (1)提出无效假设与备择假设Ho;ps=0;HA:ps≠0 (2)统计推断根据n查附表1,得临界r1a值。若;|005,不能否 定H,表明两变量x、y等级相关不显著;若r100,≤;|<r:00,001<P≤005,否定 H,接受H,表明两变量x、y等级相关显著:若|≥r10,P≤00,否定H,接受 HA,表明两变量x、y等级相关极显著。 【例11.8】研究含有必需氨基酸添加剂的某种饲料的营养价值时,用大白鼠做试验获 216
216 差异极显著;第 2 种剂量与第 3、4 种剂量,第 3 种剂量与第 4 种剂量差异不显著。 第三节 等级相关分析 第八章所述的相关、回归分析法适用于变量为正态分布的资料。在实际工作中,经常遇 到有些资料并不呈正态分布。对于这样的资料的分析只能用非参数法。分析两个变量间是否 相关的非参数法,最常用的是等级相关分析。 等级相关是一种分析 x、y 两个变量的等级间是否相关的方法。先按 x、y 两变量的大小 次序,分别由小到大编上等级(秩次),再看两个变量的等级间是否相关。等级相关程度的 大小和相关性质用等级相关系数(coefficient of rank correlation)表示。等级相关系数亦称 为秩相关系数。样本等级相关系数记为 rs,它是总体等级相关系数 S 的估计值。等级相关 系数 rs 具有与相关系数 r 相同的特性,它的值介于-1 与 1 之间,rs 为正表示正相关,rs 为负 表示负相关,rs 等于零为零相关。常用的等级相关分析方法有 Spearman 等级相关和 Kendall 等级相关等,本节只介绍 Spearman 等级相关系数的计算及其显著性检验。其基本分析步骤 是: 1、 计算等级相关系数 rs 先将变量 x、y 分别由小到大列出等级,相邻两数相同时, 取平均等级;再求出每对等级之差 d,利用(11-5)式计算等级相关系数: ( 1) 6 1 2 2 − = − n n d rs (11-5) 式中,n 为变量的对子数,d 秩次之差。 当相同秩次较多时,会影响 2 d 值,应采用(11-6)式计算校正的等级相关系数 ' s r : − − − − − + − − = x y x y s t n n t n n t t d n r 2 6 2 6 ( ) 6 3 3 3 2 3 ' (11-6) 式中, x t 、 y t 的计算公式相同,均为: − 12 3 i i t t 。在计算 x t 时, i t 为 x 变量的相同秩次数; 在计算 y t 时, i t 为 y 变量的相同秩次数。 2、rs 的显著性检验 (1)提出无效假设与备择假设 HO: S =0;HA: S ≠0 (2)统计推断 根据 n 查附表 12,得临界 s( ) r 值。若 s r < s(0.05) r ,P>0.05,不能否 定 HO,表明两变量 x、y 等级相关不显著;若 s(0.05) r ≤ s r < s(0.01) r ,0.01<P≤0.05,否定 HO,接受 HA,表明两变量 x、y 等级相关显著;若 s r ≥ s(0.01) r ,P≤0.01,否定 HO,接受 HA,表明两变量 x、y 等级相关极显著。 【例 11.8】研究含有必需氨基酸添加剂的某种饲料的营养价值时,用大白鼠做试验获