第十二章非参数统计 第二节 成组设计的两样本比校的 秩和检验 (Wilc0xon两样本比较法) 一、原始数据的两样本比较 例12.2 某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以 生存日数作为观察指标,实验结果见下表12-2。试检验两组小鼠生存 日数有无差别。 吉林大学远程教育学院
2 吉林大学远程教育学院 第十二章 非参数统计 第二节 成组设计的两样本比较的 秩和检验 (Wilcoxon两样本比较法) 一、原始数据的两样本比较 例12.2 某实验室观察局部温热治疗小鼠移植肿瘤的疗效,以 生存日数作为观察指标,实验结果见下表12-2。试检验两组小鼠生存 日数有无差别
表12-2两组小鼠发癌后生存日数比较 实验组 对照组 生存日数 秩次 生存日数 秩次 10 9.5 2 1 12 12.5 3 2 15 1515.5 4 3 15 16(15.5) 5 4 16 17 6 5 17 18 7 6 18 19 8 7 20 20 9 8 13 21 10 9.5 >90 22 11 11 12 12.5 13 14 n1=10 T=170 n2=12 T2=83 吉林大学远程教育学院
3 吉林大学远程教育学院 实验组 对照组 生存日数 秩次 生存日数 秩次 10 9.5 2 1 12 12.5 3 2 15 15(15.5) 4 3 15 16(15.5) 5 4 16 17 6 5 17 18 7 6 18 19 8 7 20 20 9 8 13 21 10 9.5 >90 22 11 11 12 12.5 13 14 n 1=10 T 1=170 n 2=12 T 2=83 表12-2 两组小鼠发癌后生存日数比较
本例为完全随机设计的两样本比较,由于实验 组的生存日数出现不确定数值(>0),故选用 Wilcoxonj两样本比较法。 本例的检验步骤如下: ①检验假设 H:两组小鼠生存日数总体分布相同 H:两组小鼠生存日数总体分布不同 0a=0.05 ②编秩先将两组数据分别由小到大排庭,再 统一由小到大编秩。相同数值取平均秩次。 见表12-2中的秩次项。 吉林大学远程教育学院
4 吉林大学远程教育学院 本例为完全随机设计的两样本比较,由于实验 组的生存日数出现不确定数值(>90),故选用 Wilcoxon两样本比较法。 H0 : 两组小鼠生存日数总体分布相同 H1 : 两组小鼠生存日数总体分布不同 本例的检验步骤如下: ① 检验假设 α= 0.05 ② 编秩 先将两组数据分别由小到大排序,再 统一由小到大编秩。相同数值取平均秩次。 见表12-2中的秩次项
③求秩和并确定检验统计量分别求每组秩 次和T1与T2。见表12-2中的下列项。 取样本例数较小组的秩和作为检验统计量T,若 例数相等,可任取一组的秩和为T。 本例n1=10较小,则T1=T=170。 ④确定P值和作出推断结论查附表9T界值 表(两样本比较的秩和检验用,n1α:T值在界值范围外,则 P<a:T值等于界值:则P=a。 吉林大学远程教育学院
5 吉林大学远程教育学院 ③ 求秩和并确定检验统计量 分别求每组秩 次和T1与T2。见表12-2中的下列项。 取样本例数较小组的秩和作为检验统计量T,若 例数相等,可任取一组的秩和为T 。 本例n1=10较小,则 T1= T =170。 ④ 确定P值和作出推断结论 查附表9 T界值 表(两样本比较的秩和检验用, n1<n2 )[Tα(n1, n2-n1), α为检验水准,n1为样本例数较小者, n2–n1 为两组例数差]。若检验统计量T值在界值 范围内,则P >α;T值在界值范围外,则 P <α;T值等于界值;则P =α
本例Tal,2n=T0.05102-84-146,而T= 170在界值范围外,故P<0.05,按a= 0.05水准拒绝H。认为实验组生存日数较 对照组长。 二、正态近似法 若n1或n2一n1超出附表9T界值表(两样本比较的秩和 检验里,1<2)的范围,可按下式进行近似的u检验。 T-(n+n2+1)/2-0.5 公式(12.3) √nn2(%,+n2+1)/12 吉林大学远程教育学院
6 吉林大学远程教育学院 二、正态近似法 若n1或n2–n1超出附表9 T界值表(两样本比较的秩和 检验用, n1<n2 )的范围,可按下式进行近似的u 检验。 本例Tα(n1, n2-n1) =T0.05(10,2)=84-146,而T= 170在界值范围外,故P < 0.05,按α= 0.05水准拒绝H0。认为实验组生存日数较 对照组长。 ( 1)/12 ( 1)/ 2 0.5 1 2 1 2 1 1 1 2 + + − + + − = n n n n T n n n u 公式(12.3)
式中0.5为连续性校正系数。 当相同的秩次较多时,用公式(12.3)求得的u值偏 小,应改用下式校正。 u。=u/√C 公式(12.4) C=1-∑G-,w3-N N=n+n 式中t为第(j=1,2,3,.)个相同秩次的个数。计算 方法与Wilcoxoni配对法相同。 三、频数表资料的两样本比较 吉林大学远程教育学院
7 吉林大学远程教育学院 式中0.5 为连续性校正系数。 当相同的秩次较多时,用公式(12.3)求得的u值偏 小,应改用下式校正。 uc = u / C 公式(12.4) C = −(t −t ) (N − N) j j 3 3 1 / N = n1 + n2 式中t j为第j ( j = 1, 2, 3, …)个相同秩次的个数。计算 方法与Wilcoxon配对法相同。 三、频数表资料的两样本比较
例12.3 某研究者为比较不同肝炎婴儿的血清总胆红质有无差 别,收集了一般组和重症组病人的血清总胆红质数据见下表12-3。 问两组婴儿的血清总胆红质有无统计学意义。 表12-3两组肝炎婴儿的血清总胆红质分析表 总胆红质 人数 秩次范围平均秩次 秩和 (mg%) 般组重症组 合计 累计 般组 重症组 (1 (2) (3) (4 (4)a (5) (6 (7=(2)?6)(8)=(3)?6) <1 4 4 14 2.5 10 0 1 11 11 15 5-15 10 110 0 5 15 2 17 32 16-32 24 360 48 10 10 10 2 3342 37.5 0 375 15 1 1 43 43 43 0 43 20 4 4 47 4447 45.5 0 182 25 2 2 49 48-49 48.5 0 97 合计 n2=30n1=19 49 T2=480T=745 8 吉林大学远程教育学院
8 吉林大学远程教育学院 例12.3 某研究者为比较不同肝炎婴儿的血清总胆红质有无差 别,收集了一般组和重症组病人的血清总胆红质数据见下表12-3。 问两组婴儿的血清总胆红质有无统计学意义。 总胆红质 (mg%) 一般组 重症组 合计 累计 一般组 重症组 (1) (2) (3) (4) (4)a (5) (6) (7)=(2)?6) (8)=(3)?6) <1 4 4 4 1~4 2.5 10 0 1~ 11 11 15 5~15 10 110 0 5~ 15 2 17 32 16~32 24 360 48 10~ 10 10 42 33~42 37.5 0 375 15~ 1 1 43 43 43 0 43 20~ 4 4 47 44~47 45.5 0 182 25~ 2 2 49 48~49 48.5 0 97 合计 n 2=30 n 1=19 49 T 2=480 T 1=745 表12-3 两组肝炎婴儿的血清总胆红质分析表 人数 秩次范围 平均秩次 秩和
本例的检验步骤如下: ①检验假设 H。:两组肝炎婴儿的血清总胆红质总体含量分布相同 H1:两组肝炎婴儿的血清总胆红质总体含量分布不同 a=0.05 平均秩次=(秩次范围下限+秩次范围上限)/2 ②编秩先计算两组合计人数,见表12-3中的 (4),再确定各组段秩次范围,见表12-3中的⑤) 然后计算各组段平均秩次。见表12-3中的6)。 ③求秩和用各组段的平均秩次分别与每组的人 数相乘,可得每组在各组段的秩和,再将各组段的 秩和相加即得每组的秩和。见表12-3中的),8)。 吉林大学远程教育学院
9 吉林大学远程教育学院 本例的检验步骤如下: ① 检验假设 ② 编秩 先计算两组合计人数,见表12-3中的 (4) ,再确定各组段秩次范围,见表12-3中的(5) , 然后计算各组段平均秩次。见表12-3中的(6) 。 H0 : 两组肝炎婴儿的血清总胆红质总体含量分布相同 H1 : 两组肝炎婴儿的血清总胆红质总体含量分布不同 α= 0.05 ③ 求秩和 用各组段的平均秩次分别与每组的人 数相乘,可得每组在各组段的秩和,再将各组段的 秩和相加即得每组的秩和。见表12-3中的(7) , (8) 。 平均秩次=(秩次范围下限+秩次范围上限)/2
④计算检验统计量本例n1=19,T1-745;n2 =30,T2=480,则T=T1=745.1=19,超出附表 9T界值表范围,需用u检验公式12.3,由于 相同秩次较多,还需校正公式12④]。 745-19×(19+30+1)/2-0.5 u= =5.530 V19×30×(19+30+1)/12 C-1-ΣG-t,)/w3-N) =14-4+3-1+73-17)+0-10+4-4+-2 493-49 =0.938 u=5.530/√0.938=5.710 10 吉林大学远程教育学院
10 吉林大学远程教育学院 ④ 计算检验统计量 本例n1=19, T1=745; n2 =30, T2=480,则T=T1=745。n1=19,超出附表 9T界值表范围,需用u检验[公式(12.3)],由于 相同秩次较多,还需校正[公式(12.4)]。 5.530 19 30 (19 30 1)/12 745 19 (19 30 1)/ 2 0.5 = + + − + + − u = C = −(t −t ) (N − N) j j 3 3 1 / ( ) ( ) ( ) ( ) ( ) ( ) 49 49 4 4 11 11 17 17 10 10 4 4 2 2 1 3 3 3 3 3 3 3 − − + − + − + − + − + − = − = 0.938 uc = 5.530/ 0.938 = 5.710
⑤确定P值和作出推断结论本例4=5.710 >4o.05=1.96,则P<0.05,按a=0.05水准拒 绝H,认为两组肝炎婴儿的血清总胆红质总 体含量分布不同,重症组高于一般组。 第三节 成组设计多个样本比较的 秩和检验 (Kruskal-Vallis法) 一、原始数据的多样本比较 例12.4试推断下表12-4中三组人群的血浆总皮质醇含量 (gL)的差别有无统计学意义。 11 吉林大学远程教育学院
11 吉林大学远程教育学院 ⑤ 确定P值和作出推断结论 本例uc=5.710 >u0.05=1.96,则P <0.05,按α=0.05水准拒 绝H0,认为两组肝炎婴儿的血清总胆红质总 体含量分布不同,重症组高于一般组。 第三节 成组设计多个样本比较的 秩和检验 (Kruskal-Wallis 法) 一、原始数据的多样本比较 例12.4 试推断下表12-4中三组人群的血浆总皮质醇含量 (μg/L)的差别有无统计学意义