第六章 非参数统计分析方法 Dr.字传华制作 医 生《医学统计学
Dr. 宇传华 制作 医疗等本科生《医学统计学》 第六章 非参数统计分析方法
参数统计 非参数统计 (parametric statistics) (nonparametric statistics 已知总体分布类型,对 对总体的分布类 未知参数(μ、π)进 型不作任何要求 行统计推断 不受总体参数的影响, 依赖于特定分布类 比较分布或分布位置 型,比较的是参数 适用范围广;可用于任何类型 资料(等级资料,或“>50mg” ●。。 对于符合参数统计分析条件者,采用 非参数统计分析美捡验效能较低 修大学卫生统结学数研室2021年月21日
第四军医大学卫生统计学教研室 2021年2月21日 已知总体分布类型,对 未知参数(μ、π)进 行统计推断 依赖于特定分布类 型,比较的是参数 参数统计 (parametric statistics) 非参数统计 (nonparametric statistics) 对总体的分布类 型不作任何要求 不受总体参数的影响, 比较分布或分布位置 适用范围广;可用于任何类型 资料(等级资料,或“>50mg” ) 对于符合参数统计分析条件者,采用 非参数统计分析,其检验效能较低
秩和检验 秩和检验( rank sum test):一类常用 的非参数统计分析方法;基于数据的秩次与 秩次之和 第一节两独立样本差别的秩和检验 第二节配对设计资料的秩检验 第三节完全随机设计多组差别的秩和检验 第四节随机单位组设计的秩和检验 军大学卫生侯针研室2021年2月21日
第四军医大学卫生统计学教研室 2021年2月21日 秩和检验 第一节 两独立样本差别的秩和检验 第二节 配对设计资料的秩检验 第三节 完全随机设计多组差别的秩和检验 第四节 随机单位组设计的秩和检验 秩和检验(rank sum test):一类常用 的非参数统计分析方法;基于数据的秩次与 秩次之和
第一节两独立样本差别的秩和检验 Wilcoxon rank sum test 表6-1两独立样本秩和检验计算表 对于计量数据,如果资料方差相 A样本 B样本 等,且服从正态分布,就可以用t检 口■m 观察值:秩号::观察值:秩号 验比较两样本均数 如果此假定不成立或不能确定是 否成立,就应采用秩和检验来分析 两样本是否来自同一总体。 22 u"“ 36 假定:两组样本的总体分布形状相同 如果两 基本思想 48 总体分→两样本来自同一总体 20 布相同 98 39:12 任一组秩和不应太大或太小 n=8秩和"28秩和与平均秩和n(1+N)/2应相差不大 R1=89 R2=47 小例数组的秩和n1≠n2 NFn,+n2 no=mn(ni, n2) 大卫生程2021年2月21日
第四军医大学卫生统计学教研室 2021年2月21日 第一节 两独立样本差别的秩和检验 Wilcoxon rank sum test 对于计量数据,如果资料方差相 等,且服从正态分布,就可以用t检 验比较两样本均数。 如果此假定不成立或不能确定是 否成立,就应采用秩和检验来分析 两样本是否来自同一总体。 表6-1 两独立样本秩和检验计算表 A样本 B样本 观察值 秩号 观察值 秩号 7 4 3 1 14 6 5 2 22 10 6 3 36 11 10 5 40 13 17 7 48 14 18 8 63 15 20 9 98 16 39 12 n1=8 秩和 R1=89 n2=8 秩和 R2=47 基本思想 两样本来自同一总体 任一组秩和不应太大或太小 如果两 总体分 布相同 假定:两组样本的总体分布形状相同 T 与平均秩和 n0 (1+ N)/ 2 应相差不大 = = 1 2 1 2 1 2 min( , ), , R R n n n n T 较小例数组的秩和 min( , ) 0 1 2 1 2 n n n N n n = = +
(2)H0:两样本来自相同总体;H1:两样本来自不同总体(双侧) a0.05 或H1:样本A高于样本B(单侧) (2)编秩:两样本混合编秩次,求得R1、R2 相同观察值(即相同秩,ies),不同组--平均秩次 (3)确定P值作结论: ①查表法(m≤10,n2-n1≤10)查附表9 如果7位于检验界值区间内,P>a,不拒绝H0;否则,P≤O,拒绝H 本例T=47,取α=0.05,查附表9得双侧检验界值区间(49,87),T位 于区间外,P(0.05,因此在a=0.05的水平上,拒绝历,接受团 ②正态近似法: T-n(N+1)/2 本例u=2.205>1052=1.96 n1n2(N+1)/12 乙校正公式(当相同秩次较多时 N-N ll=×C,C t为第i个相同秩号的数据个数 军大学卫生外室2021年2月21日
第四军医大学卫生统计学教研室 2021年2月21日 ⑴ H0:两样本来自相同总体; H1:两样本来自不同总体(双侧) =0.05 或H1:样本A高于样本B(单侧) ⑵ 编秩:两样本混合编秩次,求得R1、R2、T。 相同观察值(即相同秩,ties),不同组------平均秩次。 ⑶ 确定P值作结论: ①查表法(n0≤10,n2−n1≤10) 查附表9 如果T位于检验界值区间内, ,不拒绝H0;否则, ,拒绝H0 本例T =47,取α=0.05,查附表9得双侧检验界值区间(49,87),T位 于区间外,P<0.05,因此在α=0.05的水平上,拒绝H0,接受H1。 ②正态近似法: ( 1)/12 | ( 1)/ 2 | 1 2 0 + − + = n n N T n N u *校正公式(当相同秩次较多时) t 为第i个相同秩号的数据个数 N N t t N N u u c c i i i i c ; ( ) ; 3 3 3 − − − − = = P P 本例u = 2.205 0.05/ 2 =1.96
表6-2某药对两种不同病情的支气管炎疗效的秩和检验 疗效单纯型单纯型合 秩和 并肺气肿合计(t 秩号范围平均秩次 (3)=(1)+(2) 单纯型合并肺气肿 (6)=(1)(5)(7)=(2)(5 控制65 42 107 1-107 54 3510 2268 显效18 6 24 108-131119.5 2151 有效 53 132-184 4740 3634 近控13 11 24 185-208196.5 2554.5 2161.5 126 12955.5 8780.5 编号 病情 疗效 1 单纯型 控制 1:两组疗效相同;:两组疗效不同, 取a=0.05 单纯型合并肺气肿 显效 单纯型合并肺气肿 有效 2.编秩,求各组秩和7;本例7=8780.5 单纯型 控制u-、1068202891212 87805-82(208+1)/2 0.4986 206 单纯型 显效 2083-208 207 单纯型合并肺气肿 有效 208-208-(107-107)+(24-24)+(53-53)+(24124) 单纯型 近控 =1083 208 大学卫生结?教至2021年2月21日
第四军医大学卫生统计学教研室 2021年2月21日 表6-2 某药对两种不同病情的支气管炎疗效的秩和检验 疗效 单纯型 (1) 单纯型合 并肺气肿 (2) 合计(ti) (3)=(1)+(2) 秩号范围 (4) 平均秩次 (5) 秩和 单纯型 (6)=(1)(5) 合并肺气肿 (7)=(2)(5) 控制 65 42 107 1-107 54 3510 2268 显效 18 6 24 108-131 119.5 2151 717 有效 30 23 53 132-184 158 4740 3634 近控 13 11 24 185-208 196.5 2554.5 2161.5 126 82 12955.5 8780.5 编号 病情 疗效 1 单纯型 控制 2 单纯型合并肺气肿 显效 3 单纯型合并肺气肿 有效 4 单纯型 控制 … … … 206 单纯型 显效 207 单纯型合并肺气肿 有效 208 单纯型 近控 1.H0:两组疗效相同;H1:两组疗效不同, 取α=0.05 2.编秩,求各组秩和T;本例T =8780.5 0.4986 126 82(208 1)/12 | 8780.5 82(208 1)/ 2 | = + − + u = 1.0883 208 208 ((107 107) (24 24) (53 53) (24 24)) 208 208 3 3 3 3 3 3 = − − − + − + − + − − c = uc = uc = 0.5426
附表9的来历?设第一组“x”,n=3;第二组“A”,(6 20 秩次 秩和 l:2:3:4:5:6:T界值 概率P ×××△ΔΔ:6120=0.05 若 1<6 P=0.05 X:X:△:×:Δ △ 0.05 (单侧) """■"""""""",""""■""""·■"·""·"""""""·""""·""""·■ ::△:△:X:△ ··"""■ 4}8:0.05×2=010:若7≤7, :△::×:△:△ :P=0.05+0.05 neUEDEEDED L :×:△:△:△:× 0.10 (单侧) :×氵Δ氵9氵0.05×3=0.15 △X::×:Δ:△ 军大学卫生侯针研室2021年2月21日
第四军医大学卫生统计学教研室 2021年2月21日 附表9的来历? 设第一组“×” ,n1=3;第二组“∆” , n2=3 若 T≤6 , P=0.05 (单侧) 若T≤7, P=0.05+0.05 =0.10 (单侧) 20 3 6 = 秩 次 秩和 概率P 1 2 3 4 5 6 T界值 × × × 6 × × × 7 0.05 × × × 8 0.05×2=0.10 × × × × × × × × × 9 0.05×3=0.15 × × × 1 20 = 0.05
附表9的来历?设第一组“X”,n3第二组“A”,n2/20 秩次 秩和 若T≥15 l:2:3:4:5:6:T界值 概率P P=0.05 (单侧) :△:△:△:×: T>14 △×:Ax氵Δ:×:12氵0.05×3=0.15P=0.05+0.05 △Δ:×:×:X:△ 0.10 (单侧) △:X:Δ:△:x: 13:0.05×2=0.10 △△:x:x:△:x 对应于单 ·}…"…"""“【""”"“”"”哈 是m 侧0.05或双 △△×::×::14 0.05 侧0.10, △△△:×:×: 120=0.05 临界值为 6和 倍大学卫生统结研室2021年2月21日
第四军医大学卫生统计学教研室 2021年2月21日 附表9的来历? 设第一组“×” ,n1=3;第二组“∆” ,n2=3 若 T≥15 , P=0.05 (单侧) T≥14 , P=0.05+0.05 =0.10 (单侧) 对应于单 侧0.05或双 侧0.10, 临界值为 6和15 20 3 6 = 秩 次 秩和 概率P 1 2 3 4 5 6 T界值 × × × × × × 12 0.05×3=0.15 × × × × × × 13 0.05×2=0.10 × × × × × × 14 0.05 × × × 15 1 20 = 0.05
Wilcoxon mann- Whitney u检验 一般文献上使用的方法: Wilcoxon Mann Whitney U检验 两种方法是独立提出的,检验结果完全等价的; 前者用T统计量计算u统计量,而后者直接计算u值,即 n=mimn+(n1+1)-R1,n1n,+n2(m2+1)-R2) 上例中: 126×127 82×83 min(126×82+ 2955.5,126×82+ 87805) =49545804986 军大学卫生侯针研室2021年2月21日
第四军医大学卫生统计学教研室 2021年2月21日 Wilcoxon-Mann-Whitney U检验 一般文献上使用的方法:Wilcoxon_Mann_Whitney U 检验 两种方法是独立提出的,检验结果完全等价的; 前者用 T 统计量计算 u 统计量,而后者直接计算 u 值,即: ) 2 ( 1) , 2 ( 1) min( 2 2 2 1 1 2 1 1 1 2 R n n R n n n n u n n − + − + + = + 上例中: 4954.5 0.4986 8780.5) 2 82 83 12955.5,126 82 2 126 127 min(126 82 = − − + u = +
第二节配对设计资料的秩检验 (Wilcoxon signed rank test) 表6-3家兔皮肤损伤程度(评分) 家兔号A照射B照射A-B秩次1.场:差值的总体中位数=0, H:差值的总体中位数≠0;a=0.05 2 42 54 55 9…3…3 2.求差值;依其绝对值从小到大编秩次 (i)绝对值相等者(tie)取平均秩次; 55 53 (i)将差值的正负标在秩次之前; 56…7…8 45 18 11 (ii)零差值时秩次正负各半(或不参与编秩 22 5230 分别求正负秩次之和,以绝对值较小者为R值 根据统计量R确定对应的P值 10 85 10 8 32-8-6(i)小样本时,查表(附表10) 8 合计 R=10(68 )大样本时,正态近似 第色大学卫生张结研2021年2月21日
第四军医大学卫生统计学教研室 2021年2月21日 第二节 配对设计资料的秩检验 (Wilcoxon signed rank test) 家兔号 A照射 B照射 A-B 秩次 (1) (2) (3) (4) (5) 1 39 55 16 10 2 42 54 12 9 3 51 55 4 3 4 43 47 4 3 5 55 53 -2 -1 6 45 63 18 11 7 22 52 30 12 8 48 44 -4 -3 9 40 48 8 6 10 45 55 10 8 11 40 32 -8 -6 12 49 57 8 6 合计 R=10(68) 表6-3 家兔皮肤损伤程度(评分) 1.H0:差值的总体中位数=0 , H1:差值的总体中位数0; =0.05 2.求差值;依其绝对值从小到大编秩次 (i)绝对值相等者(tie)取平均秩次; (ii) 将差值的正负标在秩次之前; (iii)零差值时秩次正负各半(或不参与编秩) 3.分别求正负秩次之和,以绝对值较小者为 R 值 4.根据统计量 R 确定对应的 P 值 (i)小样本时,查表(附表 10) (ii) 大样本时,正态近似