第10 大学精品复用若一教华女标一、型 州投A" 多家妆歌与率本表林音比教 锐
第10章 非参数秩和检验 (Nonparametric Test ) 预防医学系 1 2 课程设置 课时: 理论课: 22学时 实习课: 10学时 联系方式:预防医学系卫生统计学教研室 Tel.: 2057153 Baidu贴吧:yfyxx (讨论、答疑、作业) http://tieba.baidu.com/f?kw=yfyxx# 大学精品课程网站→教学资源→(ppt、wmv) http://eol.shzu.edu.cn/eol/jpk/course/layout/default/index.jsp?courseId=1204 2 已知总体分布类型,对 未知参数(μ、π)进行 统计推断 依赖于特定分布类 型,比较的是参数 参数统计 (parametric statistics) 非参数统计 (nonparametric statistics) 对总体的分布类 型不作任何要求 不受总体参数的影响, 比较分布或分布位置 适用范围广;可用于任何类型资料 (等级资料,或开口数据“>50mg” ) 对于符合参数统计分析条件者,采用 非参数统计分析,其检验效能较低 3 1.参数检验方法(parametric test): 在总体分布类型已知的前提下对未知总 体参数进行的检验。(如t-test, F- test, u-test) 2.非参数检验方法(nonparametric test): 不考虑总体的参数,也不考虑总体的分布,而对 总体的分布或分布位置进行检验。亦称任意分 布检验。 4 缺点:如果是精确测量的变量,并且已 知服从或者经变量转换后服从某个特定 分布(如正态分布),这时人为地将精确 测量值变成顺序的秩,将丢失部分信 息,造成检验功效(1-β)下降。 对于适合参数检验的资料,最好还是用 参数检验。 5 适用于(首选): 总体分布偏态或不明确的计量资料 等级资料 开口数据 “>50mg” 总体方差不齐 6 参数检验与非参数检验比较 参数检验 非参检验 要求资料服从 正态分布 1. 对资料的没有特殊要求,总体为偏态、 总 体 分 布 未 知 的 计 量 资 料( 尤 其 在 n50mg” 4. 总体方差不齐 检验效率高 检验效率低,容易犯第二类错误, 原因信息丧失或信息利用不足。 7 秩和检验概述 研究目的:均数或率的假设检验 资料类型:计量、计数或等级资料 基本思想:基于秩次即检验各组的平均秩是否 相等。如果经检验得各组的平均秩不相等,则 可以推论数据的分布不同,进一步可推论各分 布间分布位置发生了平移; 通过编秩,用秩次代替原始数据信息来进行检 验. 8 名词解释: 1.秩次:指将观察值由小到大按次序排 列后所编的次序号。 2.秩和:用秩次号代替原始数据后,所 得的某些秩次之和。 样本=秩次/n, 总体=n(n+1)/2 3.平均秩次: 3.秩检验:用统计量秩次及秩和进行的 检验。 9
秩检脸 果M羊大 01件个。精m 2 线用丹 茅一节影对资样普香限和松读 第二草雨年来比根的我不妆击 第三节多个年来必我的能和脸清 2影对提计静普复普将 o1584特阅 第一节飞对贵片普香桃尔检香 转到P限华由特: Ta 点T作海程表中西不维特,一藏车补 ,, 中对盖平值 n≥25 一一一飞对套片转青装水害
秩检验 第一节 配对资料符号秩和检验 第二节 两样本比较的秩和检验 第三节 多个样本比较的秩和检验 秩检验(Rank test): 一类常用的非参数统计分析方法; 基于数据的秩次与秩次之和 。 10 适用条件 1. 配对设计的计量资料,但不服从 正态分布或分布未知 2. 配对设计的等级资料 第一节 配对资料符号秩和检验 (Wilcoxon singed rank test) 11 例10-1 临床某医生研究白癜风病人的白介素(pg/ml) 在白斑部位与正常部位有无差异,调查资料如下表: 12 病人号 白斑部位 正常部位 1 40.03 88.57 2 97.13 88.00 3 80.32 123.72 4 25.32 39.03 5 19.61 24.37 6 14.50 92.75 7 49.63 121.57 8 44.56 89.76 与配对t检验的资料 有何不同? 例10-1 临床某医生研究白癜风病人的白介素(pg/ml) 在白斑部位与正常部位有无差异,调查资料如下表: 13 白癜风病人不同部位白介素IL-6指标(pg/ml) 病人号 白斑部位 正常部位 d=正常-白斑 秩次 1 40.03 88.57 48.54 6 2 97.13 88.00 -9.13 -2 3 80.32 123.72 43.40 4 4 25.32 39.03 13.71 3 5 19.61 24.37 4.76 1 6 14.50 92.75 78.25 8 7 49.63 121.57 71.94 7 8 44.56 89.76 45.20 5 合计 T+=34,T-=2 一般步骤 ⒈ 建立假设; H0:差值的总体中位数为0; H1:差值的总体中位数不为0; α=0.05。 ⒉计算统计量 ⑴ 算出各对子的代数差; ⑵ 根据差值的绝对值大小编秩; ⑶ 将秩次冠以正负号,计算正、负秩和(T+,T-); ⑷ 用不为“0”的对子数n及取绝对值小的秩和作为 统计量T 第一节 配对资料符号秩和检验 14 ⒊查表及结论 查检验界值表得到P值作出判断。 当5≤n≤25时 可查附表8的 T界值表,T 愈小,P愈小。 当T恰为附表中的界值时,P值一般都小 于表中对应的概率值。 15 当n>25时 可用正态近似法计算u值进行u检验, 当相同秩次较多时u值需进行校正。 1 / 4 0.5 ( 1)(2 1) / 24 T n n u n n n 3 1 / 4 0.5 ( 1)(2 1) ( ) 24 48 i i T n n u n n n t t 16 基本思想 如果H0成立, 即两总体无差异,在理论上的样本的正负秩和相等, 即 T值应为总秩和(T总= n(n+1)/2)的一半, 即 T=n(n+1)/4。 若T值在界值范围内,不拒绝H0,Tmin<T<Tmax 当T值在界值上或界值范围外,H0成立的概率很小,拒 绝H0 ,认为两总体分布不同 一、配对资料符号秩和检验 17 例10-1 临床某医生研究白癜风病人的白介素(pg/ml) 在白斑部位与正常部位有无差异,调查资料如下表: 18 白癜风病人不同部位白介素IL-6指标(pg/ml) 病人号 白斑部位 正常部位 d=正常-白斑 秩次 1 40.03 88.57 48.54 6 2 97.13 88.00 -9.13 -2 3 80.32 123.72 43.40 4 4 25.32 39.03 13.71 3 5 19.61 24.37 4.76 1 6 14.50 92.75 78.25 8 7 49.63 121.57 71.94 7 8 44.56 89.76 45.20 5 合计 T+=34,T-=2
c 0 慕蓉2 属本力康 含 子经4有sa听 k-ias 0m24 o00
假设检验步骤 ⒈ 建立建设: H0:差值的总体中位数=0, H1:差值的总体中位数0; =0.05 2. 首先计算每个对子的差值d,见上表第(4)列,根据8个d的绝 对值,由小到大编秩,并冠以原d的正负号,见上表第(5)列。 然后分别相加正负秩次,得到秩和 T+= 34,T- = 2取统计量: T = min(T+,T-)=T- = 2。 查附表8: P226 3. 查表及结论 n=8,查T界值表T0.05(8)=3~33,T=2落在范围外,所以 P0.05,不拒绝H0,认为指导后牙周状况无显著好转. 21 正负秩和计算表 d 频数 秩次范围 平均秩次 负秩和 正秩和 - + 总 (1) (2) (3) (4) (5) (6) (7)=(2)×(6) (8)=(3)×(6) 1 4 6 10 1-10 5.5 22 33 2 2 5 7 11-17 14.0 28 70 3 2 4 6 18-23 20.5 41 82 合计 8 15 23 T-=91,T+=185 二、 两独立样本比较的秩和检验 适用条件: 完全随机设计的两个样本比较,若不满足参数检验的应 用条件,则用本法;两个等级资料比较。 基本思想: 如果H0成立,在两样本来自分布相同的总体,两样本的 平均秩次应相等或很接近,与总的平均秩次(N+1)/2相差 较小。含量为n1样本的秩和T1应在n1(N+1)/2的左右变化。 若T值偏离此值太远,H0发生的可能性就很小。若偏离 出给定的α值所确定的范围时,即P≤α,拒绝 H0 22 例10-3 对无淋巴细胞转 移与有淋巴细胞转移的 胃癌患者,观察其生存 时间,问两组患者的生 存时间是否不同? 23 两组患者生存时间(月) 无转移 有转移 时间 时间 12 5 25 8 27 12 29 12 38 12 42 17 46 21 46 24 56 29 60 30 34 36 40 48 与独立样本t检验的 资料有何不同? T1+T2=300 总秩次=N(N+1)/2=300 平均秩无转移=162/10=16.2 平均秩有转移=138/14=9.86 24 两组患者生存时间(月) 无转移 有转移 时间 秩次 时间 秩次 12 4.5 5 1 25 10 8 2 27 11 12 4.5 29 12.5 12 4.5 38 17 12 4.5 42 19 17 7 46 20 21 8 46 21 24 9 56 23 29 12.5 60 24 30 14 34 15 36 16 40 18 48 22 n1=10 T1=162 n2=14,T2=138 1. 建立建设:H0:两总体分布相同, H1:两总体分布不同; =0.05 假设检验步骤 ⒊ 查表及结论 n=n2 -n1,查T界值表 T0.05(4)=91~159, T1 =162落在 界值范围外,所以P u0.05, P<0.05,拒绝H0,认为总体分布 不同,即健康人与气管炎病人的痰液嗜酸性粒细胞数有差别。 ⒉ 计算检验统计量:取较小样本的秩和作为检验统计 量T,T=560.5, 27
H随载三为适熙 南于春血制用制象像康,月本长0-6刮长上 00
三、多组独立样本的秩和检验(KruskalWallis 法---H检验) 适用条件: 不满参数检验的应用条件的完全随机设计的多个 样本比较 多个等级资料比较 基本思想:如果各总体分布相同,则各组混合编秩 的平均秩次应该相差不大 28 1.建立假设,确定检验水准 H0:多个总体分布相同。 H1:多个总体分布不全相同。 2.编秩:多组数据从小到大混合编秩。 注意:遇不同组相同数据,取平均秩次。 3.求各组秩和:将各组秩次相加,即Ri,i表示组号。 4.计算检验统计量: 相同秩次太多时,上式需校正。 5.确定p值,得出结论: (1)当k=3,每组例数≤5,查H界值表。 (2)k>3,ni>5,近似服从 = k – 1 的 2 分 布,查2界值表。 2 12 ( ) 3( 1) 1 i i R H N N N n 假设检验步骤 29 H 的校正与2近似 相同秩次时,H 需校正: 当 n 较大时, H 近似服从 = k – 1 的 2 分布。 故可按 2 分布获得概率 P,作出统计推断。 3 3 / 1 ( ) /( ) C j j H H C C t t N N 30 正 常 患自发性白 患移植白血 患移植白血 脾 血病的脾 病的脾(甲组) 病的脾(乙组) 含量 秩次 含量 秩次 含量 秩次 含量 秩次 (1) (2) (3) (4) (5) (6) (7) (8) 12.3 18 10.8 8 9.3 1 9.5 2 13.2 22 11.6 13 10.3 3.5 10.3 3.5 13.7 26 12.3 18 11.1 11 10.5 5 15.2 28 12.7 21 11.7 14 10.5 6 15.8 29 13.5 23 11.7 15 10.5 7 16.9 30 13.5 24 12.0 16 10.9 9 17.3 31 14.8 27 12.3 18 11.0 10 17.4 32 12.4 20 11.5 12 13.6 25 表9-6 各组鼠脾DNA含量(mg)的秩和计算 例 研究白血病时,测定四组鼠脾DNA的含量,结果列于下 表,试分析各组DNA含量有无差别? n1=8 T1=216 n2=7 T2=134 n3=9 T3=123.5 n4=8 T4=54.5 216+134+123.5+54.5=528=N(N+1)/2=(32*33)/2 秩次计算无误 31 建立假设检验 H0:四组鼠脾DNA含量的总体分布相同。 H1:四组鼠脾DNA含量的总体分布位置不全相同。 α=0.05 计算统计量 332 1 19.90 8 54.5 9 123.5 7 134 8 216 32 32 1 12 3(N 1) nT N(N 1) 12 H 2 2 2 2 i2 i 假设检验步骤 查表及结论, 现k=4,ν=k-1=4-1=3查界值表 20.05(3)=7.81, 2>20.05(3); P20.01(2); P<0.01按α=0.05水准,拒绝H0,接受H1, 故认为三组血清抗体滴度水平的差别有统计学意义。 3 3 3 3 3 3 11.36 12.27 8 8 23 23 35 35 21 21 8 8 1 96 96 Hc = = - + - + - + - + - - - 由于各组相同例数较多,故用公式(10-6)校正: 35