2015/1/9 课程设置 西石河于大学 瀑财:覆论瀑:22净财 共月绿:10学财 第10章 方式:预防医季卫生计季教 非参数秩和检脸 Tel:2057153 Nonparametric Test Baidu账七:yfd(付论.米是.作) 预防医季 wmv) 乘多款能计 l.参款检验方法(parametric test): 在恶体分布真型已知的首提极下对来知恶 0 终终杜 不失件格华生 2.非参k检验方法(nonparametric test): 不青走燕体的来放,也不贵虚惑体的分布,局对 华子等 卷体的分有或分布位夏进什检脸。亦称任意分 布检脸。 检林格件计蚊 4 ■ 肤点:是精项测量的史量,并且巴 →通用于(普选): 知服从或者经支量转换后服从个特定 >慝体分有偏春或不明项的计量资料 分布(如正春分布),这财人为地将着确 创量值支成顺李的税,将善炎部分信息 上开口散海 >50mg 造成检脸功数β)下降。 ~善体方业不齐 ,对于通合泉散检脸的脊拼,最赶还是用 鼻戴检验
2015/1/9 1 第10章 非参数秩和检验 (Nonparametric Test ) 预防医学系 1 2 课程设置 课时: 理论课: 22学时 实习课: 10学时 联系方式:预防医学系卫生统计学教研室 Tel.: 2057153 Baidu贴吧:yfyxx (讨论、答疑、作业) http://tieba.baidu.com/f?kw=yfyxx# 大学精品课程网站→教学资源→(ppt、wmv) http://eol.shzu.edu.cn/eol/jpk/course/layout/default/index.jsp?courseId=1204 2 已知总体分布类型,对 未知参数(μ、π)进行 统计推断 依赖于特定分布类 型,比较的是参数 参数统计 (parametric statistics) 非参数统计 (nonparametric statistics) 对总体的分布类 型不作任何要求 不受总体参数的影响, 比较分布或分布位置 适用范围广;可用于任何类型资料 (等级资料,或开口数据“>50mg” ) 对于符合参数统计分析条件者,采用 非参数统计分析,其检验效能较低 3 1.参数检验方法(parametric test): 在总体分布类型已知的前提下对未知总 体参数进行的检验。(如t-test, F- test, u-test) 2.非参数检验方法(nonparametric test): 不考虑总体的参数,也不考虑总体的分布,而对 总体的分布或分布位置进行检验。亦称任意分 布检验。 4 缺点:如果是精确测量的变量,并且已 知服从或者经变量转换后服从某个特定 分布(如正态分布),这时人为地将精确 测量值变成顺序的秩,将丢失部分信息, 造成检验功效(1-β)下降。 对于适合参数检验的资料,最好还是用 参数检验。 5 适用于(首选): 总体分布偏态或不明确的计量资料 等级资料 开口数据 “>50mg” 总体方差不齐 6
2015/1/9 参款检脸与非多教检脸比龄 秩和检脸概述 永最松脸 非水检脸 票来路意:于秋汝即松本粗白平物执火西 2。 3事技特体提0 有同分有位夏发生丁平巷) 华。惠体中盖不来 妆融敞平高 秩检验 名词解释: 铁检脸Rank test): 一真青用的非泉款晚计分斯方法; 盖于数蜂的教次与教次之和。 枰本=赖火n, 第一节 配对资料符号秩和检脸 落体=n(+1)/2 ■3.平均粮次 第二节两样本比粮的秩和检脸 ■3检脸: 用统计壹火反和进行的 第三节多个本比的和检脸 检脸。 葛一节彩对瓷料符号铁不检融 (Wilcoxon singed rank test) 高人号血 透用春件 97.13 8.00 1.配对设计的计量并,但不从 8032 123.7 正态分布或分布未知 2h961 14.50 92.75 2.影对设计的普资料 8 49.63 44.56 2
2015/1/9 2 参数检验与非参数检验比较 参数检验 非参检验 要求资料服从 正态分布 1. 对资料的没有特殊要求,总体为偏态、 总 体分布未 知的计量 资料( 尤其 在 n50mg” 4. 总体方差不齐 检验效率高 检验效率低,容易犯第二类错误, 原因信息丧失或信息利用不足。 7 秩和检验概述 研究目的:均数或率的假设检验 资料类型:计量、计数或等级资料 基本思想:基于秩次即检验各组的平均秩是否 相等。如果经检验得各组的平均秩不相等,则 可以推论数据的分布不同,进一步可推论各分 布间分布位置发生了平移; 通过编秩,用秩次代替原始数据信息来进行检 验. 8 名词解释: 1.秩次:指将观察值由小到大按次序排 列后所编的次序号。 2.秩和:用秩次号代替原始数据后,所 得的某些秩次之和。 样本=秩次/n, 总体=n(n+1)/2 3.平均秩次: 3.秩检验:用统计量秩次及秩和进行的 检验。 9 秩检验 第一节 配对资料符号秩和检验 第二节 两样本比较的秩和检验 第三节 多个样本比较的秩和检验 秩检验(Rank test): 一类常用的非参数统计分析方法; 基于数据的秩次与秩次之和 。 10 适用条件 1. 配对设计的计量资料,但不服从 正态分布或分布未知 2. 配对设计的等级资料 第一节 配对资料符号秩和检验 (Wilcoxon singed rank test) 11 例10-1 临床某医生研究白癜风病人的白介素(pg/ml) 在白斑部位与正常部位有无差异,调查资料如下表: 12 病人号 白斑部位 正常部位 1 40.03 88.57 2 97.13 88.00 3 80.32 123.72 4 25.32 39.03 5 19.61 24.37 6 14.50 92.75 7 49.63 121.57 8 44.56 89.76 与配对t检验的资料 有何不同?
2015/1/9 以01特鑫量◆特在有绕个的4食持企 第一节配对资料符号秩和检脸 一板步原 。走立纸设 40.03 8a.5 48.54 6 2 005 532 39.03 371 3 2计养能计量 19.61 24.37 4.76 49.63 12157 4456 89.76 总忍, 45.205 能计量丁 n>25时 者5<n<25财 4=Z-aa+)/4-05 √n+12n+I)/24 可查附表8的T界值表,T念小,P意小。 当T恰为附表中的界值财,P值一服都小 于表中对虚的机平值。 F-ma+/4-05 48 一、配对资料符号秩和检脸 姜本思想 H业 40.03 885 48.54 (Ts-n(n+l/2) 2 97.1 68.00 2 nin+1)/4 2532 5 196 2437 4.76 1 T春,不,T<T<T 140 7825 44.56 8976 4520 5 合计
2015/1/9 3 例10-1 临床某医生研究白癜风病人的白介素(pg/ml) 在白斑部位与正常部位有无差异,调查资料如下表: 13 白癜风病人不同部位白介素IL-6指标(pg/ml) 病人号 白斑部位 正常部位 d=正常-白斑 秩次 1 40.03 88.57 48.54 6 2 97.13 88.00 -9.13 -2 3 80.32 123.72 43.40 4 4 25.32 39.03 13.71 3 5 19.61 24.37 4.76 1 6 14.50 92.75 78.25 8 7 49.63 121.57 71.94 7 8 44.56 89.76 45.20 5 合计 T+=34,T-=2 一般步骤 ⒈ 建立假设; H0:差值的总体中位数为0; H1:差值的总体中位数不为0; α=0.05。 ⒉计算统计量 ⑴ 算出各对子的代数差; ⑵ 根据差值的绝对值大小编秩; ⑶ 将秩次冠以正负号,计算正、负秩和(T+,T- ); ⑷ 用不为“0”的对子数n及取绝对值小的秩和作为 统计量T 第一节 配对资料符号秩和检验 14 ⒊查表及结论 查检验界值表得到P值作出判断。 当5≤n≤25时 可查附表8的 T界值表,T 愈小,P愈小。 当T恰为附表中的界值时,P值一般都小 于表中对应的概率值。 15 当n>25时 可用正态近似法计算u值进行u检验, 当相同秩次较多时u值需进行校正。 1 / 4 0.5 ( 1)(2 1) / 24 T n n u n n n 3 1 / 4 0.5 ( 1)(2 1) ( ) 24 48 i i T n n u n n n t t 16 基本思想 如果H0成立, 即两总体无差异,在理论上的样本的正负秩和相等, 即 T值应为总秩和(T总= n(n+1)/2)的一半, 即 T=n(n+1)/4。 若T值在界值范围内,不拒绝H0,Tmin<T<Tmax 当T值在界值上或界值范围外,H0成立的概率很小,拒 绝H0,认为两总体分布不同 一、配对资料符号秩和检验 17 例10-1 临床某医生研究白癜风病人的白介素(pg/ml) 在白斑部位与正常部位有无差异,调查资料如下表: 18 白癜风病人不同部位白介素IL-6指标(pg/ml) 病人号 白斑部位 正常部位 d=正常-白斑 秩次 1 40.03 88.57 48.54 6 2 97.13 88.00 -9.13 -2 3 80.32 123.72 43.40 4 4 25.32 39.03 13.71 3 5 19.61 24.37 4.76 1 6 14.50 92.75 78.25 8 7 49.63 121.57 71.94 7 8 44.56 89.76 45.20 5 合计 T+=34,T-=2
2015/1/9 假设检脸步康 二N02*28A时AAA5补人 青符良每选时口童卫业日辑,6个A垂,香周情视每特崔成 1走立减最: 以,是准的是集中位整=0 片:是值的悬体中鱼装01a=0.05 个表仔成香口唐五生用拔6个月后香周情流的文化痕成 史化对燕的奇最 2地计 报设险步废 ”三、百狄立杯本比被的秋和检食 9o0e防 说用香种: 克会藏制最计的雨个拆来比民,著不满无永最盐套的虚 眉春种,则用本债:而个普根费并比根, d 本每: 山品化成止,在局年本来有会车和周的落体,西诉本的 ” T91.T4w185 时103对无感巴南意利 22 青的 存对是香不 T+T2-300 善灰=N0N+1/2=300 45 平地酰元0=16210=16.2 平-1384-9.86 n-0T,16 4
2015/1/9 4 假设检验步骤 ⒈ 建立建设: H0:差值的总体中位数=0, H1:差值的总体中位数0; =0.05 2. 首先计算每个对子的差值d,见上表第(4)列,根据8个d的绝 对值,由小到大编秩,并冠以原d的正负号,见上表第(5)列。 然后分别相加正负秩次,得到秩和 T+= 34,T-= 2取统计量: T = min(T+,T-)=T-= 2。 查附表8: P226 3. 查表及结论 n=8,查T界值表T0.05(8)=3~33,T=2落在范围外,所以 P0.05,不拒绝H0,认为指导后牙周状况无显著好转. 21 正负秩和计算表 d 频数 秩次范围 平均秩次 负秩和 正秩和 - + 总 (1) (2) (3) (4) (5) (6) (7)=(2)×(6) (8)=(3)×(6) 1 4 6 10 1-10 5.5 22 33 2 2 5 7 11-17 14.0 28 70 3 2 4 6 18-23 20.5 41 82 合计 8 15 23 T-=91,T+=185 二、 两独立样本比较的秩和检验 适用条件: 完全随机设计的两个样本比较,若不满足参数检验的应 用条件,则用本法;两个等级资料比较。 基本思想: 如果H0成立,在两样本来自分布相同的总体,两样本的 平均秩次应相等或很接近,与总的平均秩次(N+1)/2相差 较小。含量为n1样本的秩和T1应在n1 (N+1)/2的左右变化。 若T值偏离此值太远,H0发生的可能性就很小。若偏离 出给定的α值所确定的范围时,即P≤α,拒绝 H0 22 例10-3 对无淋巴细胞转 移与有淋巴细胞转移的 胃癌患者,观察其生存 时间,问两组患者的生 存时间是否不同? 23 两组患者生存时间(月) 无转移 有转移 时间 时间 12 5 25 8 27 12 29 12 38 12 42 17 46 21 46 24 56 29 60 30 34 36 40 48 与独立样本t检验的 资料有何不同? T1+T2=300 总秩次=N(N+1)/2=300 平均秩无转移=162/10=16.2 平均秩有转移=138/14=9.86 24 两组患者生存时间(月) 无转移 有转移 时间 秩次 时间 秩次 12 4.5 5 1 25 10 8 2 27 11 12 4.5 29 12.5 12 4.5 38 17 12 4.5 42 19 17 7 46 20 21 8 46 21 24 9 56 23 29 12.5 60 24 30 14 34 15 36 16 40 18 48 22 n1=10 T1=162 n2=14,T2=138
2015/1/9 服设检脸步康 制10-4盖季 片:两善体分幸不同) a=0.05 总长的侧量值(仪10),同使康人与便性气警夹病 2.计算能计 人淡嗜破性燕幅胞散者无黑善是到? 着西个杯本由小别大的痛李航一临火,款值和普财 万-i162, 来样基量有鑫4◆2 3套表夏地论 ■ 【生 am0.05 圣计动什去水小华水后秋华活他计 不腾妆脸的应用条件的金威机设计的多个 k-w+-05 坪木此般 =36 0-可w--z- 柔%06收收建 H的校正与X2近似 H=HIC C=1-∑G-)w3-N ▣声n大财,H近服从V=k-1的分有:
2015/1/9 5 1. 建立建设:H0:两总体分布相同, H1:两总体分布不同; =0.05 假设检验步骤 ⒊ 查表及结论 n=n2 -n1,查T界值表 T0.05(4)=91~159, T1 =162落 在界值范围外,所以P u0.05, P<0.05,拒绝H0,认为总体分布 不同,即健康人与气管炎病人的痰液嗜酸性粒细胞数有差别。 ⒉ 计算检验统计量:取较小样本的秩和作为检验统计 量T,T=560.5, 27 三、多组独立样本的秩和检验(KruskalWallis 法---H检验) 适用条件: 不满参数检验的应用条件的完全随机设计的多个 样本比较 多个等级资料比较 基本思想:如果各总体分布相同,则各组混合编秩 的平均秩次应该相差不大 28 1.建立假设,确定检验水准 H0:多个总体分布相同。 H1:多个总体分布不全相同。 2.编秩:多组数据从小到大混合编秩。 注意:遇不同组相同数据,取平均秩次。 3.求各组秩和:将各组秩次相加,即Ri,i表示组号。 4.计算检验统计量: 相同秩次太多时,上式需校正。 5.确定p值,得出结论: (1)当k=3,每组例数≤5,查H界值表。 (2)k>3,ni>5,近似服从 = k – 1 的 2 分布, 查 2界值表。 2 12 ( ) 3( 1) 1 i i R H N N N n 假设检验步骤 29 H 的校正与 2近似 相同秩次时,H 需校正: 当 n 较大时, H 近似服从 = k – 1 的 2 分布。 故可按 2 分布获得概率 P,作出统计推断。 3 3 / 1 ( ) /( ) C j j H H C C t t N N 30
2015/1/9 餐设检脸步康 度立银设“险 ■H。:四氯流脾DNA古量的悬体分有湘同, ▣H:四散氟碑DNA合量的系体分有位里不金和两。 ·a=0.05 计算晚计量 H是-3N 2,受.2g2,4}302小-90 -1=H-3女量4 35m=T4=545 216+134+123.5升54.5=528-N0N+/2-B233)/2铁灰计养无播 ”06T来之发视有省不丙瓷是免我21天后么情我体情 假设检脸步康 度水平测变结暴,同各氢洞的鱼清战体浦度水平之同是界 是香有脱计争意义2 度的分 食相同。 100亿7 ■4=0.05 计算能计量 12 计2 =6627+4管,9)-306+=1.36 1276.514681912.6 套表及地冷 现k=3,y=k1=31=2 6
2015/1/9 6 正 常 患自发性白 患移植白血 患移植白血 脾 血病的脾 病的脾(甲组) 病的脾(乙组) 含量 秩次 含量 秩次 含量 秩次 含量 秩次 (1) (2) (3) (4) (5) (6) (7) (8) 12.3 18 10.8 8 9.3 1 9.5 2 13.2 22 11.6 13 10.3 3.5 10.3 3.5 13.7 26 12.3 18 11.1 11 10.5 5 15.2 28 12.7 21 11.7 14 10.5 6 15.8 29 13.5 23 11.7 15 10.5 7 16.9 30 13.5 24 12.0 16 10.9 9 17.3 31 14.8 27 12.3 18 11.0 10 17.4 32 12.4 20 11.5 12 13.6 25 表9-6 各组鼠脾DNA含量(mg)的秩和计算 例 研究白血病时,测定四组鼠脾DNA的含量,结果列于下表, 试分析各组DNA含量有无差别? n1=8 T1=216 n2=7 T2=134 n3=9 T3=123.5 n4=8 T4=54.5 216+134+123.5+54.5=528=N(N+1)/2=(32*33)/2 秩次计算无误 31 建立假设检验 H0:四组鼠脾DNA含量的总体分布相同。 H1:四组鼠脾DNA含量的总体分布位置不全相同。 α=0.05 计算统计量 332 1 19.90 8 54.5 9 123.5 7 134 8 216 32 32 1 12 3(N 1) n T N(N 1) 12 H 2 2 2 2 i 2 i 假设检验步骤 查表及结论, 现k=4,ν=k-1=4-1=3查界值表 2 0.05(3)=7.81, 2> 2 0.05(3); P 2 0.01(2); P<0.01按α=0.05水准,拒绝H0,接受H1, 故认为三组血清抗体滴度水平的差别有统计学意义。 3 3 3 3 3 3 11.36 12.27 8 8 23 23 35 35 21 21 8 8 1 96 96 H c = = - + - + - + - + - - - 由于各组相同例数较多,故用公式(10-6)校正: 35