西名阿于大学 年永我什 第九章 非参数检验 盘社 还资件技数 (Nonparametric Test A 林拉含对热 I,参戴检脸方法(parametric test) 缺点:如暴是精确测量的史量,并且已 知服从或青经史量转换后服从某个措定 体适行的检脸。 t.F-test.u-test) 分布(如正态分布),这财人为地将精 喷测量值麦成顺序的秩,将丢夫部分信 2.非参检脸方法(nonparametric 惠,造成检脸动放(1B)下降。 特 test): 对于适合象数检险的贵料,景好还是用 参检脸。 4 永教松险与非永教检脸比较 >适用于(首选) 市偏春或不明的计量资料 水款松脸 华水妆脸 4>50mg 贵款贵粉服从 开口数 之愿体方羞不东 3 4.线克送不车 检脸故平高 植终我收后授
第九章 非参数检验 (Nonparametric Test ) Nonparametric Test ) Nonparametric Test ) Nonparametric Test ) 预防医学系 芮东升 1 已知总体分布类型,对 未知参数(μ、π)进 行统计推断 依赖于特定分布类 依赖于特定分布类 依赖于特定分布类 依赖于特定分布类 型,比较的是参数 参数统计 (parametric statistics parametric statistics parametric statistics parametric statistics) 非参数统计 (nonparametric statistics nonparametric statistics nonparametric statistics nonparametric statistics) 对总体的分布类 对总体的分布类 对总体的分布类 对总体的分布类 型不作任何要求 不受总体参数的影响, 不受总体参数的影响, 不受总体参数的影响, 不受总体参数的影响, 比较分布或分布位置 比较分布或分布位置 比较分布或分布位置 比较分布或分布位置 适用范围广;可用于任何类型资料 适用范围广;可用于任何类型资料 适用范围广;可用于任何类型资料 适用范围广;可用于任何类型资料 (等级资料,或开口数据 等级资料,或开口数据 等级资料,或开口数据 等级资料,或开口数据 “>50mg” ) 对于符合参数统计分析条件者,采用 对于符合参数统计分析条件者,采用 对于符合参数统计分析条件者,采用 对于符合参数统计分析条件者,采用 对于符合参数统计分析条件者,采用 对于符合参数统计分析条件者,采用 对于符合参数统计分析条件者,采用 对于符合参数统计分析条件者,采用 非参数统计分析,其检验效能较低 非参数统计分析,其检验效能较低 非参数统计分析,其检验效能较低 非参数统计分析,其检验效能较低 非参数统计分析,其检验效能较低 非参数统计分析,其检验效能较低 非参数统计分析,其检验效能较低 非参数统计分析,其检验效能较低 2 1.参数检验方法(parametric test parametric test parametric test parametric test): 在总体分布类型已知的前提下 总体分布类型已知的前提下 总体分布类型已知的前提下 总体分布类型已知的前提下对未知总 体参数进行的检验。 体参数进行的检验。 体参数进行的检验。 体参数进行的检验。(如t-test, F- test, u-test) t-test, F- test, u-test) t-test, F- test, u-test) t-test, F- test, u-test) 2.非参数检验方法( 非参数检验方法( 非参数检验方法( 非参数检验方法(nonparametric nonparametric nonparametric nonparametric test): 不考虑总体的参数,也不考虑总体的分布 不考虑总体的参数,也不考虑总体的分布 不考虑总体的参数,也不考虑总体的分布 不考虑总体的参数,也不考虑总体的分布,而对 总体的分布或分布位置 分布或分布位置 分布或分布位置 分布或分布位置进行检验。亦称任意分 进行检验。亦称任意分 进行检验。亦称任意分 进行检验。亦称任意分 布检验。 3 �缺点:如果是精确测量的变量,并且已 缺点:如果是精确测量的变量,并且已 缺点:如果是精确测量的变量,并且已 缺点:如果是精确测量的变量,并且已 知服从或者经变量转换后服从某个特定 知服从或者经变量转换后服从某个特定 知服从或者经变量转换后服从某个特定 知服从或者经变量转换后服从某个特定 分布(如正态分布), 分布(如正态分布), 分布(如正态分布), 分布(如正态分布),这时人为地将精 这时人为地将精 这时人为地将精 这时人为地将精 确测量值变成顺序的秩,将丢失部分信 确测量值变成顺序的秩,将丢失部分信 确测量值变成顺序的秩,将丢失部分信 确测量值变成顺序的秩,将丢失部分信 息,造成检验功效( 息,造成检验功效( 息,造成检验功效( 息,造成检验功效(1-β)下降。 �对于适合参数检验的资料,最好还是用 对于适合参数检验的资料,最好还是用 对于适合参数检验的资料,最好还是用 对于适合参数检验的资料,最好还是用 参数检验。 4 �适用于(首选): �总体分布偏态或不明确的计量资料 �等级资料 �开口数据 “>50mg” �总体方差不齐 5 参数检验与非参数检验比较 参数检验 非参检验 要求资料服从 正态分布 1. 对资料的没有特殊要求,总体为偏态、 对资料的没有特殊要求,总体为偏态、 对资料的没有特殊要求,总体为偏态、 对资料的没有特殊要求,总体为偏态、 总体分布未知的计量资料(尤其在 总体分布未知的计量资料(尤其在 总体分布未知的计量资料(尤其在 总体分布未知的计量资料(尤其在 n50mg” 4. 总体方差不齐 检验效率高 检验效率低,容易犯第二类错误 检验效率低,容易犯第二类错误 检验效率低,容易犯第二类错误 检验效率低,容易犯第二类错误, 原因信息丧失或 原因信息丧失或 原因信息丧失或 原因信息丧失或信息利用不足。 6
秩不和检脸瓶述 名调解释: 研充周的:均数成率的假设检段 ·出资值山小时大楼火序 子代替原始数怒后,所 组的 布间分布位置度生丁平形】 样本=秩次/h, 县政指收。质级发代学后指美春程来行秋 悉体=n(n+1)/2 ”3.平均状次: 检:用计量秩次及秩和选行的 秩检验 第一节配对资料符号秋和检脸 (Wilcoxon singed rank test) 适用泰件 第一节 配对资料符号秩和检脸 1.配对设计的计量養料,但不服从 正态分布或分有来知 第二节两样本此较的秩和检脸 第三节多个样本比较的秩和检脸 2.配对设计的等载青料 第一节配对资料符号秩和检脸 面风满人不都台素儿-6标u/ml 00的卷体中位不0 44:56 36 45.20 计
秩和检验概述 研究目的:均数或率的假设检验 均数或率的假设检验 均数或率的假设检验 均数或率的假设检验 资料类型:计量、计数或等级资料 计量、计数或等级资料 计量、计数或等级资料 计量、计数或等级资料 基本思想:基于秩次即检验各组的 基于秩次即检验各组的 基于秩次即检验各组的 基于秩次即检验各组的平均秩是否 相等。如果经检验得各组的平均秩不相等,则 相等。如果经检验得各组的平均秩不相等,则 相等。如果经检验得各组的平均秩不相等,则 相等。如果经检验得各组的平均秩不相等,则 可以推论数据的分布不同,进一步可推论各分 可以推论数据的分布不同,进一步可推论各分 可以推论数据的分布不同,进一步可推论各分 可以推论数据的分布不同,进一步可推论各分 布间分布位置发生了平移; 布间分布位置发生了平移; 布间分布位置发生了平移; 布间分布位置发生了平移; 通过编秩,用秩次代替原始数据信息 用秩次代替原始数据信息 用秩次代替原始数据信息 用秩次代替原始数据信息来进行检 验. 7 名词解释: • 1.秩次:指将观察值由小到大按次序排 :指将观察值由小到大按次序排 :指将观察值由小到大按次序排 :指将观察值由小到大按次序排 列后所编的次序号。 列后所编的次序号。 列后所编的次序号。 列后所编的次序号。 • 2.秩和:用秩次号代替原始数据后,所 :用秩次号代替原始数据后,所 :用秩次号代替原始数据后,所 :用秩次号代替原始数据后,所 得的某些秩次之和。 得的某些秩次之和。 得的某些秩次之和。 得的某些秩次之和。 样本=秩次/n, 总体=n(n+1)/ =n(n+1)/ =n(n+1)/ =n(n+1)/2 • 3.平均秩次: • 3.秩检验:用统计量秩次及秩和进行的 :用统计量秩次及秩和进行的 :用统计量秩次及秩和进行的 :用统计量秩次及秩和进行的 检验。 8 秩检验 第一节 配对资料符号秩和检验 配对资料符号秩和检验 配对资料符号秩和检验 配对资料符号秩和检验 第二节 两样本比较的秩和检验 两样本比较的秩和检验 两样本比较的秩和检验 两样本比较的秩和检验 第三节 多个样本比较的秩和检验 多个样本比较的秩和检验 多个样本比较的秩和检验 多个样本比较的秩和检验 秩检验(Rank test ank test ank test ank test): 一类常用的非参数统计分析方法; 一类常用的非参数统计分析方法; 一类常用的非参数统计分析方法; 一类常用的非参数统计分析方法; 基于数据的秩次与秩次之和 。 9 适用条件 1. 配对设计的计量资料,但不服从 正态分布或分布未知 正态分布或分布未知 正态分布或分布未知 正态分布或分布未知 2. 配对设计的等级资料 第一节 配对资料符号秩和检验 配对资料符号秩和检验 配对资料符号秩和检验 配对资料符号秩和检验 (Wilcoxon singed rank test) 10 例9.1 临床某医生研究白癜风病人的白介素 临床某医生研究白癜风病人的白介素 临床某医生研究白癜风病人的白介素 临床某医生研究白癜风病人的白介素 IL-6水平(u/ml)在白斑部位与正常部位有无差 )在白斑部位与正常部位有无差 )在白斑部位与正常部位有无差 )在白斑部位与正常部位有无差 异,调查的资料如下表 异,调查的资料如下表 异,调查的资料如下表 异,调查的资料如下表 病 人 号 白 斑 部 位 白 斑 部 位 白 斑 部 位 白 斑 部 位 正 常 部 位 正 常 部 位 正 常 部 位 正 常 部 位 d=正 常 -白 斑 正 常 -白 斑 正 常 -白 斑 正 常 -白 斑 秩 次 1 40.03 88.57 48.54 6 2 97.13 80.00 -17.13 -3 3 80.32 123.72 43.40 4 4 25.32 39.03 13.71 2 5 19.61 24.37 4.76 1 6 14.50 92.75 78.25 8 7 49.63 121.57 71.94 7 8 44.56 89.76 45.20 5 合 计 T +=33 T-=3 白 癜 风 病 人 不 同 部 位 白 介 素 白 癜 风 病 人 不 同 部 位 白 介 素 白 癜 风 病 人 不 同 部 位 白 介 素 白 癜 风 病 人 不 同 部 位 白 介 素IL-6指 标 ( u/m l) IL-6指 标 ( u/m l) IL-6指 标 ( u/m l) IL-6指 标 ( u/m l) 11 一般步骤 ⒈ 建立假设; H0:差值的总体中位数为0; H1:差值的总体中位数不为0; α=0.05。 ⒉计算统计量 ⑴ 算出各对子的代数差; ⑵ 根据差值的绝对值大小 差值的绝对值大小 差值的绝对值大小 差值的绝对值大小编秩; ⑶ 将秩次冠以正负号,计算正、负秩和( 将秩次冠以正负号,计算正、负秩和( 将秩次冠以正负号,计算正、负秩和( 将秩次冠以正负号,计算正、负秩和(T+,T-); ⑷ 用不为“0”的对子数n及取绝对值小的秩和作为 统计量T 第一节 配对资料符号秩和检验 配对资料符号秩和检验 配对资料符号秩和检验 配对资料符号秩和检验 配对资料符号秩和检验 配对资料符号秩和检验 配对资料符号秩和检验 配对资料符号秩和检验 12
毒n>25时 可用志近似法计幕u值暖行u检脸 者5≤n≤25时 =-mly4-05 可女附泰8的T界值表,T念小,P盒小。 √风+2+/2 雪T格为附表中的界值财,P值一版每小 当物同装次教多时U值需造行校正。 于表中对店的概年值。 一、配对资料符号秩和检险 即T-na4U4。 803 若T值森系维花面内,不指地H。T山<T<T 2532 0: 1825 456 89.76 5.20 T-33 T.3 假设检脸步谦 1是通, 化:差值的感体中位展=0。 H:是他的幕体中位数01a=0.05 t 2.首光计第个对子差值d 夹行好口整卫生习6个月后牙周情况的变化程康 变化对虚的分数 人数 in(T...)-T.-3.:
⒊查表及结论 查检验界值表得到 查检验界值表得到 查检验界值表得到 查检验界值表得到P值作出判断。 当5≤n≤25时 可查附表8的 T界值表,T 愈小,P愈小。 当T恰为附表中的界值时, 恰为附表中的界值时, 恰为附表中的界值时, 恰为附表中的界值时,P值一般都小 于表中对应的概率值。 于表中对应的概率值。 于表中对应的概率值。 于表中对应的概率值。 13 当n>25时 可用正态近似法计算 可用正态近似法计算 可用正态近似法计算 可用正态近似法计算u值进行u检验, 当相同秩次较多时 相同秩次较多时 相同秩次较多时 相同秩次较多时u值需进行校正。 值需进行校正。 值需进行校正。 值需进行校正。 ( 1 / 4 0.5 ) ( 1)(2 1) / 24 T n n u n n n − + − = + + ( ) 3 1 / 4 0.5 ( 1)(2 1) ( ) 24 48 i i T n n u n n n t t − + − = + + − − ∑ 14 基本思想 如果H0成立, 即两总体无差异,在理论上的样本的 即两总体无差异,在理论上的样本的 即两总体无差异,在理论上的样本的 即两总体无差异,在理论上的样本的正负秩和相等, 即 T值应为总秩和(T总= n(n+1)/2)的一半, 即 T=n(n+1)/4。 若T值在界值范围内,不拒绝 值在界值范围内,不拒绝 值在界值范围内,不拒绝 值在界值范围内,不拒绝H0,Tmin<T<Tmax 当T值在界值上或界值范围外, 值在界值上或界值范围外, 值在界值上或界值范围外, 值在界值上或界值范围外,H0成立的概率很小,拒 成立的概率很小,拒 成立的概率很小,拒 成立的概率很小,拒 绝H0 ,认为两总体分布不同 ,认为两总体分布不同 ,认为两总体分布不同 ,认为两总体分布不同 一、配对资料符号秩和检验 一、配对资料符号秩和检验 一、配对资料符号秩和检验 一、配对资料符号秩和检验 15 例9.1 临床某医生研究白癜风病人的白介素 临床某医生研究白癜风病人的白介素 临床某医生研究白癜风病人的白介素 临床某医生研究白癜风病人的白介素 IL-6水平(u/ml)在白斑部位与正常部位有无差 )在白斑部位与正常部位有无差 )在白斑部位与正常部位有无差 )在白斑部位与正常部位有无差 异,调查的资料如下表 异,调查的资料如下表 异,调查的资料如下表 异,调查的资料如下表 病 人 号 白 斑 部 位 白 斑 部 位 白 斑 部 位 白 斑 部 位 正 常 部 位 正 常 部 位 正 常 部 位 正 常 部 位 d=正 常 -白 斑 正 常 -白 斑 正 常 -白 斑 正 常 -白 斑 秩 次 1 40.03 88.57 48.54 6 2 97.13 80.00 -17.13 -3 3 80.32 123.72 43.40 4 4 25.32 39.03 13.71 2 5 19.61 24.37 4.76 1 6 14.50 92.75 78.25 8 7 49.63 121.57 71.94 7 8 44.56 89.76 45.20 5 合 计 T +=33 T-=3 白 癜 风 病 人 不 同 部 位 白 介 素 白 癜 风 病 人 不 同 部 位 白 介 素 白 癜 风 病 人 不 同 部 位 白 介 素 白 癜 风 病 人 不 同 部 位 白 介 素IL-6指 标 ( u/m l) IL-6指 标 ( u/m l) IL-6指 标 ( u/m l) IL-6指 标 ( u/m l) 16 假设检验步骤 ⒈ 建立建设: H0:差值的总体中位数 :差值的总体中位数 :差值的总体中位数 :差值的总体中位数=0, H1:差值的总体中位数 :差值的总体中位数 :差值的总体中位数 :差值的总体中位数≠0; α=0.05 2. 首先计算每个对子的差值 首先计算每个对子的差值 首先计算每个对子的差值 首先计算每个对子的差值d,见上表第(4)列,根据8个d 的绝对值,由小到大编秩,并冠以原 的绝对值,由小到大编秩,并冠以原 的绝对值,由小到大编秩,并冠以原 的绝对值,由小到大编秩,并冠以原d的正负号,见上表第( 的正负号,见上表第( 的正负号,见上表第( 的正负号,见上表第(5) 列。然后分别相加正负秩次,得到秩和 列。然后分别相加正负秩次,得到秩和 列。然后分别相加正负秩次,得到秩和 列。然后分别相加正负秩次,得到秩和 T+= 33,T- = 3取统计量: T = min(T+,T-)=T- = 3。 查附表8: P207 3. 查表及结论 n=8,查T界值表T0.05(8)=3~33,T=3正好落在界值 上,所以P≤0.05,拒绝H0,认为白斑部位与正常部位的白介 ,认为白斑部位与正常部位的白介 ,认为白斑部位与正常部位的白介 ,认为白斑部位与正常部位的白介 素IL-6有差异。由于负秩和小,则白斑部位 有差异。由于负秩和小,则白斑部位 有差异。由于负秩和小,则白斑部位 有差异。由于负秩和小,则白斑部位<正常部位。 计算统计量 ⑴ 算出各对子的代数差; ⑵ 根据差值的绝对值大小 差值的绝对值大小 差值的绝对值大小 差值的绝对值大小 编秩; ⑶ 将秩次冠以正负号,计 将秩次冠以正负号,计 将秩次冠以正负号,计 将秩次冠以正负号,计 算正、负秩和( 算正、负秩和( 算正、负秩和( 算正、负秩和(T+,T-); ⑷ 用不为“0”的对子数n 及取绝对值小的秩和作为 统计量T 17 例9.2 对28名患有轻度牙周疾病的成年人,指导他们 名患有轻度牙周疾病的成年人,指导他们 名患有轻度牙周疾病的成年人,指导他们 名患有轻度牙周疾病的成年人,指导他们 实行良好达到口腔卫生习惯, 实行良好达到口腔卫生习惯, 实行良好达到口腔卫生习惯, 实行良好达到口腔卫生习惯,6个月后,牙周情况好转程度 个月后,牙周情况好转程度 个月后,牙周情况好转程度 个月后,牙周情况好转程度 依高到低给予分数 依高到低给予分数 依高到低给予分数 依高到低给予分数+3,+2,+1;牙周情况变差程度依次给 ;牙周情况变差程度依次给 ;牙周情况变差程度依次给 ;牙周情况变差程度依次给 予分数-1,-2,-3;没有变化给予 ;没有变化给予 ;没有变化给予 ;没有变化给予0分,试对该项指导结果 分,试对该项指导结果 分,试对该项指导结果 分,试对该项指导结果 进行评价 变 化 对 应 的 分 数 人 数 +3 4 +2 5 +1 6 0 5 -1 4 -2 2 -3 2 实 行 良 好 口 腔 卫 生 习 惯6个 月 后 牙 周 情 况 的 变 化 程 度 18
假设检脸步豫 两独立样本比的秩和检验 h460-06 2计能计 正负款计来 用毒件,对用本法,南个子复幸拼此截。 正 盖来思想: 8, 假设检险步康 建立建::两总体分布相同 体尔:两总体分布不同: a=0.05 T+T=300 总秩次-N+H2 平均陕162/1 平均。13越/144 创9.444例使康人与24例便性气普炎店人表淡者酸性 低设检脸步眼 拉每能最的时量值(X10几),问能康人与侵性气 誉克病人腹流专酸性粒细胞数有无显普差到? a你等不 a=0.05 玉平品水小华来季秀线件 -%(w+-05 36 1后
⒈ 建立假设 H0:差值总体中位数为 :差值总体中位数为 :差值总体中位数为 :差值总体中位数为0 H1:差值总体中位数不为 :差值总体中位数不为 :差值总体中位数不为 :差值总体中位数不为0; α=0.05 ⒉ 计算统计量 d - + 总 (1) (2) (3) (4) (5) (6) (7)=(2)×(6)(8)=(3)×(6) 1 4 6 10 1-10 5.5 22 33 2 2 5 7 11-17 14.0 28 70 3 2 4 6 18-23 20.5 41 82 合计 8 15 23 T-=91 T+=185 正秩和 正负秩和计算表 频数 秩次范围 平均秩次 负秩和 假设检验步骤 ⒊ 查表与结论 查T界值表,T0.05(23)=73~203,T=91,在界值范围 内,P>0.05,不拒绝H0,认为指导后牙周状况无显著好转 ,认为指导后牙周状况无显著好转 ,认为指导后牙周状况无显著好转 ,认为指导后牙周状况无显著好转. 19 二、 两独立样本比较的秩和检验 两独立样本比较的秩和检验 两独立样本比较的秩和检验 两独立样本比较的秩和检验 适用条件: 完全随机设计的两个样本比较,若不满足参数检验的应 的两个样本比较,若不满足参数检验的应 的两个样本比较,若不满足参数检验的应 的两个样本比较,若不满足参数检验的应 用条件,则用本法;两个 用条件,则用本法;两个 用条件,则用本法;两个 用条件,则用本法;两个等级资料比较。 基本思想: 如果H0成立,在两样本来自分布相同的总体,两样本的 成立,在两样本来自分布相同的总体,两样本的 成立,在两样本来自分布相同的总体,两样本的 成立,在两样本来自分布相同的总体,两样本的 平均秩次应相等或很接近,与总的平均秩次( 平均秩次应相等或很接近,与总的平均秩次( 平均秩次应相等或很接近,与总的平均秩次( 平均秩次应相等或很接近,与总的平均秩次(N+1)/2 相差较小。含量为 相差较小。含量为 相差较小。含量为 相差较小。含量为n1样本的秩和T1应在n1(N+1)/2的左 右变化。若T值偏离此值太远, 值偏离此值太远, 值偏离此值太远, 值偏离此值太远,H0发生的可能性就很小。 发生的可能性就很小。 发生的可能性就很小。 发生的可能性就很小。 若偏离出给定的 若偏离出给定的 若偏离出给定的 若偏离出给定的α值所确定的范围时,即 值所确定的范围时,即 值所确定的范围时,即 值所确定的范围时,即P≤α,拒绝 H0 20 例9.3 对无淋巴细胞转移与有淋巴细胞转移的胃癌 对无淋巴细胞转移与有淋巴细胞转移的胃癌 对无淋巴细胞转移与有淋巴细胞转移的胃癌 对无淋巴细胞转移与有淋巴细胞转移的胃癌 患者,观察其生存时间,问两组患者的生存时间是否 患者,观察其生存时间,问两组患者的生存时间是否 患者,观察其生存时间,问两组患者的生存时间是否 患者,观察其生存时间,问两组患者的生存时间是否 不同? 时间 秩次 时间 秩次 12 4.5 5 1 25 10 8 2 27 11 12 4.5 29 12.5 12 4.5 38 17 12 4.5 42 19 17 7 46 20 21 8 46 21 24 9 56 23 29 12.5 60 24 30 14 34 15 36 16 40 18 48 22 n1=10 T1=162 n2=14 T2=138 无淋巴细胞转移 有淋巴细胞转移 两组患者生存时间(月) T1+T2=300 总秩次=N(N+1)/2=300 N(N+1)/2=300 N(N+1)/2=300 N(N+1)/2=300 平均秩无转移=162/10=16.2 162/10=16.2 162/10=16.2 162/10=16.2 平均秩有转移=138/14=9.86 138/14=9.86 138/14=9.86 138/14=9.86 21 1. 建立建设:H0:两总体分布相同, H1:两总体分布不同; α=0.05 假设检验步骤 ⒊ 查表及结论 n=n2-n1,查T界值表 T0.05(4)=91~159, T1 =162落在界 值范围外,所以 值范围外,所以 值范围外,所以 值范围外,所以P u0.05, P<0.05, , P<0.05, , P<0.05, , P<0.05,拒绝H0,认为总体分布 ,认为总体分布 ,认为总体分布 ,认为总体分布 不同,即健康人与气管炎病人的痰液嗜酸性粒细胞数有差别。 不同,即健康人与气管炎病人的痰液嗜酸性粒细胞数有差别。 不同,即健康人与气管炎病人的痰液嗜酸性粒细胞数有差别。 不同,即健康人与气管炎病人的痰液嗜酸性粒细胞数有差别。 ⒉ 计算检验统计量:取 计算检验统计量:取 计算检验统计量:取 计算检验统计量:取较小样本的秩和 较小样本的秩和 较小样本的秩和 较小样本的秩和作为检验统计 量T,T=560.5 T=560.5 T=560.5 T=560.5, 24
三、多组秋立辉本的秩和检脸 假设检脸步豫 (Kruskal--alis法-H松脸) 通用件: ·不满来畿检脸的点用条件的光金越就设计的多个 ·多木等复资林此根 的平的秋灰应诚相是不大 k2: H的校正与X2近似 当有相同秋次时,H需: He=HIC C=1-∑G-)MN3-M )吉n校大时,H远板展从V=k-1的必会车 .o 收可换x2会率我得概平P作出桃计推断: 8T12647T 35n-8T4545 344123.5454.5-520 ION+) -B2*332计率无 假设检脸步豫 创9.6下表是爱礼葡若不同读经免度21天唐点清哉 ,H。:回数氯库DNA舍量的慈体分有相同, 体满康水平测走能暴,问各鱼间的金清北休满度水平 ·H:四血瓶碑DA含量的卷体分有位直不金和同。 之间美弄是香有统计录意义? 装容装器 州2号-w: 08m89)a0) 甜站碧湖册品 +水天降德,4,414春水 61.891.&18用版B 3332
三、多组独立样本的秩和检验 三、多组独立样本的秩和检验 三、多组独立样本的秩和检验 三、多组独立样本的秩和检验 (Kruskal-Wallis Kruskal-Wallis Kruskal-Wallis Kruskal-Wallis 法---H检验) 适用条件: • 不满参数检验的应用条件的完全随机设计的多个 不满参数检验的应用条件的完全随机设计的多个 不满参数检验的应用条件的完全随机设计的多个 不满参数检验的应用条件的完全随机设计的多个 样本比较 • 多个等级资料比较 多个等级资料比较 多个等级资料比较 多个等级资料比较 基本思想:如果各总体分布相同,则各组混合编秩 基本思想:如果各总体分布相同,则各组混合编秩 基本思想:如果各总体分布相同,则各组混合编秩 基本思想:如果各总体分布相同,则各组混合编秩 的平均秩次应该相差不大 的平均秩次应该相差不大 的平均秩次应该相差不大 的平均秩次应该相差不大 25 1.建立假设,确定检验水准 建立假设,确定检验水准 建立假设,确定检验水准 建立假设,确定检验水准 H0:多个总体分布相同。 :多个总体分布相同。 :多个总体分布相同。 :多个总体分布相同。 H1:多个总体分布不全相同。 :多个总体分布不全相同。 :多个总体分布不全相同。 :多个总体分布不全相同。 2.编秩:多组数据从小到大混合编秩。 编秩:多组数据从小到大混合编秩。 编秩:多组数据从小到大混合编秩。 编秩:多组数据从小到大混合编秩。 注意:遇不同组相同数据,取平均秩次。 注意:遇不同组相同数据,取平均秩次。 注意:遇不同组相同数据,取平均秩次。 注意:遇不同组相同数据,取平均秩次。 3.求各组秩和:将各组秩次相加,即 求各组秩和:将各组秩次相加,即 求各组秩和:将各组秩次相加,即 求各组秩和:将各组秩次相加,即Ri,i表示组号。 4.计算检验统计量: 计算检验统计量: 计算检验统计量: 计算检验统计量: 相同秩次太多时,上式需校正。 相同秩次太多时,上式需校正。 相同秩次太多时,上式需校正。 相同秩次太多时,上式需校正。 5.确定p值,得出结论: 值,得出结论: 值,得出结论: 值,得出结论: (1)当k=3,每组例数≤5,查H界值表。 (2)k>3,ni>5,近似服从 ν = k – 1 的 χ2 分 布,查χ2界值表。 ( ) 2 12 ( ) 3( 1) 1 i i R H N N N n = − + + ∑ 假设检验步骤 26 H 的校正与χ2近似 • 当有相同秩次时, 当有相同秩次时, 当有相同秩次时, 当有相同秩次时,H 需校正: • 当 n 较大时, H 近似服从 ν = k – 1 的 χ2 分布。 故可按 χ 2 分布获得概率 P,作出统计推断。 ,作出统计推断。 ,作出统计推断。 ,作出统计推断。 3 3 / 1 ( ) /( ) C j j H H C C t t N N = = − − − ∑ 27 正 常 患自发性白 患移植白血 患移植白血 脾 血病的脾 病的脾(甲组) 病的脾(乙组) 含量 秩次 含量 秩次 含量 秩次 含量 秩次 (1) (2) (3) (4) (5) (6) (7) (8) 12.3 18 10.8 8 9.3 1 9.5 2 13.2 22 11.6 13 10.3 3.5 10.3 3.5 13.7 26 12.3 18 11.1 11 10.5 5 15.2 28 12.7 21 11.7 14 10.5 6 15.8 29 13.5 23 11.7 15 10.5 7 16.9 30 13.5 24 12.0 16 10.9 9 17.3 31 14.8 27 12.3 18 11.0 10 17.4 32 12.4 20 11.5 12 13.6 25 表9-6 各组鼠脾DNA含量(mg)的秩和计算 例 9.5 研究白血病时,测定四组鼠脾 研究白血病时,测定四组鼠脾 研究白血病时,测定四组鼠脾 研究白血病时,测定四组鼠脾DNA的含量,结果列于 的含量,结果列于 的含量,结果列于 的含量,结果列于 下表,试分析各组 下表,试分析各组 下表,试分析各组 下表,试分析各组DNA含量有无差别? 含量有无差别? 含量有无差别? 含量有无差别? n1=8 T1=216 n2=7 T2=134 n3=9 T3=123.5 n4=8 T4=54.5 216+134+123.5+54.5= 216+134+123.5+54.5= 216+134+123.5+54.5= 216+134+123.5+54.5=528=N(N+1)/2=(32 =N(N+1)/2=(32 =N(N+1)/2=(32 =N(N+1)/2=(32*33)/2 秩次计算无误 28 建立假设检验 • H0:四组鼠脾DNA含量的总体分布相同。 含量的总体分布相同。 含量的总体分布相同。 含量的总体分布相同。 • H1:四组鼠脾DNA含量的总体分布位置不全相同。 含量的总体分布位置不全相同。 含量的总体分布位置不全相同。 含量的总体分布位置不全相同。 • α=0.05 计算统计量 ( ) 3(32 1) 19.90 8 54.5 9 123.5 7 134 8 216 32 32 1 12 3(N 1) nT N(N 1) 12 H 2 2 2 2 i 2 i − + = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ + + + + = − + + = ∑ 假设检验步骤 查表及结论, 现k=4,ν=k-1=4-1=3 -1=4-1=3 -1=4-1=3 -1=4-1=3查界值表 χ20.05(3) 0.05(3) 0.05(3) 0.05(3)=7.81, χ2>χ20.05(3) 0.05(3) 0.05(3) 0.05(3); P<0.05按α=0.05水准,拒绝 H0,接受H1,故可认为四组 ,故可认为四组 ,故可认为四组 ,故可认为四组DNA含量有差别。 29 例 9.6下表是霍乱菌苗不同途径免疫 下表是霍乱菌苗不同途径免疫 下表是霍乱菌苗不同途径免疫 下表是霍乱菌苗不同途径免疫21天后血清抗 体滴度水平测定结果,问各组间的血清抗体滴度水平 体滴度水平测定结果,问各组间的血清抗体滴度水平 体滴度水平测定结果,问各组间的血清抗体滴度水平 体滴度水平测定结果,问各组间的血清抗体滴度水平 之间差异是否有统计学意义? 之间差异是否有统计学意义? 之间差异是否有统计学意义? 之间差异是否有统计学意义? 表9-7 不同途径免疫21天后血清抗体滴度的分布与秩和计算 抗体 气 雾 组 皮下注 累计 秩次 平均 秩 和 滴度 80亿 100亿 射组 范围 秩次 80亿 100亿 皮下 (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) 1: 10 2 4 2 8 1— 8 4.5 9 18 9 1: 20 15 7 1 23 9—31 20 300 140 20 1: 40 10 12 13 35 32—66 49 490 588 637 1: 80 5 7 9 21 67—87 77 385 539 693 1:160 1 2 5 8 88—95 91.5 91.5 183 475.5 1:320 — — 1 1 96 96 — — 96 合计 33 32 31 96 — 1275.5 1468 1912.5 30
假设检脸步骤 建立假设检验 由于春血有同制最教多,就用会式(97刀校正: 你清抗体清度水平的品 全相同。 ·a=0.05 查表及鳍论 计算统计置 921.32 故可认为三组血清抗体清度水平的慧别有 统计学意义
建立假设检验 • H0:三组血清抗体滴度水平的总体分布相同。 • H1:三组血清抗体滴度水平的总体分布位置不 全相同。 • α=0.05 计算统计量 ( ) 3 (96 1) 11 .36 31 1912 32 1468 33 1275 .5 96 96 1 12 3( N 1 ) nT N ( N 1 ) 12 H 2 2 2 i 2 i − + = ⎟ ⎟ ⎠ ⎞ ⎜ ⎜ ⎝ ⎛ + + + = − + + = ∑ 假设检验步骤 31 查表及结论 现k=3,ν=k-1=3-1=2 -1=3-1=2 -1=3-1=2 -1=3-1=2 查界值表χ20.01(2) 0.01(2) 0.01(2) 0.01(2)=9.21, χ2>χ20.01(2) 0.01(2) 0.01(2) 0.01(2); P<0.01按α=0.05水准,拒绝H0,接受H1, 故可认为三组血清抗体滴度水平的差别有 统计学意义。 3 3 3 3 3 3 11.36 12.27 8 8 23 23 35 35 21 21 8 8 1 96 96 Hc = = - + - + - + - + - - - 由于各组相同例数较多,故用公式(9-7)校正: 32