2015/1/9 ■ 回回 课程设置 酒石河子大学 漂财:覆论漂:22净财 共月绿:10学财 第九章x2检验 联方式:预防医季卫生 Tel:2057153 (Chi Square Test Baidu账巴:yfa(讨论.米是、作业) wmv) 医季晚预防医季泰 ◆目的: >推断两个善体平或构成此之间有无差别 第一节 ,推断多个慈体年或构成此之间有无差刮 ·检验统计量:X2 四格表资料的X2检验 ◆应用:定性数据 一、基本会式和基本思想 圆的: 推断两个惑体率(构成比)是否有是副 震血用来意制加精响海疗。试分新有故位。 妻求: 表9】两种疗法治疗原发性高血压的疗效 有效 无效合计有效 两拆本的两分真个体敷赫列成四格表资料 20() 合计
2015/1/9 1 1 第九章 χ2检验 (Chi Square Test ) 医学院预防医学系 2 课程设置 课时: 理论课: 22学时 实习课: 10学时 联系方式:预防医学系卫生统计学教研室 Tel.: 2057153 Baidu贴吧:yfyxx (讨论、答疑、作业) http://tieba.baidu.com/f?kw=yfyxx# 大学精品课程网站→教学资源→(ppt、wmv) http://eol.shzu.edu.cn/eol/jpk/course/layout/default/index.jsp?courseId=1204 2 目的: 推断两个总体率或构成比之间有无差别 推断多个总体率或构成比之间有无差别 检验统计量:χ 2 应用:定性数据 4 第一节 四格表资料的χ 2 检验 5 目的: 推断两个总体率(构成比)是否有差别 要求: 两样本的两分类个体数排列成四格表资料 6 一、基本公式和基本思想 例9-1 吲达帕胺片治疗原发性高血压疗效,将患者随 机分为两组,试验组用吲达帕胺片加辅助治疗,对 照组用安慰剂加辅助治疗。试分析有效性
2015/1/9 四格表资料的基本形式 2=4- v=(行数-1列数-1) 7T 处粗,发生数来发生数合计 处理组发生数未发生数 合计% 安 a Tn bTa a+b甲% n 合计cbd 乙 c Tn dTn c+d飞% A,矣际频(actual frequency】. 合计 a+c b+d n◆计% T覆论频k(theoretical frequency.) Tc,第RC列的覆论频长 。检脸晚计量x2值反映了实际频教 与理论频款的由合程度。 若检脸餐设H6:,=布2成立,宾际频款人与理 论频散T相差不应诚很大,x2不应诚根大。 度。 若x2值服大,则A与T有差太大,若P≤a, 是出丁构拆溪差无并的能国,从而怀展儿的王 确楼,接受其对主假设片,即1卡2 四整表管养两骨两列,”=1,即在周边合计美国变的 假设检脸步豫 (2)求检脸统计量值 (门)立检脸假设,喷定检脸水平。 H6:1=石2中试脸血场对黑血的恶体有藏年和羊 2 15.2 v=(2-10(2-1)=1 Tn-444/7m-258 4=0.05。 20(25.8)2418.2 Ta-2970-i82 21(15.2 510.8) Ta-26*41/7m0-152 Ta-2629/70-10.8 2
2015/1/9 2 7 处理组 发生数 未发生数 合计 甲 a b a+b 乙 c d c+d 合 计 a+c b+d n 四格表资料的基本形式 甲% 乙% 合计% T11 T12 T21 T22 % 8 处理组 发生数 未发生数 合计 甲 a b a+b 乙 c d c+d 合 计 a+c b+d n 2 2 ( ) , ( )( 1) A T T 行数-1 列数 A:实际频数(actual frequency) T:理论频数(theoretical frequency) T RC :第R 行C 列的理论频数 nR :相应的行合计,nC :相应的列合计 R C RC n n T n 9 检验统计量χ2 值反映了实际频数 与理论频数的吻合程度。 若检验假设H0 :π1=π2成立,实际频数A 与理 论频数T 相差不应该很大,χ2 不应该很大。 若χ2 值很大,则A与T相差太大,若 P≤α, 超出了抽样误差允许的范围,从而怀疑H0的正 确性,接受其对立假设H1,即π1≠π2。 10 自由度ν愈大,χ 2 值也会愈大;所以只 有考虑了自由度ν的影响,χ 2 值才能正 确地反映实际频数A和理论频数T 的吻合 程度。 检验的自由度取决于可以自由取值的格子数目,而不 是样本含量n。 四格表资料两行两列,ν=1,即在周边合计数固定的 情况下,4个基本数据当中只有一个可以自由取值。 11 (1) 建立检验假设,确定检验水平。 H0 :π1=π2 即试验组与对照组的总体有效率相等 H1 :π1≠π2 即试验组与对照组的总体有效率不等 α=0.05。 假设检验步骤 12 (2)求检验统计量值 2 2 2 2 2 (20 25.8) (24 18.2) (21 15.2) (5 10.8) 8.40 25.8 18.2 15.2 10.8 (21)(21) 1 T11 =44*41/70=25.8 T12=44*29/70=18.2 T21=26*41/70 =15.2 T22 = 26*29/70=10.8 20(25.8) 24(18.2) 21(15.2) 5(10.8)
2015/1/9 (3)确宗P值,作出推断结论 二、四格表资料检险的专用会式 带 x2= (ad-bc)2n (a+b)(a+cXb+d)(c+d) 当自由度,确定后,x分布曲线下右侧尾 部的面积为a时,横轴上相应的x值记作x X2=20x5-24×212×70-840 P2 财,一不保投。 四格表资料X?检脸金式的选 制9-2等最师秋此能胞4型碱与种经节#睡谁轴 金管病病白守故,普58制陆血管病病喜★政机分为 两触,始品儿表。问西种葛物德守陆血管来高的者 n≥40,T≥5,专用会式 放单是香湘等? 表2两种物治疗血管疾转有效率的较 n≥40,1≤T<5,校正会式: 有效无滩合计有效单(》 n<40或T<1,直楼计算瓶率。 49
2015/1/9 3 13 (3) 确定P 值,作出推断结论 当自由度 确定后, 2 分布曲线下右侧尾 部的面积为 时,横轴上相应的 2 值记作 2 , 0.0 0.1 0.2 0.3 0.4 0.5 0 3 6 9 12 15 18 卡方值 纵高 自由度=1 自由度=2 自由度=3 自由度=6 P< 0.005,按α=0.05水准,拒绝H0 ,接受H1 ,可 以认为两组治疗原发性高血压的总体有效率不等,即 可认为吲达帕胺治疗原发性高血压有效。 14 二、四格表资料检验的专用公式 2 2 ( ) ( )( )( )( ) ad bc n a b a c b d c d 2 2 (20 5 24 21) 70 8.40 44 26 41 29 15 三、四格表资料检验的校正公式 2 2 ( 0.5) c A T T 2 2 ( ) 2 ( )( )( )( ) c n | ad - bc|- n = a+b c+d a+c b+d 16 χ 2分布是一连续型分布,而四格表资料属 离散型分布,由此计算得的χ 2统计量的抽样 分布亦呈离散性质。为改善χ 2 统计量分布 的连续性,则需行连续性校正(correction for continuity)。 χ 2 连续性校正仅用于ν =1 的四格表资料,当ν≥2 时,一般不作校正。 17 四格表资料χ 2 检验公式的选择: n T 40, 5 ,专用公式; ,校正公式; ,直接计算概率。 n T 40, 1 5 n T 40 1 或 18 例9-2 某医师欲比较胞磷胆碱与神经节苷酯治疗脑 血管疾病的疗效,将58例脑血管疾病患者随机分为 两组,结果见表。问两种药物治疗脑血管疾病的有 效率是否相等?
2015/1/9 上走立银设,设走妆脸水准 四、四格表资料的Fisher喷切机率法 (选拳) H:开士可即两科葛物地方脑么普病病的有数年不湘等 条件: n各息会的瓶率P尿从是几何分布, 创9.3将17名非闲出者威机分 两血,分制用雨种方债嗨疗,地暴儿表83, 其和为1。 问两种守的守数是香不阿? P=a+bc+d)(a+cb+d月 素种疗铁对版 alblc!d!n! 疗法 2 9 刀.18 保守疗法 25.00 合计 7 4
2015/1/9 4 19 H0:1 2 H1:1 2 0.05 即两种药物治疗脑血管疾病的有效率相等 即两种药物治疗脑血管疾病的有效率不相等 2.计算检验统计量 2 2 6 25 3 24 58 2 58 0 376 49 9 28 30 c / . (21)(21) 1 3.确定P 值,作出推断结论 不拒绝 H0 ,尚不能认为两种药物治疗脑血管疾 病的有效率不相等 。 1.建立假设,设定检验水准 20 条件: 理论依据:超几何分布。 n 40,或T 1, 或P 时, 四、四格表资料的Fisher确切概率法 (选学) 21 基本思想 在四格表周边合计数固定不变的条件下, 计算表内4个实际频数变动时的各种组合 之概率Pi ;再按检验假设用单侧或双侧 的累计概率 P ,依据所取的检验水准α 做出推断。 22 各组合概率Pi的计算 在四格表周边合计数不变的条件下, 表内4个实际频数 a,b,c,d 变动的组合数 共有“周边合计中最小数+1”个。如例 8.3,表内4个实际频数变动的组合数共 有8+1=9个,见表8-4。 23 各组合的概率Pi服从超几何分布, 其和为1。 ( ) ( )!( )!( )! ! ! ! ! ! i a b c d a c b d P a b c d n ! 24 表 8-3 两种疗法对腰椎间盘脱出症的疗效 疗法 治愈 未治愈 合计 治愈率(%) 新疗法 7 2 9 77.78 保守疗法 2 6 8 25.00 合计 9 8 17 52.94 例9.3 将17名腰椎间盘脱出症患者随机分到 两组,分别用两种方法治疗,结果见表8-3, 问两种疗法的疗效是否不同?
2015/1/9 二、检脸步(本创n=17<40】 3% :石=,月:,a=005 34 ( 2.24P=0.041464 P=P(1+P(②+P(⑦+P(8)+P(9)=0.057 P=P(⑦+P(⑧+P(⑨=0.044 与计量资料推断两总体均敷是否有差 第二节 别有成组设计和配对设计一样,计数 资料推断两个恶体率(构成比)是否 配对四格表资料的X2检脸 有差别也有成组设计和配对设计,即 四格表资料和配对四格表资料。 ■ ■ 创9.4见者198份爽标本,◆份赫本分刮 表95人 的培苏结 用A、B两种培养基培养结核葡,结暴见 表9-5。问A、B两种培养基白阳性婚界 来是香不等? 2 198
2015/1/9 5 25 表 8-4 各种组合的四格表计算的概率 四格表序号 治愈 未治愈 a-Ta P 1 1 8 8 0 -3.76 0.000370 2 2 7 7 1 -2.76 0.011847 3 3 6 6 2 -1.76 0.096750 4 4 5 5 3 -0.76 0.290251 5 5 4 4 4 0.24 0.362814 6 6 3 3 5 1.24 0.193501 7 * 7 2 2 6 2.24* 0.041464* 8 8 1 1 7 3.24 0.002962 9 9 0 0 8 4.24 0.000041 *:为实际四格表 26 二、检验步骤(本例n=17<40 ) 计算表内四个格子数据的各种组合的概率Pi (表8-4) 本例(a-T)*=2.24, P* =0.041464 确定累计概率值 1. 双侧检验 P = P (1) + P (2) + P (7) + P (8) + P (9) =0.057 2. 单侧检验 P = P (7) + P (8) + P (9) =0.044 H0 :1 2 ,H1 :1 2 , 0.05 27 第二节 配对四格表资料的 χ2 检验 28 与计量资料推断两总体均数是否有差 别有成组设计和配对设计一样,计数 资料推断两个总体率(构成比)是否 有差别也有成组设计和配对设计,即 四格表资料和配对四格表资料。 29 例9.4 现有198份痰标本,每份标本分别 用A、B两种培养基培养结核菌,结果见 表9-5。问A、B两种培养基的阳性培养 率是否不等? A培养基 B培养基 合计 + - + 48(a) 24(b) 72 - 20(c) 106(d) 126 合计 68 130 198 30 样品号 A培养基 B培养基 1 + + 2 + - 3 - + 4 - - …… …… …… 198 + - 表9-5 A、B两种培养基的培养结果 A培养基 B培养基 合计 + - + 48(a) 24(b) 72 - 20(c) 106(d) 126 合计 68 130 198
2015/1/9 士适纪对我什实套中,故专个对于而本,为种 检脸铣计量McNemar test) 处理的地暴不外乎者四种可能: ①AB两种检方法为阳性兼() b与C两个棒于的题论k秀b+G/2 ②A,B两种检阔方法曹为因世款(山) bc40财: ③A法为阳性、B法为因性数(), 而A法为圆桂、B法为阳枝数(。 --6-.v=1 ◆b+c0.05.禁属=0.05水准,不推能儿,认为西种墙 不火。 暴盖的阳性墙养平有同。 行义列表资料 第三节 ⑦多个年来平比款财, 者R特2列,燕为RX2表 RXC列联表资料的X2检脸 者2开C到,稀2×C表 者R舟C列,稀为RXC泰。 6
2015/1/9 6 31 上述配对设计实验中,就每个对子而言,两种 处理的结果不外乎有四种可能: ① A、B两种检测方法皆为阳性数(a); ② A、B两种检测方法皆为阴性数 (d); ③ A法为阳性、B法为阴性数 (b); ④ A法为阴性、B法为阳性数 (c)。 其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。 32 检验统计量(McNemar test) , 1 1 , 1 2 2 c 2 2 b 2 2 2 2 2 2 2 b c b c b c b c b c b c b c b c T A T c A培养基的阳性率=(a+b)/n, B培养基的阳性率=(a+c)/n, 阳性率的差值= (b-c)/n,若阳性率无差异则B=C b与c两个格子的理论数为(b+c)/2 当b+c≥40时: 当b+c<40时: 32 33 注意: 本法一般用于样本含量不太大的资料。因为 它仅考虑了两法结果不一致的两种情况(b, c), 而未考虑样本含量n和两法结果一致的两种情况(a, d)。所以,当 n 很大且 a 与 d 的数值很大(即 两法的一致率较高),b 与 c 的数值相对较小时, 即便是检验结果有统计学意义,其实际意义往往 也不大。 34 H0:B C ,H1:B C , 0.05 检验步骤: 2 2 (24 20) 0.36 24 20 1 P > 0.05.按α=0.05水准,不拒绝H0 ,认为两种培 养基的阳性培养率相同。 35 第三节 R×C列联表资料的χ 2检验 36 行×列表资料 ① 多个样本率比较时, 有 R 行 2 列,称为 R ×2表; ② 两个样本的构成比比较时, 有 2 行 C 列,称 2×C 表; ③ 多个样本的构成比比较, 有 R 行 C 列,称为 R ×C 表
2015/1/9 ■ 检脸统计量 多个枰本卓的比较 创9-5禁医晚用3种方套随卉意楼无贵痘型满 x2-∑A-T)2 幸肝254,见暴儿表9-6,问3种 法的有故率是香不阿。 空 v=(行数-1(列数-) 西组 中两 胺乡康 片:3种临守方食的者放平和多 ~枰本构成比的比较 4=0.05 问不同地置人群ABO血型分真构成此是香不同。 -254x0.1794+02203+01056+0.232+0.3244+00179-) 地人 p003蛋2=0.05随妆*水准下, 106 37444995 ◆#9875181549332592 热认为三种守油的有不普或不金湘。 检脸步康 多个样本率问的多重比较 以:不同地区人平血要分有卷体构或比有同 (选学) 片:不同地区人平么型分市善保构高比不两我不金湘同 a=0.05 >x2分制法(partitions ofx2 method) >Scheffe'可信盛间法 v=(3-1M4-1D=6 >SNK法 不或不金
2015/1/9 7 37 检验统计量 2 2 ( 1) ( 1)( 1) R C A n n n 行数 列数 T A T 2 2 ( ) 38 多个样本率的比较 例9-5 某医院用3种方案治疗急性无黄疸型病 毒肝炎254例,观察结果见表9-6,问3种疗 法的有效率是否不同。 表9-6 3种方案治疗急性肝炎的效果 组别 有效 无效 合计 有效率(%) 西药组 51 49 100 51.00 中药组 35 45 80 43.75 中西药结合组 59 15 74 79.73 合计 145 109 254 57.09 39 检验步骤: H0:3种治疗方案的有效率相等 H1:3种治疗方案的有效率不等或不全相等 α=0.05 1) 74 109 15 74 145 59 80 109 45 80 145 35 100 109 49 100 145 51 254 ( 2 2 2 2 2 2 2 254 (0.1794 0.2203 0.1056 0.2322 0.3244 0.0279 1) 22.81 υ = (3-1)(2-1) = 2 P < 0.05 ,在α=0.05的检验水准下, 拒绝H0 ,接受H1,认为三种疗法的有效率不等或不全相等。 40 样本构成比的比较 例9-6 某研究人员收集了亚洲、欧洲和北美洲 人的A、B、AB、O血型资料,结果见表9-7. 问不同地区人群ABO血型分类构成比是否不同。 表9-6 三个不同地区血型样本的频分布 地区 A B AB O 合计 亚洲 321 369 95 295 1080 欧洲 258 43 22 194 517 北美洲 408 106 37 444 995 合计 987 518 154 933 2592 41 检验步骤 H0:不同地区人群血型分布总体构成比相同 H1:不同地区人群血型分布总体构成比不同或不全相同 α =0.05 2 2 2 2 321 369 444 2592( 1) 297.38 987 1080 518 1080 933 995 (3 1)(4 1) 6 P < 0.05 ,在α=0.05检验水准下,拒绝H0,接受 H1,认为三个不同地区的人群血型分布总体构成比 不同或不全相同。 42 χ2分割法(partitions of χ2 method) Scheffe’可信区间法 SNK法 多个样本率间的多重比较 (选学)
2015/1/9 行X列表的分制 1多个宾验触间的两两此教 >重新规走检脸水准: kk-1) 型餐的不支 2 K:为拆本平的个款 》检脸水准的估计方 2。未脸粗与西一个对题鱼的此教 报插分斯日的 d=k-i 创8.7对创8.5中表8-6的资样进行两两此款 以推断是否任两种进法海卉急性无黄查型 表V=1时界表供多个师本的多比较用) 病素肝爽的有数平均有是副? 表种方客疗的疗 检脸步廉 儿:,,即任两对比组的总体有效率相等 对比组 者整地 风,:一,÷无,即任两对比组的总体有效幸不等 器 a=005 本创为3个尖脸血的两两比 8
2015/1/9 8 43 行×列表的分割 重新规定检验水准: I型错误的概率不变。 检验水准的估计方法: 根据分析目的 44 1.多个实验组间的两两比较 K:为样本率的个数 2.实验组与同一个对照组的比较 ' k 1 2 k(k -1) ’ 45 表 8-8 1时的 2 界值表(供多个样本率间的多重比较用) 2 P 2 P 2 P 6.24 0.01250 7.48 0.00625 8.21 0.00417 6.96 0.00833 7.88 0.00500 8.49 0.00358 7.24 0.00714 8.05 0.00455 8.73 0.00313 46 例8.7 对例8.5中表8-6的资料进行两两比较, 以推断是否任两种疗法治疗急性无黄疸型 病毒肝炎的有效率均有差别? 表 8-6 3 种方案治疗肝炎的疗效 组别 有效 无效 合计 有效率(%) 西药组 51 49 100 51.00 中药组 35 45 80 43.75 中西药结合组 59 15 74 79.73 合计 145 109 254 57.09 47 H0 : A B ,即任两对比组的总体有效率相等 H1 : A A ,即任两对比组的总体有效率不等 0.05 检验步骤 本例为3个实验组间的两两比较 0.0167 3 0.05 3(3 1)/ 2 ' 0.05 48 表 8-9 3 种疗法有效率的两两比较 对比组 有效 无效 合计 2 P 西药组 51 49 100 中药组 35 45 80 合计 86 94 180 0.94 >0.0167 中药组 35 45 80 中西药结合组 59 15 74 合计 94 60 154 20.93 <0.00313 西药组 51 49 100 中西药结合组 59 15 74 合计 110 64 174 15.10 <0.00313
2015/1/9 8.8以8.5中表86中的中葛氢希对 血,西芳施守血与中画芳地合为比融血,试分新局 可以认为中药与中西药结合卉肝爽的 武融血与对属血的系体有藏年者无差时? 者数平有差异,中而药结合的舟齿好于单 H,:,:,即各试验组与对凰组的总体有效率相等 H:,。,即各试验组与对组的总体有效率不等 纯用中药的卉法。南不能认为西药与中药 海守肝爽的有救年有差弄。 本制为各脸与同一对展血的比 a-3=0025 各议套鱼与同一对照复比最临P唯墙系儿泰8? 三、行义列表资并X2检脸的注意事项 P根据毒业知如帆,则去理拾朝最太小的行或 列,成将理论频款太小的行或列与性质和 格子散不士提此1/5格子善k,香则可能卢生偏世。 近的年行戴部列会并。创如:不同年静鱼 处覆专曲者三种: 可以合弄,但不同盒型此不能合并。 >改用或向无4RXC表的F1sher晴切机年油 婚大样本舍量以达到婚大理拾频款的日的, C可厢SAS款件套观)。 属普选方法,只是有业研完无,婚火拆本台 量,同一号制巴用等。 2。多个样本比:所得能计推断希热 是H树,只能认为春唇保中之同愿的来说有业制,但 不能混明任两个愿体年之润珀者姜利。要遗一步推新 西体之间者是,需一步服多个的 多重此粮。 3.去际用中:对子行列表资并要兼其分真型和 研瓷司的递用修备的检脸方清
2015/1/9 9 49 H0 : T C ,即各试验组与对照组的总体有效率相等 H1 : T C ,即各试验组与对照组的总体有效率不等 0.05 本例为各实验组与同一对照组的比较 各试验组与同一对照组比较的P值结果见表8-9 0.025 3 1 ' 例 8.8 以例8.5中表8-6资料中的中药治疗组为对照 组,西药治疗组与中西药结合为试验组,试分析两 试验组与对照组的总体有效率有无差别? 50 可以认为中药与中西药结合治疗肝炎的 有效率有差异,中西药结合的疗法好于单 纯用中药的疗法。尚不能认为西药与中药 治疗肝炎的有效率有差异。 51 1.理论频数:行列表中的各格T≥1,并且1≤T<5的 格子数不宜超过1/5格子总数,否则可能产生偏性。 处理方法有三种: 增大样本含量以达到增大理论频数的目的, 属首选方法,只是有些研究无法增大样本含 量,如同一批号试剂已用完等。 三、行×列表资料 χ 2 检验的注意事项 52 根据专业知识,删去理论频数太小的行或 列,或将理论频数太小的行或列与性质相 近的邻行或邻列合并。例如:不同年龄组 可以合并,但不同血型就不能合并。 改用双向无序R×C表的Fisher确切概率法 (可用SAS软件实现)。 53 2.多个样本率比较:若所得统计推断为拒绝H0,接 受H1时,只能认为各总体率之间总的来说有差别,但 不能说明任两个总体率之间均有差别。要进一步推断 哪两两总体率之间有差别,需进一步做多个样本率的 多重比较。 3.实际应用中:对于行列表资料要根据其分类类型和 研究目的选用恰当的检验方法