沙君话子人季。出正a去 。日的: 兼断有个春华来成指高此之同吉无是时 泰新声个器体中或销高吃之用有无是时 第九章x2松脸 ◆检脸统计量: (Chi Square Test) ◆盛用:定性教插 盖季晚预商属季最 大华精品源复丙若+载华黄爆小(3、) 一。其◆比南 第一节 个属麻牛〔省高地)无福有要到 四格表资料的x2检脸 季来 西年来的香◆春个华成标列成司格未条行 即排表资鲜的盖水形比 马量治银长的南合很康。 合计 年 c+d6 合许cbd 4华州计
1 第九章 χ2检验 (Chi Square Test ) 医学院预防医学系 2 课程设置 课时: 理论课: 22学时 实习课: 10学时 联系方式:预防医学系卫生统计学教研室 Tel.: 2057153 Baidu贴吧:yfyxx (讨论、答疑、作业) http://tieba.baidu.com/f?kw=yfyxx# 大学精品课程网站→教学资源→(ppt、wmv) http://eol.shzu.edu.cn/eol/jpk/course/layout/default/index.jsp?courseId=1204 2 目的: 推断两个总体率或构成比之间有无差别 推断多个总体率或构成比之间有无差别 检验统计量:χ2 应用:定性数据 4 第一节 四格表资料的χ2 检验 5 目的: 推断两个总体率(构成比)是否有差别 要求: 两样本的两分类个体数排列成四格表资料 6 一、基本公式和基本思想 例9-1 吲达帕胺片治疗原发性高血压疗效,将患者随 机分为两组,试验组用吲达帕胺片加辅助治疗,对 照组用安慰剂加辅助治疗。试分析有效性。 7 处理组 发生数 未发生数 合计 甲 a b a+b 乙 c d c+d 合 计 a+c b+d n 四格表资料的基本形式 甲%乙% 合计% T11 T12 T21 T22 % 8 处理组 发生数 未发生数 合计 甲 a b a+b 乙 c d c+d 合 计 a+c b+d n 2 2 ( ) , ( )( 1) A T T 行数-1 列数 A:实际频数(actual frequency) T:理论频数(theoretical frequency) TRC :第R 行C 列的理论频数 nR :相应的行合计,nC :相应的列合计 R C RC n n T n 9 检验统计量χ2 值反映了实际频数 与理论频数的吻合程度。 若检验假设H0 :π1=π2成立,实际频数A 与理 论频数T 相差不应该很大,χ2 不应该很大。 若χ2 值很大,则A与T相差太大,若 P≤α, 超出了抽样误差允许的范围,从而怀疑H0的正 确性,接受其对立假设H1,即π1≠π2
假适检脸步康 (2)妆能计量 .=.,- 005. 常品三 引确字P值,作出浓新轴论 花=4-0 (ad-be-n xa+be+a+oo+面 工珍中无一速懒型◆市,雨体长套将心 用之40,T25,◆用参成: 201sT<5,栽显会离 用<40或T<1,直热计算瓶年;
10 自由度ν愈大,χ2 值也会愈大;所以只 有考虑了自由度ν的影响,χ2 值才能正 确地反映实际频数A和理论频数T 的吻合 程度。 检验的自由度取决于可以自由取值的格子数目,而不 是样本含量n。 四格表资料两行两列,ν=1,即在周边合计数固定的 情况下,4个基本数据当中只有一个可以自由取值。 11 (1) 建立检验假设,确定检验水平。 H0 :π1=π2 即试验组与对照组的总体有效率相等 H1:π1≠π2 即试验组与对照组的总体有效率不等 α=0.05。 假设检验步骤 12 (2)求检验统计量值 2 2 2 2 2 (20 25.8) (24 18.2) (21 15.2) (5 10.8) 8.40 25.8 18.2 15.2 10.8 (2 1)(2 1) 1 T11 =44*41/70=25.8 T12=44*29/70=18.2 T21=26*41/70 =15.2 T22 = 26*29/70=10.8 20(25.8) 24(18.2) 21(15.2) 5(10.8) 13 (3) 确定P 值,作出推断结论 当自由度 确定后, 2 分布曲线下右侧尾 部的面积为 时,横轴上相应的 2 值记作 2 , 0.0 0.1 0.2 0.3 0.4 0.5 0 3 6 9 12 15 18 卡方值 纵高 自由度=1 自由度=2 自由度=3 自由度=6 P< 0.005,按α=0.05水准,拒绝H0 ,接受H1 ,可 以认为两组治疗原发性高血压的总体有效率不等,即 可认为吲达帕胺治疗原发性高血压有效。 14 二、四格表资料检验的专用公式 2 2 ( ) ( )( )( )( ) ad bc n a b a c b d c d 2 2 (20 5 24 21) 70 8.40 44 26 41 29 15 三、四格表资料检验的校正公式 2 2 ( 0.5) c A T T 2 2 ( ) 2 ( )( )( )( ) c n | ad - bc | - n = a+b c+d a+c b+d 16 χ2分布是一连续型分布,而四格表资料属 离散型分布,由此计算得的χ2统计量的抽样 分布亦呈离散性质。为改善χ2 统计量分布 的连续性,则需行连续性校正(correction for continuity)。 χ2 连续性校正仅用于ν =1 的四格表资料,当ν≥2 时,一般不作校正。 17 四格表资料χ2 检验公式的选择: n T 40, 5 ,专用公式; ,校正公式; ,直接计算概率。 n T 40, 1 5 n T 40 1 或 18 例9-2 某医师欲比较胞磷胆碱与神经节苷酯治疗脑 血管疾病的疗效,将58例脑血管疾病患者随机分为 两组,结果见表。问两种药物治疗脑血管疾病的有 效率是否相等?
每。司格泰资样的F1阳项的制年该 小盖本愿惠 垂甲格表调流计长围走不支西春件下 或P:a时, 计界表有小害际期版支融时场春州鱼心 七气小月】春格备版藏用华时或区耐 >程旅候据:气风阿◆市。 一春服◆帆来P杨计第 一春血◆西瓶来P展从是儿行会中, 在两桃表周速合计最不变的条件下, 其希1。 表内4个考际烟最品点Gd更卧西鱼合款 用西师进油号方就无香不顺? p=(a+bc+dya+e)(b+d! 外A有一个格子层语每4将温点中奶 第二节 配对四格表费料的y之松脸 a+P+P尚+P间0脑
19 H0: 1 2 H 1: 1 2 0.05 即两种药物治疗脑血管疾病的有效率相等 即两种药物治疗脑血管疾病的有效率不相等 2.计算检验统计量 2 2 6 25 3 24 58 2 58 0 376 49 9 28 30 c / . (2 1)(2 1) 1 3.确定P 值,作出推断结论 不拒绝 H0 ,尚不能认为两种药物治疗脑血管疾 病的有效率不相等 。 1.建立假设,设定检验水准 20 条件: 理论依据:超几何分布。 n 40,或T 1, 或P 时, 四、四格表资料的Fisher确切概率法 (选学) 21 基本思想 在四格表周边合计数固定不变的条件下, 计算表内4个实际频数变动时的各种组合 之概率Pi ;再按检验假设用单侧或双侧 的累计概率 P ,依据所取的检验水准α 做出推断。 22 各组合概率Pi的计算 在四格表周边合计数不变的条件下, 表内4个实际频数 a,b,c,d 变动的组合数 共有“周边合计中最小数+1”个。如例 8.3,表内4个实际频数变动的组合数共 有8+1=9个,见表8-4。 23 各组合的概率Pi服从超几何分布, 其和为1。 ( ) ( )!( )!( )! ! ! ! ! ! i a b c d a c b d P a b c d n ! 24 表 8-3 两种疗法对腰椎间盘脱出症的疗效 疗法 治愈 未治愈 合计 治愈率(%) 新疗法 7 2 9 77.78 保守疗法 2 6 8 25.00 合计 9 8 17 52.94 例9.3 将17名腰椎间盘脱出症患者随机分到 两组,分别用两种方法治疗,结果见表8-3, 问两种疗法的疗效是否不同? 25 表 8-4 各种组合的四格表计算的概率 四格表序号 治愈 未治愈 a-Ta P 1 1 8 8 0 -3.76 0.000370 2 2 7 7 1 -2.76 0.011847 3 3 6 6 2 -1.76 0.096750 4 4 5 5 3 -0.76 0.290251 5 5 4 4 4 0.24 0.362814 6 6 3 3 5 1.24 0.193501 7 * 7 2 2 6 2.24* 0.041464* 8 8 1 1 7 3.24 0.002962 9 9 0 0 8 4.24 0.000041 *:为实际四格表 26 二、检验步骤(本例n=17<40 ) 计算表内四个格子数据的各种组合的概率Pi (表8-4) 本例(a-T)*=2.24, P* =0.041464 确定累计概率值 双侧检验 P = P (1) + P (2) + P (7) + P (8) + P (9) =0.057 单侧检验 P = P (7) + P (8) + P (9) =0.044 H0 :1 2 ,H1 :1 2 ,0.05 27 第二节 配对四格表资料的 χ2 检验
阿94见有198修良海本,◆卧梅本◆利 用人。B局种格春玉地奉游按葡,地品儿 来95。阿A、日局种格养盖的有使格养 率是香不等? 善善能计黄McNemar tes线 2 -- *乡康: 脱,:BaC,限:BuC,g-a5 丹义列表普样 第三节 -=0.36v=1 RXC列表资料的x检 005. 春的有植心中白有 有景行C时,垂场里xC知
28 与计量资料推断两总体均数是否有差 别有成组设计和配对设计一样,计数 资料推断两个总体率(构成比)是否 有差别也有成组设计和配对设计,即 四格表资料和配对四格表资料。 29 例9.4 现有198份痰标本,每份标本分别 用A、B两种培养基培养结核菌,结果见 表9-5。问A、B两种培养基的阳性培养 率是否不等? A培养基 B培养基 合计 + - + 48(a) 24(b) 72 - 20(c) 106(d) 126 合计 68 130 198 30 样品号 A培养基 B培养基 1 + + 2 + - 3 - + 4 - - …… …… …… 198 + - 表9-5 A、B两种培养基的培养结果 A培养基 B培养基 合计 + - + 48(a) 24(b) 72 - 20(c) 106(d) 126 合计 68 130 198 31 上述配对设计实验中,就每个对子而言,两种 处理的结果不外乎有四种可能: ① A、B两种检测方法皆为阳性数(a); ② A、B两种检测方法皆为阴性数 (d); ③ A法为阳性、B法为阴性数 (b); ④ A法为阴性、B法为阳性数 (c)。 其中,a, d 为两法观察结果一致的两种情况, b, c为两法观察结果不一致的两种情况。 32 检验统计量(McNemar test) , 1 1 , 1 2 2 c 2 2 b 2 2 2 2 2 2 2 b c b c b c b c b c b c b c b c T A T c A培养基的阳性率=(a+b)/n, B培养基的阳性率=(a+c)/n, 阳性率的差值= (b-c)/n,若阳性率无差异则B=C b与c两个格子的理论数为(b+c)/2 当b+c≥40时: 当b+c<40时: 32 33 注意: 本法一般用于样本含量不太大的资料。因为 它仅考虑了两法结果不一致的两种情况(b, c), 而未考虑样本含量n和两法结果一致的两种情况(a, d)。所以,当 n 很大且 a 与 d 的数值很大(即 两法的一致率较高),b 与 c 的数值相对较小时, 即便是检验结果有统计学意义,其实际意义往往 也不大。 34 H0 :B C ,H1 :B C , 0.05 检验步骤: 2 2 (24 20) 0.36 24 20 1 P > 0.05.按α=0.05水准,不拒绝H0 ,认为两种培 养基的阳性培养率相同。 35 第三节 R×C列联表资料的χ2检验 36 行×列表资料 ① 多个样本率比较时, 有 R 行 2 列,称为 R ×2表; ② 两个样本的构成比比较时, 有 2 行 C 列,称 2×C 表; ③ 多个样本的构成比比较, 有 R 行 C 列,称为 R ×C 表
检验能计量 产多个坪来平的此酸 ★步康 香不 0.05 代8量数 多个部来来两的多变比 (选拳) -x2◆制债partitions of method) d-k1) S幼ee'可两 便餐锅的制来不克。 泉海令新西的 d-k-i
37 检验统计量 2 2 ( 1) ( 1)( 1) R C A n n n 行数 列数 T A T 2 2 ( ) 38 多个样本率的比较 例9-5 某医院用3种方案治疗急性无黄疸型病 毒肝炎254例,观察结果见表9-6,问3种疗 法的有效率是否不同。 表9-6 3种方案治疗急性肝炎的效果 组别 有效 无效 合计 有效率(%) 西药组 51 49 100 51.00 中药组 35 45 80 43.75 中西药结合组 59 15 74 79.73 合计 145 109 254 57.09 39 检验步骤: H0:3种治疗方案的有效率相等 H1:3种治疗方案的有效率不等或不全相等 α=0.05 1 ) 7 4 1 0 9 1 5 7 4 1 4 5 5 9 8 0 1 0 9 4 5 8 0 1 4 5 3 5 1 0 0 1 0 9 4 9 1 0 0 1 4 5 5 1 2 5 4 ( 2 2 2 2 2 2 2 2 5 4 ( 0 . 1 7 9 4 0 . 2 2 0 3 0 . 1 0 5 6 0 . 2 3 2 2 0 . 3 2 4 4 0 . 0 2 7 9 1 ) 2 2 . 8 1 υ = ( 3 - 1 ) ( 2 - 1 ) = 2 P < 0.05 ,在α=0.05的检验水准下, 拒绝H0 ,接受H1,认为三种疗法的有效率不等或不全相等。 40 样本构成比的比较 例9-6 某研究人员收集了亚洲、欧洲和北美洲 人的A、B、AB、O血型资料,结果见表9-7. 问不同地区人群ABO血型分类构成比是否不同。 表9-6 三个不同地区血型样本的频分布 地区 A B AB O 合计 亚洲 321 369 95 295 1080 欧洲 258 43 22 194 517 北美洲 408 106 37 444 995 合计 987 518 154 933 2592 41 检验步骤 H0:不同地区人群血型分布总体构成比相同 H1:不同地区人群血型分布总体构成比不同或不全相同 α=0.05 2 2 2 2 321 369 444 2592( 1) 297.38 987 1080 518 1080 933 995 (3 1)(4 1) 6 P < 0.05 ,在α=0.05检验水准下,拒绝H0,接受 H1,认为三个不同地区的人群血型分布总体构成比 不同或不全相同。 42 表9-6 3种方案治疗急性肝炎的效果 组别 有效 无效 合计 有效率(%) 西药组 51 49 100 51.00 中药组 35 45 80 43.75 合计 86 94 180 47.78 如果仅有两组构成比假设检验如何写? 43 χ2分割法(partitions of χ2 method) Scheffe’可信区间法 SNK法 多个样本率间的多重比较 (选学) 44 行×列表的分割 重新规定检验水准: I型错误的概率不变。 检验水准的估计方法: 根据分析目的 45 1.多个实验组间的两两比较 K:为样本率的个数 2.实验组与同一个对照组的比较 ' k 1 2 k(k -1) ’
限.7对湖85中点86省青情成后s高地模 款脸少康 智 了以认汤中葛与中西高地合梯内所美齿 有成平有是开,中番腾蜂金始对齿香于平 春议唐盒4调一对属鱼光展西残结添儿B9
46 表 8-8 1时的 2 界值表(供多个样本率间的多重比较用) 2 P 2 P 2 P 6.24 0.01250 7.48 0.00625 8.21 0.00417 6.96 0.00833 7.88 0.00500 8.49 0.00358 7.24 0.00714 8.05 0.00455 8.73 0.00313 47 例8.7 对例8.5中表8-6的资料进行两两比较, 以推断是否任两种疗法治疗急性无黄疸型 病毒肝炎的有效率均有差别? 48 H0 : A B ,即任两对比组的总体有效率相等 H1 : A A ,即任两对比组的总体有效率不等 0.05 检验步骤 本例为3个实验组间的两两比较 0.0167 3 0.05 3(3 1)/ 2 ' 0.05 49 表 8-9 3 种疗法有效率的两两比较 对比组 有效 无效 合计 2 P 西药组 51 49 100 中药组 35 45 80 合计 86 94 180 0.94 >0.0167 中药组 35 45 80 中西药结合组 59 15 74 合计 94 60 154 20.93 <0.00313 西药组 51 49 100 中西药结合组 59 15 74 合计 110 64 174 15.10 <0.00313 50 H0 : T C ,即各试验组与对照组的总体有效率相等 H1 : T C ,即各试验组与对照组的总体有效率不等 0.05 本例为各实验组与同一对照组的比较 各试验组与同一对照组比较的P值结果见表8-9 0.025 3 1 ' 例 8.8 以例8.5中表8-6资料中的中药治疗组为对照 组,西药治疗组与中西药结合为试验组,试分析两 试验组与对照组的总体有效率有无差别? 51 可以认为中药与中西药结合治疗肝炎的 有效率有差异,中西药结合的疗法好于单 纯用中药的疗法。尚不能认为西药与中药 治疗肝炎的有效率有差异。 52 1.理论频数:行列表中的各格T≥1,并且1≤T<5的 格子数不宜超过1/5格子总数,否则可能产生偏性。 处理方法有三种: 增大样本含量以达到增大理论频数的目的, 属首选方法,只是有些研究无法增大样本含 量,如同一批号试剂已用完等。 三、行×列表资料 χ2 检验的注意事项 53 根据专业知识,删去理论频数太小的行或 列,或将理论频数太小的行或列与性质相 近的邻行或邻列合并。例如:不同年龄组 可以合并,但不同血型就不能合并。 改用双向无序R×C表的Fisher确切概率法 (可用SAS软件实现)。 54 2.多个样本率比较:若所得统计推断为拒绝H0,接 受H1时,只能认为各总体率之间总的来说有差别,但 不能说明任两个总体率之间均有差别。要进一步推断 哪两两总体率之间有差别,需进一步做多个样本率的 多重比较。 3.实际应用中:对于行列表资料要根据其分类类型和 研究目的选用恰当的检验方法