第四节2检验 日)四格表检验的专用公式 将四格表中四个绝对数(a,b,C,d)代入公式(11.8) 化简后得四格表专里公式: a b a+b c d c+d a+c b+d x2= (ad-be).n (a+b)c+d)a+c)b+d) 公式(11.9) 公式(11.8)称四格表基本公式。 吉林大学远程教育学院
2 吉林大学远程教育学院 ㈡ 四格表χ 2检验的专用公式 将四格表中四个绝对数(a,b,c,d)代入公式(11.8) 化简后得四格表专用公式: a b a+b c d c+d a+c b+d ( ) (a b)(c d )(a c)(b d ) ad bc n + + + + − = 2 2 公式(11.9) 公式(11.8)称四格表基本公式。 第四节 χ 2 检验
用四格表专用公式求例11.62值如下: 治愈未治愈 (ad-be).n x A 11a) 89b) 100 atb (a+b)c+d)a+c)b+d) B31c)79d 110c+d 42 168 210 a+c b+d (11×79-31×89)}×210 n 9.66 100×110×42×168 与四格表基本公式的结果相同。实际常用四格 表专用公式求值,因为此式不必求理论数即可求 2值。 3 吉林大学远程教育学院
3 吉林大学远程教育学院 与四格表基本公式的结果相同。实际常用四格 表专用公式求χ 2值,因为此式不必求理论数即可求 χ 2值。 用四格表专用公式求例11.6 χ 2值如下: ( ) (a b)(c d )(a c)(b d ) ad bc n + + + + − = 2 2 ( ) 9.66 100 110 42 168 11 79 31 89 210 2 = − = 治愈 未治愈 A 11(a ) 89(b ) 100 a+b B 31(c ) 79(d ) 110 c+d 42 168 210 a+c b+d n
白)四格表检验的连续性校正 由于分布是一个连续型分布,而四格表中的资 料为离散型数据,由此得到的x检验统计量的抽样 分布也是离散型分布。为改善统计量分布的连续 性,需要对值作连续性校正。 连续性校正的四格表基本公式为: x-ΣH--o 公式(11.10) T 连续性校正的四格表专里公式为: 1 吉林大学远程教育学院
4 吉林大学远程教育学院 ㈢ 四格表χ 2检验的连续性校正 由于χ 2分布是一个连续型分布,而四格表中的资 料为离散型数据,由此得到的χ 2检验统计量的抽样 分布也是离散型分布。为改善χ 2统计量分布的连续 性,需要对χ 2值作连续性校正。 连续性校正的四格表基本公式为: ( ) − − = T A T 2 2 0.5 连续性校正的四格表专用公式为: 公式(11.10)
lad-bd X 公式(11.11) (a+b)c+d)a+cXb+d) 连续性校正主要针对四格表资料,尤其当理论数 较小时。四格表检验的条件为: ①当>40且每一格的T>5,不用校正。 ②当>40且有一格的1≤T<5,需校正。 ③当n<40或有一格的T<1,不能用x检验 需用Fisher精确概率法(Fisher exact test)。 吉林大学远程教育学院
5 吉林大学远程教育学院 (a b)(c d )(a c)(b d ) n n ad bc + + + + − − = 2 2 2 公式(11.11) 连续性校正主要针对四格表资料,尤其当理论数 较小时。四格表χ 2检验的条件为: ① 当n≥40且每一格的T≥5,不用校正。 ② 当n≥40且有一格的1≤T<5,需校正。 ③ 当n<40或有一格的T<1,不能用χ 2检验, 需用Fisher精确概率法(Fisher exact test)
判断四格表资料是否符合四格表检验的某条件 的简便方法为: 首先判断n是否≥40,若是(n≥40),接着求四格表 中行合计数与列合计数均最小的那一格的理论数T ,若T≥5,则用x2检验;若1≤T<5,则用校正检 验;若T<1,则用Fisher精确概率法。若否(n<40) ,则直接用Fisher精确概率法。 例11.7某医师用甲、乙两种药物治疗小儿单纯性消化不良症 状,结果见下表11-9。试问甲、乙两种药物的疗效是否有统计学差异。 吉林大学远程教育学院
6 吉林大学远程教育学院 判断四格表资料是否符合四格表χ 2检验的某条件 的简便方法为: 首先判断n是否≥40,若是(n≥40),接着求四格表 中行合计数与列合计数均最小的那一格的理论数T ,若T≥5,则用χ 2检验;若1≤T<5,则用校正χ 2检 验;若T<1,则用Fisher精确概率法。若否(n<40) ,则直接用Fisher精确概率法。 例11.7 某医师用甲、乙两种药物治疗小儿单纯性消化不良症 状,结果见下表11-9。试问甲、乙两种药物的疗效是否有统计学差异
表11-9两种药物对小儿单纯性消化不良疗效的此较 药物 痊愈数 未愈数 合计 痊愈率% 甲 26(28.82) 7(4.18) 33 78.8 乙 3633.18) 2(4.82) 38 94.7 合计 62 9 71 87.3 本例若按理论数计算公式求出所有理论数(见 括号内数),发现有两个格子的理论数小于5,且 总例数大于40,需用校正检验。 T2=hh-9x33 =4.1840 =4.82<5 n 71 吉林大学远程教育学院
7 吉林大学远程教育学院 药物 痊愈数 未愈数 合计 痊愈率% 甲 26(28.82) 7(4.18) 33 78.8 乙 36(33.18) 2(4.82) 38 94.7 合计 62 9 71 87.3 表11-9 两种药物对小儿单纯性消化不良疗效的比较 本例若按理论数计算公式求出所有理论数(见 括号内数),发现有两个格子的理论数小于5,且 总例数大于40,需用校正χ 2检验。 4.18 5 71 1 2 9 33 1 2 = = = n n n T 4.82 5 71 2 2 9 38 2 2 = = = n n n T n=71>40
H0:元1=π2 H1:元1≠2 =0.05 x-∑a-1-0s 2(26-28.82-05}(2-482-0.5} -2.75 28.82 4.82 或者 --n(6x2-36x7971 2.75 (a+b)c+d)a+c)b+d) 62×9×33×38 P 吉林大学远程教育学院
8 吉林大学远程教育学院 H0 : π1 =π2 H1 : π1 ≠π2 α= 0.05 ( ) ( ) ( ) 2.75 4.82 2 4.82 0.5 ... 28.82 0.5 26 28.82 0.5 2 2 2 2 = − − + + − − = − − = T A T ( )( )( )( ) 2.75 62 9 33 38 71 2 71 26 2 36 7 2 2 2 2 = − − = + + + + − − = a b c d a c b d n n ad bc 或者
=1,查2界值表,X20.05-3.84。今求得x2= 2.750.05,按a=0.05水准尚不能拒 绝H。,差异无统计学意义。认为甲乙两种药物的 疗效相同。 本例若不进行连续性校正,值为: X-26282.+2-482-407 28.82 4.82 则y2=4.07>3.84,则P<0.05,按a=0.05水准拒 绝H。,差异有统计学意义。与上述结论相反,丕 校正导致了假阳性错误。 吉林大学远程教育学院
9 吉林大学远程教育学院 ν=1,查χ 2界值表,χ 2 0.05(1)=3.84。今求得χ 2= 2.75<3.84,则P>0.05,按α=0.05水准尚不能拒 绝H0,差异无统计学意义。认为甲乙两种药物的 疗效相同。 本例若不进行连续性校正,χ 2值为: ( ) ( ) 4.07 4.82 2 4.82 ... 28.82 26 28.82 2 2 2 = − + + − = 则χ 2=4.07>3.84,则P<0.05,按α=0.05水准拒 绝H0,差异有统计学意义。与上述结论相反,不 校正导致了假阳性错误
二、配对四格表资料检验 对于配对设计的分类资料,可把数据整理成如 下表11-10的形式,此表常称配对四格表。 表11-10配对四格表资料的基本结构 乙法 甲法 合计 + a b a+b d c+d 合计 a+c b+d n 10 吉林大学远程教育学院
10 吉林大学远程教育学院 二、配对四格表资料χ 2检验 对于配对设计的分类资料,可把数据整理成如 下表11-10的形式,此表常称配对四格表。 + ? + a b a+b ? c d c+d 合计 a+c b+d n 表11-10 配对四格表资料的基本结构 甲法 合计 乙法
从配对四格表中可以看出,α是甲、乙两法均是 阳性的频数,d是甲、乙两法均是阴性的频数,b 是甲法阳性、乙法阴性的频数,c是甲法阴性、乙 法阳性的频数。 若比较甲、乙两法有无差别,只需推断b和c分 别代表的总体的B和C是否相等即可,其检验统计 量的计算公式为: x'-6-c) 公式(11.12) b+c 112 吉林大学远程教育学院
11 吉林大学远程教育学院 从配对四格表中可以看出,a 是甲、乙两法均是 阳性的频数,d 是甲、乙两法均是阴性的频数, b 是甲法阳性、乙法阴性的频数,c 是甲法阴性、乙 法阳性的频数。 若比较甲、乙两法有无差别,只需推断b 和c 分 别代表的总体的B 和C是否相等即可,其检验统计 量的计算公式为: ( ) b c b c + − = 2 2 公式(11.12)