第十一章无序分类资料的统计分析的 Stata实现 本章使用的 Stata的命令: x2检验 tab变量1变量2, all chi2 exact expected row x2检验即时命令 tabi#11#12[.J\#21#22[-…][…] Yates'校正x2 Exactcci #a#b #c #d (见 Stata7附加程序) 配对四格表 mcci #a#b #c #d l, tb level(#)I 例11-1根据某地区的血型普查结果可知,该地区人群中血型为O的占30%, 血型为A的占25%,血型为B的占35%,血型为AB的占10%。研究者在邻近 该地区的一个山区人群中进行一个血型的流行病调査,在该山区人群中随机抽样 调查了200人,检测这些对象的血型,表11-1给出了血型检测的结果。问该山 区人群与这个地区人群的血型分布是否一致 表11-1山区人群血型抽样调查结果 血型 AB合计 人数 200 例11-2某研究小组为研究慢支口服液Ⅱ号对慢性支气管炎治疗 效果,以口服消咳喘为对照进行了临床试验,试验组120人、对照组 117人(两组受试者病程、病情等均衡),疗程2周,疗效见表11-3 问慢支口服液Ⅱ号与消咳喘治疗慢性支气管炎的疗效是否相同? 表11-3试验组与对照组疗效 组别 有效 无效 合计 有效率(%) 试验组 116 对照组 117 70.09 合计 198 83.54
第十一章无序分类资料的统计分析的 Stata 实现 本章使用的 Stata 的命令: 2 检验 tab 变量 1 变量 2 , all chi2 exact expected row 2 检验即时命令 tabi #11 #12 [...] \ #21 #22 [...] [\ ...] Yates’校正 2 Exactcci #a #b #c #d (见 Stata7 附加程序) 配对四格表 mcci #a #b #c #d [, tb level(#) ] 例11-1 根据某地区的血型普查结果可知,该地区人群中血型为O的占30%, 血型为 A 的占 25%,血型为 B 的占 35%,血型为 AB 的占 10%。研究者在邻近 该地区的一个山区人群中进行一个血型的流行病调查,在该山区人群中随机抽样 调查了 200 人,检测这些对象的血型,表 11-1 给出了血型检测的结果。问该山 区人群与这个地区人群的血型分布是否一致? 表 11-1 山区人群血型抽样调查结果 血型 O A B AB 合计 人数 50 70 50 30 200 例11-2 某研究小组为研究慢支口服液II号对慢性支气管炎治疗 效果,以口服消咳喘为对照进行了临床试验,试验组120人、对照组 117人(两组受试者病程、病情等均衡),疗程2周,疗效见表11-3。 问慢支口服液II号与消咳喘治疗慢性支气管炎的疗效是否相同? 表11-3 试验组与对照组疗效 组别 有效 无效 合计 有效率(%) 试验组 116 4 120 96.67 对照组 82 35 117 70.09 合计 198 39 237 83.54
建立检验假设,确定检验水准 H0:丌1=丌2,即两种药物治疗慢性支气管炎的疗效相同 H1:丌1≠π2,即两种药物治疗慢性支气管炎的疗效不同 0. Stata数据如下 116 Stta命令: gx(weight=). chi row 结果 I row percentage I Total 116 100.00 70.09 29.91 100.00 Total 83.54 16.46 Pearson chi2(1)=30.4463Pr=0.000 Pearson chi2(1)=30.4463Pr=0.000,P<005,按∝=005水准拒
1.建立检验假设,确定检验水准 H0 :1 = 2 ,即两种药物治疗慢性支气管炎的疗效相同 H1:1 2 ,即两种药物治疗慢性支气管炎的疗效不同 = 0.05 Stata 数据如下: g x w 1 1 116 2 1 82 1 2 4 2 2 35 Stata 命令: tab g x [weight=w],chi row 结果: +----------------+ | Key | |----------------| | frequency | | row percentage | +----------------+ | x g | 1 2 | Total -----------+----------------------+---------- 1 | 116 4 | 120 | 96.67 3.33 | 100.00 -----------+----------------------+---------- 2 | 82 35 | 117 | 70.09 29.91 | 100.00 -----------+----------------------+---------- Total | 198 39 | 237 | 83.54 16.46 | 100.00 Pearson chi2(1) = 30.4463 Pr = 0.000 Pearson chi2(1) = 30.4463 Pr = 0.000,P 0.05 ,按 =0.05 水准拒
绝H,差别有统计学意义,可认为慢支口服液II号治疗慢性支气管炎有效率高 于消咳喘。 例11-3为评价中西结合治疗抑郁发作的疗效。将187例患者随机分为2组, 两组患者均选用阿咪替林西医综合治疗,中西医结合组在上述治疗的同时,再配 合中医辨证治疗,根据中医辨证分型采用不同的方剂,治疗结果见表11-5,问两 种治疗方案的疗效有无差别? 表11-5试验组与对照组疗效 组别 有效 无效 合计 有效率(%) 中西医结合组92(88973) 2(5027) 94 97.87 西医组 85(88027) 8(4973) 9140 注;括号内为理论频数 例11-3假设检验步骤 1.建立检验假设,确定检验水准 H0:丌1=x2,即两种治疗方案疗效相同 H1:x1≠丌2,即两种治疗方案疗效不同 a=0.05 Stata命令 exactcci 922 85 8 结果: Proportion I Exposed Unexposed I Total Exposed ses 0.9787 Controls I 9140 ---+- Total 10 0.9465
绝 H0 ,差别有统计学意义,可认为慢支口服液 II 号治疗慢性支气管炎有效率高 于消咳喘。 例11-3 为评价中西结合治疗抑郁发作的疗效。将187例患者随机分为2组, 两组患者均选用阿咪替林西医综合治疗,中西医结合组在上述治疗的同时,再配 合中医辨证治疗,根据中医辨证分型采用不同的方剂,治疗结果见表11-5,问两 种治疗方案的疗效有无差别? 表11-5 试验组与对照组疗效 组别 有效 无效 合计 有效率(%) 中西医结合组 92(88.973) 2(5.027) 94 97.87 西医组 85(88.027) 8(4.973) 93 91.40 注 ;括号内为理论频数 例 11-3 假设检验步骤 1.建立检验假设,确定检验水准 H0 :1 = 2 ,即两种治疗方案疗效相同 H1:1 2 ,即两种治疗方案疗效不同 = 0.05 Stata 命令: exactcci 92 2 85 8 结果: Proportion | Exposed Unexposed | Total Exposed -----------------+------------------------+------------------------ Cases | 92 2 | 94 0.9787 Controls | 85 8 | 93 0.9140 -----------------+------------------------+------------------------ Total | 177 10 | 187 0.9465 | |
Point estimate [95% Conf. Interval I Cornfield's limits Odds ratio I 4.329412 1.8179455 Adjusted 1.004989 Unadjusted Attr. frac. ex 7690217 2225754 Ad just 1.0049646 Unadjusted Attr. fr 7526596 3.87Pr>chi2=0.0491 Yates adjusted chi2 (1)= 2. 70 Pr>chi2=0. 1005 本例需要用校正卡方,p=0.1005,两种治疗方案疗效的差异无统计学意义。 例11-4为了解国产紫外线瞬间消毒器与进口髙压蒸汽消毒机对牙科手机消 毒灭菌的效果,将刚去腐揭卡过垢等待处理的牙科手机29个随机分为A、B两组, A组为紫外线消毒组,B组为髙压蒸汽组。消毒前细菌培养均为阳性,消毒后细菌 培养结果见下表。问两种消毒法消毒后细菌培养阳性率有无差别? 表11-6两种方法消毒后细菌培养结果 组别 阳性 阴性 合计 A 10 14 合计 11 由于总频数29小于40,对两组阳性率的比较宜采用 Fisher精确概率检验, 假设检验步骤如下 1.建立检验假设,确定检验水准 即两种方法消毒后细菌培养阳性率相同
| Point estimate | [95% Conf. Interval] |------------------------+---------------------- | | Cornfield's limits Odds ratio | 4.329412 | .8179455 . Adjusted | | 1.004989 . Unadjusted Attr. frac. ex. | .7690217 | -.2225754 . Adjusted | | .0049646 . Unadjusted Attr. frac. pop | .7526596 | +----------------------------------------------- chi2(1) = 3.87 Pr>chi2 = 0.0491 Yates' adjusted chi2(1) = 2.70 Pr>chi2 = 0.1005 本例需要用校正卡方,p=0.1005,两种治疗方案疗效的差异无统计学意义。 例11-4 为了解国产紫外线瞬间消毒器与进口高压蒸汽消毒机对牙科手机消 毒灭菌的效果,将刚去腐揭卡过垢等待处理的牙科手机29个随机分为A、B两组, A组为紫外线消毒组,B组为高压蒸汽组。消毒前细菌培养均为阳性,消毒后细菌 培养结果见下表。问两种消毒法消毒后细菌培养阳性率有无差别? 表11-6 两种方法消毒后细菌培养结果 组别 阳性 阴性 合计 A 10 5 15 B 1 13 14 合计 11 18 29 由于总频数 29 小于 40,对两组阳性率的比较宜采用 Fisher 精确概率检验, 假设检验步骤如下: 1.建立检验假设,确定检验水准 H0 :1 = 2 ,即两种方法消毒后细菌培养阳性率相同
H1:π1≠π2’即两种方法消毒后细菌培养阳性率不同 0.05 Stata数据 Stta命令: tab g x weight=w), chi row expect exact fr I expected frequency row percentage 2 Total 5 5.7 9.3 15. 66.67 100.00 13 5.3 8.7 14.0 7.14 92.86 100.00 Total 11.0 18.0 62.07 earson chi2(1)= 10. 8977 Pr 0.002 1-sided Fisher's exact 0.001 本例需要用 Fisher's确切概率法,p=0.002,两种方法消毒后细菌培养阳性率不同。 例11-5为探讨埃兹蛋白( Ezrin)在胃癌组织中的表达情况,采用免疫组化法检测50
H1:1 2 ,即两种方法消毒后细菌培养阳性率不同 = 0.05 Stata 数据: g x w 1 1 10 2 1 1 1 2 5 2 2 13 Stata 命令: tab g x [weight=w],chi row expect exact +--------------------+ | Key | |--------------------| | frequency | | expected frequency | | row percentage | +--------------------+ | x g | 1 2 | Total -----------+----------------------+---------- 1 | 10 5 | 15 | 5.7 9.3 | 15.0 | 66.67 33.33 | 100.00 -----------+----------------------+---------- 2 | 1 13 | 14 | 5.3 8.7 | 14.0 | 7.14 92.86 | 100.00 -----------+----------------------+---------- Total | 11 18 | 29 | 11.0 18.0 | 29.0 | 37.93 62.07 | 100.00 Pearson chi2(1) = 10.8977 Pr = 0.001 Fisher's exact = 0.002 1-sided Fisher's exact = 0.001 本例需要用 Fisher's 确切概率法,p=0.002,两种方法消毒后细菌培养阳性率不同。 例 11-5 为探讨埃兹蛋白(Ezrin)在胃癌组织中的表达情况,采用免疫组化法检测 50
例胃癌组织、25例胃粘膜不典型增生和25例正常胃粘膜中Ezin的表达,结果见表1-9 问不同胃组织 Ezrin表达阳性率是否相同? 表11-9 Ezrin在不同胃组织中的表达 组别 观测例数 阳性例数 阴性例数 阳性率(%) 正常胃粘膜 7(15.250) 18(9.750) 不典型增生 l1(152 14(9.750) 胃癌组织 43(30.500)7(19500) 86.0 合计 100 39 61.0 注:括号内为理论频数 这是一个3个样本率的比较问题,假设检验步骤为: 1.建立检验假设,确定检验水准 H0:丌1=丌2=丌3,即3种不同胃组织Ezin表达阳性率相等 H1:丌1、丌2、x3不全相等,即3种不同胃组织 Ezrin表达阳性率不全相等 tata数据如下: 11 3 十2 14 3 2 Stta命令为: ab a b weight=x), chi 结果 2 Total 7 25 7
例胃癌组织、25 例胃粘膜不典型增生和 25 例正常胃粘膜中 Ezrin 的表达,结果见表 11-9。 问不同胃组织 Ezrin 表达阳性率是否相同? 表 11-9 Ezrin 在不同胃组织中的表达 组别 观测例数 阳性例数 阴性例数 阳性率(%) 正常胃粘膜 25 7(15.250) 18(9.750) 28.0 不典型增生 25 11(15.250) 14(9.750) 44.0 胃癌组织 50 43(30.500) 7(19.500) 86.0 合计 100 61 39 61.0 注 :括号内为理论频数 这是一个 3 个样本率的比较问题,假设检验步骤为: 1.建立检验假设,确定检验水准 H0 : 1 = 2 = 3 ,即 3 种不同胃组织 Ezrin 表达阳性率相等 H1: 1、 2 、 3 不全相等,即 3 种不同胃组织 Ezrin 表达阳性率不全相等 = 0.05 Stata 数据如下: a b x 1 1 7 2 1 11 3 1 43 1 2 18 2 2 14 3 2 7 Stata 命令为: tab a b [weight=x],chi 结果: | b a | 1 2 | Total -----------+----------------------+---------- 1 | 7 18 | 25 2 | 11 14 | 25 3 | 43 7 | 50 -----------+----------------------+----------
Total Pearson chi2(2)=27.6166Pr=0.000 P<0.05,按a=0.05水准拒绝H0,差别有统计学意义,可认为3种不同胃组织 Ezrin表 达阳性率不全相等。 例11-6为评价国产注射用头孢美唑钠(A)治疗中、重度呼吸系统细菌性感染性疾病 的临床有效性及安全性,以先锋美他醇(B)为对照进行临床试验,入组受试者疾病类型构 成情况见表11-10。问A、B两组受试者疾病类型总体构成有无差别? 表11-10两组受试者疾病类型 组别急性扁桃体炎 肺炎 急支炎慢支炎急发支扩伴感染 5(6042)21(19636)21(21650)20(20.643)5(4028) 7(5.958)18(19.364)22(21.350)21(20.357)3(3.972) 注:括号内为理论频数 这是一个2组构成比比较的问题,其假设检验步骤为 1.建立检验假设,确定检验水准 Ho:A、B受试者疾病类型总体构成相同 H1:A、B受试者疾病类型总体构成不同 a=005 Stata数据为 5 345 20 5 22 21
Total | 61 39 | 100 Pearson chi2(2) = 27.6166 Pr = 0.000 P 0.05 ,按 =0.05 水准拒绝 H0 ,差别有统计学意义,可认为 3 种不同胃组织 Ezrin 表 达阳性率不全相等。 例11-6 为评价国产注射用头孢美唑钠(A)治疗中、重度呼吸系统细菌性感染性疾病 的临床有效性及安全性,以先锋美他醇(B)为对照进行临床试验,入组受试者疾病类型构 成情况见表11-10。问A、B两组受试者疾病类型总体构成有无差别? 表 11-10 两组受试者疾病类型 组别 急性扁桃体炎 肺炎 急支炎 慢支炎急发 支扩伴感染 A 5(6.042) 21(19.636) 21(21.650) 20(20.643) 5(4.028) B 7(5.958) 18(19.364) 22(21.350) 21(20.357) 3(3.972) 注 :括号内为理论频数 这是一个 2 组构成比比较的问题,其假设检验步骤为: 1.建立检验假设,确定检验水准 H0 :A、B 受试者疾病类型总体构成相同 H1:A、B 受试者疾病类型总体构成不同 = 0.05 Stata 数据为: a b x 1 1 5 1 2 21 1 3 21 1 4 20 1 5 5 2 1 7 2 2 18 2 3 22 2 4 21 2 5 3
Stata命令为 tab a b weight=x), chi 结果为 ITotal 5 2 21 Total 41 143 Pearson chi2(4)= 1.1048 Pr =0.894 P=0.894,A、B受试者疾病类型总体构成相同。 例11-7将100份样品一分为二,分别用含血培养基与无血培养基接种培养,观察弯曲 菌检出情况,结果如表11-12所示 试问:两种培养基接种培养弯曲菌的阳性率是否相等?两种培养基培养结果间是否有关 联性? 将表11-12整理为表11-13形式 表11-13两种培养基弯曲菌检出结果 含血培养基 无血培养基 合计 合计 60 40 100 H:两种培养基接种培养弯曲菌的阳性率相同 H1:两种培养基接种培养弯曲菌的阳性率不同 a=0.05 利用 Stata的即时命令 mcci5217823 结果为 Controls
Stata 命令为: tab a b [weight=x],chi 结果为: | b a | 1 2 3 4 5 | Total -----------+-------------------------------------------------------+---------- 1 | 5 21 21 20 5 | 72 2 | 7 18 22 21 3 | 71 -----------+-------------------------------------------------------+---------- Total | 12 39 43 41 8 | 143 Pearson chi2(4) = 1.1048 Pr = 0.894 P=0.894,A、B 受试者疾病类型总体构成相同。 例 11-7 将 100 份样品一分为二,分别用含血培养基与无血培养基接种培养,观察弯曲 菌检出情况,结果如表 11-12 所示。 试问:两种培养基接种培养弯曲菌的阳性率是否相等?两种培养基培养结果间是否有关 联性? 将表 11-12 整理为表 11-13 形式 表 11-13 两种培养基弯曲菌检出结果 无血培养基 含血培养基 合计 + - + 52 17 69 - 8 23 31 合计 60 40 100 H0 :两种培养基接种培养弯曲菌的阳性率相同 H1:两种培养基接种培养弯曲菌的阳性率不同 = 0.05 利用 Stata 的即时命令 mcci 52 17 8 23 结果为: | Controls |
Exposed I McNemar's chi2(1)= 3. 24 Prob>chi2=0.0719 Exact McNemar significance probability 0.1078 P>0.05,按α=0.05水准不拒绝H,尚不能认为两种培养基接种培养弯曲菌的阳性率不 相同 Ho:两种培养基培养结果之间无关联性 H,:两种培养基培养结果之间有关联性 Stata命令为: tabi 52 17\8 23. chi 结果为 Total Total Pearson chil2(1)=21.8872Pr=0.000 P<0.05,按α=0.05水准拒绝Ho,可认为两种培养基接种培养弯曲菌结果之间存在关联
Cases | Exposed Unexposed | Total -----------------+------------------------+---------- Exposed | 52 17 | 69 Unexposed | 8 23 | 31 -----------------+------------------------+---------- Total | 60 40 | 100 McNemar's chi2(1) = 3.24 Prob > chi2 = 0.0719 Exact McNemar significance probability = 0.1078 P 0.05 ,按 =0.05 水准不拒绝 H0 ,尚不能认为两种培养基接种培养弯曲菌的阳性率不 相同。 H0 :两种培养基培养结果之间无关联性 H1:两种培养基培养结果之间有关联性 = 0.05 Stata 命令为: tabi 52 17\8 23,chi 结果为: | col row | 1 2 | Total -----------+----------------------+---------- 1 | 52 17 | 69 2 | 8 23 | 31 -----------+----------------------+---------- Total | 60 40 | 100 Pearson chi2(1) = 21.8872 Pr = 0.000 P 0.05 ,按 =0.05 水准拒绝 H0 ,可认为两种培养基接种培养弯曲菌结果之间存在关联 性