第七章两独立样本定量资料的统计分析的 Stata实现 例7-1为研究金属镉中毒对大鼠肝脏中锌含量的影响,随机抽取20只小 鼠,随机分为实验组和对照组。实验组小鼠每日经饮水染毒,对照组正常饮水。 1个月后,测量小鼠肝脏中锌含量(ug/ml)(表7-1),试分析两种饮用水小鼠的 肝脏中锌平均含量有无差异。 表7-1实验组和对照组小鼠肝脏中锌含量(ug/ml) 实验组7145.957.1082610087919079.30864851 对照组6617317.206597655596.39657791786 例7-2为研究接触某重金属对人体血胰岛素水平有无影响,研究者从接触某 重金属的职业工人中随机抽取14人,从非接触工人中随机抽取14人,测量每个 工人的血胰岛素水平(ulu/ml)(表7-2),试分析上述两个人群的血胰岛素平均 水平有无差异。 表7-2某重金属接触工人和非接触工人血胰岛素水平(uu/ml) 7848.118459.3810.22122811.57 接触重金属工人 11.388.238.923.024.547.116.04 17.9474291294578616.4824.12 非接触工人 8.578926.7492316.295.738.51 例7-3随机抽取30名在校大学生,男性16人,女性14人,检测血红蛋 白含量(gul),问男性和女性大学生的血红蛋白平均含量有无差别?(数据略) 例7-4例7-1中要检验两种饮水小鼠的肝脏锌平均含量有无差别,需要先 检验实验组和对照组所来自的总体方差是否相等,即对例7-1中资料进行方差齐 性检验 例7-1的 Stata数据格式如下: 1|实验组 7.14 「实验组5.951 3实验组 7.1
第七章两独立样本定量资料的统计分析的 Stata 实现 例 7-1 为研究金属镉中毒对大鼠肝脏中锌含量的影响,随机抽取 20 只小 鼠,随机分为实验组和对照组。实验组小鼠每日经饮水染毒,对照组正常饮水。 1 个月后,测量小鼠肝脏中锌含量(ug/ml)(表 7-1),试分析两种饮用水小鼠的 肝脏中锌平均含量有无差异。 表 7-1 实验组和对照组小鼠肝脏中锌含量(ug/ml) 例 7-2 为研究接触某重金属对人体血胰岛素水平有无影响,研究者从接触某 重金属的职业工人中随机抽取 14 人,从非接触工人中随机抽取 14 人,测量每个 工人的血胰岛素水平(ulu/ml)(表 7-2),试分析上述两个人群的血胰岛素平均 水平有无差异。 表 7-2 某重金属接触工人和非接触工人血胰岛素水平(ulu/ml) 接触重金属工人 7.84 8.11 8.45 9.38 10.22 12.28 11.57 11.38 8.23 8.92 3.02 4.54 7.11 6.04 非接触工人 17.94 7.42 9.12 9.45 7.86 16.48 24.12 8.57 8.92 6.74 9.23 16.29 5.73 8.51 例 7-3 随机抽取 30 名在校大学生,男性 16 人,女性 14 人,检测血红蛋 白含量(g/ul),问男性和女性大学生的血红蛋白平均含量有无差别?(数据略) 例 7-4 例 7-1 中要检验两种饮水小鼠的肝脏锌平均含量有无差别,需要先 检验实验组和对照组所来自的总体方差是否相等,即对例 7-1 中资料进行方差齐 性检验。 例 7-1 的 Stata 数据格式如下: group x 1 实验组 7.14 2 实验组 5.95 3 实验组 7.1 实验组 7.14 5.95 7.10 8.26 10.08 7.91 9.07 9.30 8.64 8.51 对照组 6.61 7.31 7.20 6.59 7.65 5.59 6.39 6.57 7.91 7.86
4实验组 8.26 10.08 6实验组 7.91 实验组 9,07 9.3 9实验组 8.64 10实验组 11|对照组 6.61 12对照组 7.31 13对照组 14对照组 15对照组 7.65 16对照组 5.59 17对照组 6.39 18对照组 6.57 19对照组 7.91 20对照组 7.86 正态性检验的程序和结果如下:a=0.05 swilk x if group=="实验组”对实验组资料进行正态性检验 Shapiro-Wilk w test for normal data VariableS V Prob>z x|100.979840.311-1.8030.96432 P=0.96432〉α,按正态性假定进行统计分析。 swilk x if group=="对照组”对对照组资料进行正态性检验 Shapiro-wilk w test for normal data VariableS V Prob)z 0.93502 1.001 0020.49903
4 实验组 8.26 5 实验组 10.08 6 实验组 7.91 7 实验组 9.07 8 实验组 9.3 9 实验组 8.64 10 实验组 8.51 11 对照组 6.61 12 对照组 7.31 13 对照组 7.2 14 对照组 6.59 15 对照组 7.65 16 对照组 5.59 17 对照组 6.39 18 对照组 6.57 19 对照组 7.91 20 对照组 7.86 正态性检验的程序和结果如下: = 0.05 swilk x if group=="实验组" 对实验组资料进行正态性检验 Shapiro-Wilk W test for normal data Variable | Obs W V z Prob>z -------------+------------------------------------------------- x | 10 0.97984 0.311 -1.803 0.96432 P=0.96432>,按正态性假定进行统计分析。 swilk x if group=="对照组" 对对照组资料进行正态性检验 Shapiro-Wilk W test for normal data Variable | Obs W V z Prob>z -------------+------------------------------------------------- x | 10 0.93502 1.001 0.002 0.49903
P=0.49903〉α,按正态性假定进行统计分析。 方差齐性检验程序和结果如下:(a=0.10) sdtest x, by(group) 方差齐性检验 Variance ratio test Mean Std. Err. Std. Dev 5%Conf. Interval] 对照组 6.968235262574396536.4357997.500201 实验组|10 8.196 38405211.2144797.3272149.064786 combined I 7.582.26054561.1651957.0366728.127328 Ho:sd(对照组)=sd(实验组) F(9, 9) observed = F obs 0.375 F(9, 9) lower tail = FL =F ob F(9, 9)upper tail FU =1/F obs 2.665 Ha: sd(1)sd(2) PFU=0.1604 Fobs=0.9198 方差齐性检验的P=0.1604,可以按方差齐性的假定作进一步统计分析。 例7-5对例7-1资料,试比较两种饮水小鼠肝脏平均锌含量有无差别? 相应的 Stata程序为 ttest x, by (group) 两独立样本t检验 输出结果为 Two-sample t test with equal variances Mean Std. Err. Std. Dev. [95% Conf. Interval]
P=0.49903>,按正态性假定进行统计分析。 方差齐性检验程序和结果如下: ( 0.10) = sdtest x,by(group) 方差齐性检验 Variance ratio test ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- 对照组 | 10 6.968 .2352625 .7439653 6.435799 7.500201 实验组 | 10 8.196 .3840521 1.214479 7.327214 9.064786 ---------+-------------------------------------------------------------------- combined | 20 7.582 .2605456 1.165195 7.036672 8.127328 ------------------------------------------------------------------------------ Ho: sd(对照组) = sd(实验组) F(9,9) observed = F_obs = 0.375 F(9,9) lower tail = F_L = F_obs = 0.375 F(9,9) upper tail = F_U = 1/F_obs = 2.665 Ha: sd(1) sd(2) P F_U = 0.1604 P > F_obs = 0.9198 方差齐性检验的 P= 0.1604,可以按方差齐性的假定作进一步统计分析。 例 7-5 对例 7-1 资料,试比较两种饮水小鼠肝脏平均锌含量有无差别? 相应的 Stata 程序为 ttest x,by(group) 两独立样本 t 检验 输出结果为: Two-sample t test with equal variances ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+--------------------------------------------------------------------
对照组 6.968235262574396536.4357997.500201 实验组 8.19638405211.2144797.3272149.064786 ombined 7.582 6054561.1651957.0366728.127328 1.228,4503826 2.174219-.2817813 Degrees of freedom: 18 lo:mean(对照组)-mean(实验组)=dif=0 Ha: diff 0 t=-2,7266 t=-2.7266 2.7266 P|t|=0.0138 P>t=0.993 t检验的P=00138~0.05,可以认为饮用污染的水使的小鼠肝脏中锌平均含量 高于饮用未污染水的小鼠。 例76对例7-2中的资料进行方差齐性检验,得F=4.13,P<002(具体计 算略),可认为两总体方差不等。试比较接触重金属工人和非接触工人的血胰岛 素平均水平有无差别? 例7-2的 Stata数据为 接触重金属工人 7.84 接触重金属工人 8.11 3接触重金属工人 8.45 4|接触重金属工人 「接触重金属工人 10.22 6接触重金属工人12.28 7接触重金属工人 11.57 8接触重金属工人 11.38 接触重金属工人 8.23 10接触重金属工人 8.92 11接触重金属工人 3.02 12接触重金属工人 4.54 13接触重金属工人 14接触重金属工人 6.04 15|非接触工人 17.94
对照组 | 10 6.968 .2352625 .7439653 6.435799 7.500201 实验组 | 10 8.196 .3840521 1.214479 7.327214 9.064786 ---------+-------------------------------------------------------------------- combined | 20 7.582 .2605456 1.165195 7.036672 8.127328 ---------+-------------------------------------------------------------------- diff | -1.228 .4503826 -2.174219 -.2817813 ------------------------------------------------------------------------------ Degrees of freedom: 18 Ho: mean(对照组) - mean(实验组) = diff = 0 Ha: diff 0 t = -2.7266 t = -2.7266 t = -2.7266 P |t| = 0.0138 P > t = 0.9931 t 检验的 P=0.0138<0.05,可以认为饮用污染的水使的小鼠肝脏中锌平均含量 高于饮用未污染水的小鼠。 例 7-6 对例 7-2 中的资料进行方差齐性检验,得 F=4.13,P<0.02(具体计 算略),可认为两总体方差不等。试比较接触重金属工人和非接触工人的血胰岛 素平均水平有无差别? 例 7-2 的 Stata 数据为: group x 1 接触重金属工人 7.84 2 接触重金属工人 8.11 3 接触重金属工人 8.45 4 接触重金属工人 9.38 5 接触重金属工人 10.22 6 接触重金属工人 12.28 7 接触重金属工人 11.57 8 接触重金属工人 11.38 9 接触重金属工人 8.23 10 接触重金属工人 8.92 11 接触重金属工人 3.02 12 接触重金属工人 4.54 13 接触重金属工人 7.11 14 接触重金属工人 6.04 15 非接触工人 17.94
16非接触工人 7.42 17非接触工人 9,12 18非接触工人 9.45 19非接触工人 7.86 20非接触工人 21非接触工人 24.12 22|非接触工人 8.57 23|非接触工人 8.92 24|非接触工人 6.74 25非接触工人 9.23 26非接触工人 16.29 27非接触工人 5.73 28非接触工人 8.51 由于方差不齐,所以采用方差不齐的t检验。程序和结果为: ttest x,by( group) unequal两独立样本t检验,方差不齐 Two-sample t test with unequal variances Mean Std. Err. Std. Dev. [95% Conf. Interval] 非接触工 11.171.4296815.3493758.08136314.25864 接触重金 148.363571,70326992.6313956.8442499.882894 combined I 289.766786.82708214.3765078.06975311.46382 diff 2.8064291.593291 -,529043 6.1419 Satterthwaite s degrees of freedom: 18 9433 Ho:mean(非接触工)-mean(接触重金)=dif=0 Ha: diff 0 diff> 0 1.7614 1.7614 1.76l4 P|t|=0.0943 P>t=0.0472 t检验的P=00943>0.05,可以认为接触重金属工人和非接触工人的血胰岛素
16 非接触工人 7.42 17 非接触工人 9.12 18 非接触工人 9.45 19 非接触工人 7.86 20 非接触工人 16.48 21 非接触工人 24.12 22 非接触工人 8.57 23 非接触工人 8.92 24 非接触工人 6.74 25 非接触工人 9.23 26 非接触工人 16.29 27 非接触工人 5.73 28 非接触工人 8.51 由于方差不齐,所以采用方差不齐的 t 检验。程序和结果为: ttest x,by(group) unequal 两独立样本 t 检验,方差不齐 Two-sample t test with unequal variances ------------------------------------------------------------------------------ Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- 非接触工 | 14 11.17 1.429681 5.349375 8.081363 14.25864 接触重金 | 14 8.363571 .7032699 2.631395 6.844249 9.882894 ---------+-------------------------------------------------------------------- combined | 28 9.766786 .8270821 4.376507 8.069753 11.46382 ---------+-------------------------------------------------------------------- diff | 2.806429 1.593291 -.529043 6.1419 ------------------------------------------------------------------------------ Satterthwaite's degrees of freedom: 18.9433 Ho: mean(非接触工) - mean(接触重金) = diff = 0 Ha: diff 0 t = 1.7614 t = 1.7614 t = 1.7614 P |t| = 0.0943 P > t = 0.0472 t 检验的 P=0.0943>0.05,可以认为接触重金属工人和非接触工人的血胰岛素
平均水平没有差别。 例7-7为研究孕妇患有妊娠合并症对葡萄糖耐受水平有无影响,对17名孕 妇作葡萄糖耐受水平试验,其中有9名孕妇曾患有妊娠合并症,而另外8名没有 患妊娠合并症(表7-4中第(1)、(3)列)。试比较患与未患妊娠合并症的孕妇 葡萄糖平均耐受水平是否相同? 表7-4患与未患妊娠合并症的孕妇葡萄糖耐受水平试验比较 患妊娠合并症 未患妊娠合并症 葡萄糖耐受水平秩次 葡萄糖耐受水平秩次 (1) (2) (3) (4) 110 120 4.5 l19 140 133 127 132 128 135 1 15 4.5 143 l81 71=47.5 n2=9 72=105.5 例7-7的 Stata数据如下 group 患妊娠合并症 110 患妊娠合并症 119 3患妊娠合并症 133 患妊娠合并症 127 5患妊娠合并症 14 6患妊娠合并症 117 7患妊娠合并症 135 8惠妊娠合并症 120 9未惠妊娠合并症 120 10未患妊娠合并症 140 未患妊娠合并症 162
平均水平没有差别。 例 7-7 为研究孕妇患有妊娠合并症对葡萄糖耐受水平有无影响,对 17 名孕 妇作葡萄糖耐受水平试验,其中有 9 名孕妇曾患有妊娠合并症,而另外 8 名没有 患妊娠合并症(表 7-4 中第(1)、(3)列)。试比较患与未患妊娠合并症的孕妇 葡萄糖平均耐受水平是否相同? 表 7-4 患与未患妊娠合并症的孕妇葡萄糖耐受水平试验比较 患妊娠合并症 未患妊娠合并症 葡萄糖耐受水平 (1) 秩次 (2) 葡萄糖耐受水平 (3) 秩次 (4) 110 1 120 4.5 119 3 140 11 133 9 162 14 127 6 184 17 141 12 132 8 117 2 128 7 135 10 177 15 120 4.5 143 13 181 16 n1=8 T1=47.5 n2=9 T2=105.5 例 7-7 的 Stata 数据如下: group x 1 患妊娠合并症 110 2 患妊娠合并症 119 3 患妊娠合并症 133 4 患妊娠合并症 127 5 患妊娠合并症 141 6 患妊娠合并症 117 7 患妊娠合并症 135 8 患妊娠合并症 120 9 未患妊娠合并症 120 10 未患妊娠合并症 140 11 未患妊娠合并症 162
12未患妊娠合并症 184 13|未患妊娠合并症 132 4未患妊娠合并症 128 5未患妊娠合并症 177 16未患妊娠合并症 143 17未患妊娠合并症 181 Stata程序和结果如下 ra u by(g) Two-sample Wilcoxon rank-sum(Mann-Whitney) test rank sum expected 47.5 2 9 105.5 unad justed variance 108.00 d justment for ti adjusted variance 107.87 Prob>|z|=0.0183 t检验的P=00183∞0.05,可以认为患与未患妊娠合并症的孕妇葡萄糖平均耐 受水平不同。未患妊娠合并症的孕妇葡萄糖平均耐受水平比患的高。 例7-8例7-2资料经方差齐性检验认为两总体方差不等,为比较重金属接触 工人和非接触工人的血胰岛素水平有无差别,也可以用 Wilcoxon秩和检验 例7-9为检测两种饮料被大肠杆菌污染的情况,分别从每种饮料中各随机 抽取10份样品,每份样品取出lml作细菌培养。甲饮料中共得到大肠杆菌菌落
12 未患妊娠合并症 184 13 未患妊娠合并症 132 14 未患妊娠合并症 128 15 未患妊娠合并症 177 16 未患妊娠合并症 143 17 未患妊娠合并症 181 Stata 程序和结果如下: ranksum x, by(g) Two-sample Wilcoxon rank-sum (Mann-Whitney) test g | obs rank sum expected -------------+--------------------------------- 1 | 8 47.5 72 2 | 9 105.5 81 -------------+--------------------------------- combined | 17 153 153 unadjusted variance 108.00 adjustment for ties -0.13 ---------- adjusted variance 107.87 Ho: x(g==1) = x(g==2) z = -2.359 Prob > |z| = 0.0183 t 检验的 P=0.0183<0.05,可以认为患与未患妊娠合并症的孕妇葡萄糖平均耐 受水平不同。未患妊娠合并症的孕妇葡萄糖平均耐受水平比患的高。 例 7-8 例 7-2 资料经方差齐性检验认为两总体方差不等,为比较重金属接触 工人和非接触工人的血胰岛素水平有无差别,也可以用 Wilcoxon 秩和检验。 例 7-9 为检测两种饮料被大肠杆菌污染的情况,分别从每种饮料中各随机 抽取 10 份样品,每份样品取出 1ml 作细菌培养。甲饮料中共得到大肠杆菌菌落
450个,乙饮料中共得到大肠杆菌菌落230个,试问两种饮料的平均菌落数有无 差别? Stata数据如下 230 分析程序和结果如下: pol x group Poisson regression Number of obs chi2(1) 72.47 rob> chi2 0.0000 Log likelihood= -7.612088 Pseudo r2 8264 Coef. Std. Err P>|zl [95% Conf. Interval] group|-.6711683.0810558-8.280.000 8300348-5123018 cons|6.780416.115050958.930.000 6.554927.005912 Poisson回归分组的P<0001,可以认为甲饮料中的大肠杆菌比乙饮料多。 例7-10为了解2005年某地区甲乙两镇原发性肝癌的死亡情况,该地区慢性 病控制中心在甲乙两镇进行了抽样调査。甲镇调査了123443人,死于原发性肝 癌的病例97人,乙镇调查了180274人,死于原发性肝癌的63人。试问甲乙两 镇原发性肝癌的死亡率有无差别? Stata的数据为 123443 6 180274
450 个,乙饮料中共得到大肠杆菌菌落 230 个,试问两种饮料的平均菌落数有无 差别? Stata 数据如下: group x w 1 450 10 2 230 10 分析程序和结果如下: poisson x group Poisson regression Number of obs = 2 LR chi2(1) = 72.47 Prob > chi2 = 0.0000 Log likelihood = -7.612088 Pseudo R2 = 0.8264 ------------------------------------------------------------------------------ x | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- group | -.6711683 .0810558 -8.28 0.000 -.8300348 -.5123018 _cons | 6.780416 .1150509 58.93 0.000 6.55492 7.005912 ------------------------------------------------------------------------------ Poisson 回归分组的 P<0.001,可以认为甲饮料中的大肠杆菌比乙饮料多。 例 7-10 为了解 2005 年某地区甲乙两镇原发性肝癌的死亡情况,该地区慢性 病控制中心在甲乙两镇进行了抽样调查。甲镇调查了 123443 人,死于原发性肝 癌的病例 97 人,乙镇调查了 180274 人,死于原发性肝癌的 63 人。试问甲乙两 镇原发性肝癌的死亡率有无差别? Stata 的数据为 group x w 1 97 123443 2 63 180274
分析程序和结果为: poisson x group, exposure(w) Poisson regression Number of obs LR chi2(1) Prob〉chi2 0000 Log likelihood =-6. 1989818 Pseudo r2 6759 Coef. Std. Err >zl [95% Conf. Interval group|-.81027471618094-5.010.000-1.127415 493134 cons|5.174376.238977321.650.0004.705995.642763 W(exposure) Poisson回归分组的P<0001,可以认为甲镇原发性肝癌的死亡率比乙镇髙
分析程序和结果为: poisson x group ,exposure( w) Poisson regression Number of obs = 2 LR chi2(1) = 25.86 Prob > chi2 = 0.0000 Log likelihood = -6.1989818 Pseudo R2 = 0.6759 ------------------------------------------------------------------------------ x | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- group | -.8102747 .1618094 -5.01 0.000 -1.127415 -.493134 _cons | 5.174376 .2389773 21.65 0.000 4.70599 5.642763 W | (exposure) ------------------------------------------------------------------------------ Poisson 回归分组的 P<0.001,可以认为甲镇原发性肝癌的死亡率比乙镇高