连续型数据的组间比较 Good answers come from good questions not from esoteric analysis Schoolman et al 1968
连续型数据的组间比较 Good answers come from good questions not from esoteric analysis. -- Schoolman et al., 1968
方法的选择 组数 单样本、两样本、多样本 组间是独立的还是依存的? 两独立样本、前后样本或匹配样本 ■数据的类型 ■数据的分布 正态、方差齐
方法的选择 ◼ 组数 单样本、两样本、多样本 ◼ 组间是独立的还是依存的? 两独立样本、前后样本或匹配样本 ◼ 数据的类型 ◼ 数据的分布 正态、方差齐
t分布 小样本并且总体方差未知时 ■自由度 样本大小一统计量的个数 标准差的估计 ■基于t分布构建总体均数的可信区间或进 行假设检验 方差分析( analysis of variance, ANOVA)与 F分布
t 分布 ◼ 小样本并且总体方差未知时 ◼ 自由度 样本大小-统计量的个数 标准差的估计 ◼ 基于t分布构建总体均数的可信区间或进 行假设检验 ◼ 方差分析(analysis of variance, ANOVA)与 F分布
单样本分析 One sample analysis 11名健康妇女10天日均能量摄入(kJ) 编号 日均能量摄入(kJ) 5260 2 5470 日均能量摄入参考值3 5640 求 7725k 6180 均数及标准差 6390 标准误 6515 95%可信区间 7 6805 与参考值的差 差的均数及标准差 8 7515 差的均数的标准误 7515 95%可信区间 10 8230 8770 Mean 6753.6 SD 1142.1
单样本分析One sample analysis 11名健康妇女10天日均能量摄入(kJ) 编号 日均能量摄入(kJ) 1 5260 2 5470 3 5640 4 6180 5 6390 6 6515 7 6805 8 7515 9 7515 10 8230 11 8770 Mean 6753.6 SD 1142.1 求: 均数及标准差 标准误 95%可信区间 与参考值的差 差的均数及标准差 差的均数的标准误 95%可信区间 日均能量摄入参考值 7725kJ
单样本t检验( t test) H:H1={0 H1:;1≠1 a=0.05 x-po x-po 6753.6-7725 2.821 1142.l/√11
单样本t检验(t test) 2.821 1142.1 11 6753.6 7725 0.05 : : 0 0 1 1 0 0 1 0 = − − = − = − = = = s n x s x t H H x
符号检验 Sign test 如果样本观测值与参考值在平均上没有差别的话,那么小于参考值 和大于参考值的观测数应大致相等,即:任一观测值在参考值左 边或右边的概率相等,均为1/2 利用2项分布n=11pD=1;r=2,r=9 利用正态近似理论值=mp=11×=5.5 p(1-p)=√11××号=1.658 r-np 9-5 2 2.11 1.658 5 连续性校正:z= 1.81 1.658
符号检验Sign test 如果样本观测值与参考值在平均上没有差别的话,那么小于参考值 和大于参考值的观测数应大致相等,即:任一观测值在参考值左 边或右边的概率相等,均为1/2 ( ) ( ) ( ) 1.81 1.658 9 5.5 1 : 2.11 1.658 9 5.5 1 1 11 1.658 11 5.5 2 11, ; 2, 9 2 1 2 1 2 1 2 1 2 1 2 1 = − − = − − − = = − = − − = = − = = = = = = = = = np p r np z np p r np z s np p np n p r r r 连续性校正 利用正态近似 理论值 利用 项分布
符号秩和检验 Wilcoxon signed rank sum test 比符号检验进一步,考虑了量的大小。 1.计算观测值与参考值的差; 无视正负号对差从小到大排序; 3.对所有正(或负)的顺位求和 对于小样本(n<25)查附表5。 对于大样本,利用正态近似。 =n(n+1)/4;a2=n(n+1)2n+1)/24 总秩和=n(n+1)2 非参数方法的检验效力不如参数方法。所以如果可以用参数方法就 避免用非参数方法
符号秩和检验 Wilcoxon signed rank sum test 比符号检验进一步,考虑了量的大小。 1. 计算观测值与参考值的差; 2. 无视正负号对差从小到大排序; 3. 对所有正(或负)的顺位求和。 非参数方法的检验效力不如参数方法。所以如果可以用参数方法就 避免用非参数方法。 ( ) ( )( ) ( 1) 2; 1 4; 1 2 1 24 , 25), 5 2 = + = + = + + n n n n n n n n 总秩和 对于大样本 利用正态近似。 对于小样本( 查附表 。
配对资料的分析 编号闭经前闭经后 差 d-0 5260 3910 1350 1234567 5470 4220 1250 Seld 问:闭经前 5640 3885 1755 后,日均能 量的摄入是 6180 5160 1020 sD(d vn 否有变化? 6390 745 6515 1835 1320.5 4680 6805 5265 1540 3667/11 7515 5975 1540 1320.5/110.6 7515 6790 725 =1194 8230 6900 1330 11 8770 7335 1435 Mean 6753.65433.21320.5 SD 1142.11216.8366.7
配对资料的分析 编号 闭经前 闭经后 差 1 5260 3910 1350 2 5470 4220 1250 3 5640 3885 1755 4 6180 5160 1020 5 6390 5645 745 6 6515 4680 1835 7 6805 5265 1540 8 7515 5975 1540 9 7515 6790 725 10 8230 6900 1330 11 8770 7335 1435 Mean 6753.6 5433.2 1320.5 SD 1142.1 1216.8 366.7 问:闭经前 后,日均能 量的摄入是 否有变化? ( ) ( ) 11.94 1320.5 110.6 366.7 11 1320.5 0 = = = = − = SD d n d SE d d t
两独立样本的比较 两样本均数之差的标准误 合并方差:s2 1-1s1+(n2 +n,-2 标准误:SE(x1-x)=x+ 差的95%可信区间:x-x2干109xSE(x1一x2
两独立样本的比较 两样本均数之差的标准误 ( ) ( ) ( ) ( ) 1 2 0.975 1 2 1 2 1 2 1 2 2 2 2 2 2 1 1 95% : 1 1 : 2 1 1 : x x t SE x x n n SE x x s n n n s n s s − − − = + + − − + − = 差的 可信区间 标准误 合并方差
两样本比较的例子 24小时能量消耗QMJ/天) 12×1.2382+8×1.398 消瘦型(n=13)肥胖型(n=9)s 8.79 20 7.05 9.19 1.3044MJ/天 7.48 7,48 9,68 SE(x1-x2)=13044 7.53 V139 7.58 =0.5656MJ天 7.9 11.51 8.08 平均差的95%可信区间 22322086×0.5656=10531) 8.4 x-02.232 3.95 10.15 SE(x1-x2)0.5650 10.88 Mean 8.066 10.298 SD 1.238 1.398
两样本比较的例子 24小时能量消耗(MJ/天) 消瘦型 (n=13) 肥胖型 (n=9) 6.13 8.79 7.05 9.19 7.48 9.21 7.48 9.68 7.53 9.69 7.58 9.97 7.9 11.51 8.08 11.85 8.09 12.79 8.11 8.4 10.15 10.88 Mean 8.066 10.298 SD 1.238 1.398 ( ) ( ) ( ) 3.95 0.5656 0 2.232 2.232 2.086 0.5656 1.05,3.41 95% : 0.5656MJ 天 9 1 13 1 1.3044 1.3044MJ 天 20 12 1.238 8 1.398 1 2 1 2 1 2 2 2 = = − − − = = = − = + = + = SE x x x x t SE x x s 平均差的 可信区间