医学研究中的 常见统计问题
医学研究中的 常见统计问题
今天的内容 方法比较问题 method comparison studies 观察者间的一致性问题 observers agreement studies ■系列测量数据( series of measurements)的 组间比较
今天的内容 ◼ 方法比较问题method comparison studies ◼ 观察者间的一致性问题observers agreement studies ◼ 系列测量数据(series of measurements)的 组间比较
方法比较问题 method comparison studies ■临床上的测量大多是不精确的 □无法直接测量的量,如心脏容积、肿块大小 口虽可直接测量但难以精确测量的量 口不断变化的量,如血压 ■一种方法是否好到可以替代另外一种方法 (或两种方法可以互换)的研究
方法比较问题 method comparison studies ◼ 临床上的测量大多是不精确的 无法直接测量的量,如心脏容积、肿块大小 虽可直接测量但难以精确测量的量 不断变化的量,如血压 ◼ 一种方法是否好到可以替代另外一种方法 (或两种方法可以互换)的研究
31 Transmitral volumetric flow(MF )and left ventricularstroke volume(sv)in 21 patients without aortic valve disease Paitent MF SV diff=MF-Sv 47 43 70 2345 444 72 81 70 60 104 94 10 18 105 98 19 112 108 4 120 131 21 132 Mean 86 85.8 0.24 SD 20.3 21.2 6.96
例1 Transmitral volumetric flow (MF) and left ventricular stroke volume (SV) in 21 patients without aortic valve disease Paitent MF SV diff=MF-SV 1 47 43 4 2 66 70 -4 3 68 72 -4 4 69 81 -12 5 70 60 10 ┆ ┆ ┆ ┆ 17 104 94 10 18 105 98 7 19 112 108 4 20 120 131 -11 21 132 131 1 Mean 86 85.8 0.24 SD 20.3 21.2 6.96
MF and sv 140 120 目100 80 目上60 可 40 20 20 60 80 100120140 Stroke volume(Sv)(cm3)
MF and SV 2 0 4 0 6 0 8 0 100 120 140 2 0 4 0 6 0 8 0 100 120 140 Stroke volume (SV) (cm3) Transmitral flow (MF) (cm3)
Difference between Mf and sv plotted against average 20 40 60 80 Average of MF and SV(cm3)
Difference between MF and SV plotted against average -20 -10 0 1 0 2 0 4 0 6 0 8 0 100 120 140 Average of MF and SV (cm3) Difference (MFSV) (cm3)
■对例1的分析 口配对t检验? 口相关分析? 口平均差异反映了一种方法相对于另外一种方法 的平均偏差本例基本一致 口差异的离散度观察单位在多大范围内波动 口一致性界限 limits of agreement 142t137即个体差异在正负14cm3多 Mean+2SD将包含约95%的个体差异。本例为 内波动
◼ 对例1的分析 配对t检验? 相关分析? 平均差异反映了一种方法相对于另外一种方法 的平均偏差 本例基本一致 差异的离散度 观察单位在多大范围内波动 一致性界限limits of agreement Mean2SD将包含约95%的个体差异。本例为: -14.2 to 13.7 即个体差异在正负14cm3的范围 内波动
■当差异随均数的增大而增大时,应取对数 尺度进行分析 ■方法的可重复性评价 同一方法同一观察单位的重复测量
◼ 当差异随均数的增大而增大时,应取对数 尺度进行分析 ◼ 方法的可重复性评价 同一方法同一观察单位的重复测量
■本法的局限性 口无法判断哪种方法更接近真值 口如果一种方法是不精确的,可重复性差的,那 么它与任何其他方法比较的结果都不会理想, 所以当结果不理想时,不能轻易认为比较的两 种方法都不好。 口需要较大的样本量≥50 ■有兴趣者可进一步参阅 Bland jM and Altman DG, Statistical methods for assessing agreement between two methods of clinical measurement, 1986
◼ 本法的局限性 无法判断哪种方法更接近真值 如果一种方法是不精确的,可重复性差的,那 么它与任何其他方法比较的结果都不会理想, 所以当结果不理想时,不能轻易认为比较的两 种方法都不好。 需要较大的样本量50 ◼ 有兴趣者可进一步参阅 Bland JM and Altman DG, Statistical methods for assessing agreement between two methods of clinical measurement. 1986
观察者间的一致性研究 Inter-rater agreement ■分类数据的方法比较研究 Example 2 Assessments of 85 xeromammograms by two radiologists Radiologist B Radiologist a Normal Benign Suspected cancer Cancer Total Normal 21 12 Benign 17 uspected cancer 430 15 Cancer 0 0 00213 Total 28 38 85
观察者间的一致性研究Inter-rater agreement ◼ 分类数据的方法比较研究 Example 2 Assessments of 85 xeromammograms by two radiologists Radiologist B Radiologist A Normal Benign Suspected cancer Cancer Total Normal 21 12 0 0 33 Benign 4 17 1 0 22 Suspected cancer 3 9 15 2 29 Cancer 0 0 0 1 1 Total 28 38 16 3 85