石西子大学 明德正行 博学经能 第三章离散程度的统计描述 (Measures of Dispersion 预防医学象 芮东升
1 第三章 离散程度的统计描述 (Measures of Dispersion) 预防医学系 芮东升 1
例3.1对甲乙两名高血压患者连续观察5天,测得 的收缩压(mmHg)结果如下: 患者 第1天第2天 第3天第4天第5天 均数平 甲患者 162 145 178 142 186 162.6 乙患者 164 160 163 159 166 162.4 可以看出:两患者收缩压的均数十分接近,但甲 患者的血压波动较大,而乙患者相对稳定。通 常,描述一组观察值,除需要表示其平均水平 外,还要说明它的离散或变异的情况
2 例3.1 对甲乙两名高血压患者连续观察 对甲乙两名高血压患者连续观察 对甲乙两名高血压患者连续观察 对甲乙两名高血压患者连续观察5天,测得 的收缩压(mmHg)结果如下: 患者 第1天 第2天 第3天 第4天 第5天 均数 甲患者 162 145 178 142 186 162.6 乙患者 164 160 163 159 166 162.4 X 2 可以看出:两患者收缩压的均数十分接近,但甲 患者的血压波动较大,而乙患者相对稳定。通 常,描述一组观察值,除需要表示其平均水平 外,还要说明它的离散或变异的情况
190 180 170 160 150 140 130 甲患者 乙患者 两患者收缩压之间的离散程度比较 3
3 130 140 150 160 170 180 190 0 0.5 1 1.5 2 2.5 两患者收缩压之间的离散程度比较 甲患者 乙患者
第一节衡量变异程度的指标 一、间距指标 (一)极差(Range) 也称作全距,即观察值中最大值和最小值之差,用符 号R表示。如前例甲乙两患者收缩压的极差分别为 R年=186-142=44(mmHg) Rz=166-159=7(mmHg) 该法简单明了、容易使用,如用于说明传染病、食 物中毒等的最短、最长潜伏期等;缺点是结果不稳定。 4
4 第一节 衡量变异程度的指标 衡量变异程度的指标 衡量变异程度的指标 衡量变异程度的指标 一、间距指标 (一)极差(Range) (Range) (Range) (Range) 也称作全距,即观察值中最大值和最小值之差,用符 也称作全距,即观察值中最大值和最小值之差,用符 也称作全距,即观察值中最大值和最小值之差,用符 也称作全距,即观察值中最大值和最小值之差,用符 号R 表示。如前例甲乙两患者收缩压的极差分别为 表示。如前例甲乙两患者收缩压的极差分别为 表示。如前例甲乙两患者收缩压的极差分别为 表示。如前例甲乙两患者收缩压的极差分别为 该法简单明了、容易使用,如用于说明传染病、食 该法简单明了、容易使用,如用于说明传染病、食 该法简单明了、容易使用,如用于说明传染病、食 该法简单明了、容易使用,如用于说明传染病、食 物中毒等的最短、最长潜伏期等;缺点是 物中毒等的最短、最长潜伏期等;缺点是 物中毒等的最短、最长潜伏期等;缺点是 物中毒等的最短、最长潜伏期等;缺点是结果不稳定。 R 甲 = 186 − 142 = 44 (mmHg) R 乙 = 166 − 159 = 7 (mmHg) 4
(二)四分位数间距(Quartile) =Ps-Ps 如由上一章例2.4算出,50岁~60岁正常女性血清 甘油三脂含量的百分位数P75和P25的位置分别为 0.632mmol/L和1.357mmo/L,则 0=1.357-0.632=0.725(mmol/L) 四分位数间距主要用于衡量明显偏态分布资料的 变异程度。 =0.40+630×025-27 ×0.30=0.632(mmol/L) 169 =1.30 630x0.75-457×0.30=1.357mmoy四 81
5 (二)四分位数间距 (二)四分位数间距 (二)四分位数间距 (二)四分位数间距 (Quartile) 如由上一章例2.4 算出,50岁~60岁正常女性血清 岁正常女性血清 岁正常女性血清 岁正常女性血清 甘油三脂含量的百分位数 甘油三脂含量的百分位数 甘油三脂含量的百分位数 甘油三脂含量的百分位数P75和P25的位置分别为 0.632 mmol/L和1.357 mmol/L,则 四分位数间距主要用于衡量明显偏态分布资料的 四分位数间距主要用于衡量明显偏态分布资料的 四分位数间距主要用于衡量明显偏态分布资料的 四分位数间距主要用于衡量明显偏态分布资料的 变异程度。 Q = P75 − P25 Q =1.357 − 0.632 = 0.725(mmol/L) 0.30 0.632(mmol/L) 169 630 0.25 27 0.40 25 × = × − P = + 0.30 1.357(mmol/L) 81 630 0.75 457 1.30 75 × = × − P = + 5
二、平均差距指标 (一)平均偏差(Mean Difference) 平均偏差=∑r-升 n 如对于例3.1: 甲意者:平均m差-162-1626+l45-162④++86-1626=1520mlg 乙惠者:平均偏差=164-1624+60-1624++6-1624-2320mmlg 5 特点:直观,易理解;但由于用了绝对值,不便于数 学处理,实际中很少使用
6 二、平均差距指标 二、平均差距指标 二、平均差距指标 二、平均差距指标 (一)平均偏差 (一)平均偏差 (一)平均偏差 (一)平均偏差(Mean Difference (Mean Difference (Mean Difference (Mean Difference) 如对于例3.1: 甲患者: 乙患者: 特点:直观 , 易理解;但由于用了 易理解;但由于用了 易理解;但由于用了 易理解;但由于用了绝对值,不便于数 学处理,实际中很少使用。 学处理,实际中很少使用。 学处理,实际中很少使用。 学处理,实际中很少使用。 n ∑ X − X 平均偏差 = 15.52(mmHg) 5 162 162.6 145 162.6 186 162.6 = − + − + + − = ⋯ 平均偏差 2.32(mmHg) 5 164 162.4 160 162.4 166 162.4 = − + − + + − = ⋯ 平均偏差 6
(二)离均差平六和(Sum of Square,SS) 为了克服平均偏差的缺点,可以不通过取绝对 值,而是通过取平方来进免正负抵消,即使用离 均差平方和,其计算公式为 =∑(r-2-∑r② SS通奢作为一个中间统计量使用
7 (二)离均差平方和( (二)离均差平方和( (二)离均差平方和( (二)离均差平方和(Sum of Square Sum of Square Sum of Square Sum of Square,SS) 为了克服平均偏差的缺点,可以不通过取绝对 为了克服平均偏差的缺点,可以不通过取绝对 为了克服平均偏差的缺点,可以不通过取绝对 为了克服平均偏差的缺点,可以不通过取绝对 值,而是通过取平方来 值,而是通过取平方来 值,而是通过取平方来 值,而是通过取平方来避免正负抵消,即使用离 均差平方和,其计算公式为 均差平方和,其计算公式为 均差平方和,其计算公式为 均差平方和,其计算公式为 SS 通常作为一个中间统计量使用。 通常作为一个中间统计量使用。 通常作为一个中间统计量使用。 通常作为一个中间统计量使用。 ∑ ∑ = ∑ − = − n X SS X X X 2 2 2 ( ) ( ) 7
(三)六差Variance) 方差是将离均差平方和再取平均,即 o2=∑(K-4)2 52=∑(r-T)2 W n-1 注意:对于样本资料,分母用的是-1,称为 自由度(degree of freedom,df)o 方差的特点:便于数学上的处理,但由于有平 方,度量衡发生变化,不便于实际应用
8 (三)方差 (Variance) (Variance) (Variance) (Variance) 方差是将离均差平方和再取平均,即 方差是将离均差平方和再取平均,即 方差是将离均差平方和再取平均,即 方差是将离均差平方和再取平均,即 注意:对于样本资料,分母用的是 注意:对于样本资料,分母用的是 注意:对于样本资料,分母用的是 注意:对于样本资料,分母用的是n-1,称为 自由度(degree of freedom (degree of freedom (degree of freedom (degree of freedom,df )。 方差的特点:便于数学上的处理,但由于有平 方差的特点:便于数学上的处理,但由于有平 方差的特点:便于数学上的处理,但由于有平 方差的特点:便于数学上的处理,但由于有平 方,度量衡发生变化 度量衡发生变化 度量衡发生变化 度量衡发生变化,不便于实际应用。 ,不便于实际应用。 ,不便于实际应用。 ,不便于实际应用。 1 ( ) 2 2 − − = ∑ n X X S 8 N X 2 2 ∑ ( − ) = µ σ
(四)标准差(Standard Deviation) 将六差取平方根,还原成与原始观察值单位相同 的支异量度即为标准差: n-1 n-1 例如对于倒3.1经计算有 甲患者: ∑r=813 ∑r2=133713 n=5 133713-8132/5 S- =19.49(mmHg) 5-1 乙卷者: S=2.88(mmHg) 9
9 (四)标准差 (Standard Deviation) 将方差取平方根,还原成与原始观察值单位相同 将方差取平方根,还原成与原始观察值单位相同 将方差取平方根,还原成与原始观察值单位相同 将方差取平方根,还原成与原始观察值单位相同 的变异量度即为标准差: 的变异量度即为标准差: 的变异量度即为标准差: 的变异量度即为标准差: 例如对于例3.1经计算有 甲患者: 乙患者: 1 ( ) 1 ( ) 2 2 2 − − = − − = ∑ ∑ ∑ n X X n n X X S ∑ X =813 133713 2 ∑X = n = 5 19.49(mmHg) 5 1 133713 813 / 5 2 = − − S = S = 2.88(mmHg) 9
(五)变异条数(Coefficient of Variation) CV= S ×100% 主要用于对均数相差较大或单位不同的几组观察值的 变异程度进行比较。 例3.3测得某地成年人舒张压均数为77.5mmHg,标准 差为10.7mmHg;收缩压均数为122.9mmHg,标准差为 17.ImmHg。试比较舒张压和收缩压的变异程度。 10.7 17.1 CY舒张压= ×100%=13.8% CY收缩压=122.9 ×100%=13.9% 77.5 10
10 (五)变异系数(Coefficient of Variation (Coefficient of Variation (Coefficient of Variation (Coefficient of Variation ) 主要用于对均数相差较大或单位不同 均数相差较大或单位不同 均数相差较大或单位不同 均数相差较大或单位不同的几组观察值的 的几组观察值的 的几组观察值的 的几组观察值的 变异程度进行比较。 变异程度进行比较。 变异程度进行比较。 变异程度进行比较。 例3.3 测得某地成年人舒张压均数为 测得某地成年人舒张压均数为 测得某地成年人舒张压均数为 测得某地成年人舒张压均数为77.5mmHg, 77.5mmHg, 77.5mmHg, 77.5mmHg,标准 差为10.7mmHg 10.7mmHg 10.7mmHg 10.7mmHg;收缩压均数为 ;收缩压均数为 ;收缩压均数为 ;收缩压均数为122.9mmHg, 122.9mmHg, 122.9mmHg, 122.9mmHg,标准差为 17.1mmHg 17.1mmHg 17.1mmHg 17.1mmHg。试比较舒张压和收缩压的变异程度。 。试比较舒张压和收缩压的变异程度。 。试比较舒张压和收缩压的变异程度。 。试比较舒张压和收缩压的变异程度。 = ×100% X S CV 100% 13.8% 77.5 10.7 CV舒张压 = × = 100% 13.9% 122.9 17.1 CV收缩压 = × = 10