第三节、离散趋势的描述 描述计量资料数据间离散(变 异)程度的指标一变异指标
第三节、离散趋势的描述 • • 描述计量资料数据间离散(变 异)程度的指标 —变异指标
例2-10三组同龄男孩的身高值(cm) 甲组909510010511010020 乙组9698100102104100 丙组9699100101104100 88
• 例2-10 三组同龄男孩的身高值(cm) • R • 甲组 90 95 100 105 110 100 20 • 乙组 96 98 100 102 104 100 8 • 丙组 96 99 100 101 104 100 8 x
120 110 身高值 100 0 1.00 300 组别 三组同龄男孩的身高值(cm)分布
N = 5 5 5 组别 1.00 2.00 3.00 120 110 100 90 80 三组同龄男孩的身高值(cm)分布 身 高 值
几个常用的变异指标 极差( Range):用(R)表示, 即一组数据的R=最大值-最小值 意义:R值越大,表示该组数据的变异 越大。 缺点:数据利用不全,部分信息损失, 在例数少时结果不稳定
几个常用的变异指标 • 一、极差(Range):用(R)表示, 即一组数据的R=最大值– 最小值 • 意义:R值越大,表示该组数据的变异 越大。 • 缺点:数据利用不全,部分信息损失, 在例数少时结果不稳定
二、四分位数间距 (quartile rang 四分位数间距:常用QR表示 计算:用百分位数法计算数据第75%与第 25%位数之差。QR=P5%-P25% 作为变异指标比极差稳定。常用于表示偏 态分布资料的变异 例:QR=P5%-P25%=677-392=285(天) 表示方法:Ma(QR) M=51天,(QR=28.5天)
二、四分位数间距(quartile range) • 四分位数间距:常用QR表示: • 计算:用百分位数法计算数据第75%与第 25%位数之差。QR=P75%-P25% • 作为变异指标比极差稳定。常用于表示偏 态分布资料的变异。 • 例:QR= P75%-P25% =67.7-39.2=28.5(天) • 表示方法:Md(QR) • M=51天,(QR=28.5天)
表2-5资料118名链球菌咽喉炎患者潜伏期 30 频 数20 10 1224364860728496108潜伏其 p25=39.2 p75=67.7 pro 51
0 1 0 2 0 3 0 4 0 1 2 2 4 3 6 4 8 6 0 7 2 8 4 9 6 108 频 数 潜伏期 p25 = 39.2 67.7 p75 = p50 = 51 表2-5资料 118名链球菌咽喉炎患者潜伏期
标准差和方差 ( Standard deviation and variance) 公式 O总体方差 ∑(X-) (2-11) N O总体标准差 2(X-)2(212) 为总体均数
三、标准差和方差 (Standard deviation and variance) 公式 2 ( ) X N − = 2 2 ( ) X N − = 总体标准差 2 总体方差 (2-11) (2-12) 为总体均数
标准差计算公式 2(X-m 总体(理论) N ∑(X-X) 样本标 准差 当用n代替N,σ估计偏小,因此用n-1代替N
标准差计算公式 2 ( ) 1 X X S n − = − 2 ( ) X N − = 总体(理论) 样本标 准差 当用n代替N,σ估计偏小,因此用n-1代替N
标准差的简化计算公式: ∑X-C∑X)/n (2-14) 例数较少 s=22-2mx)/x (2-15) ∑f-1 频数表 资料
标准差的简化计算公式: 1 ( ) / 2 2 − − = n X X n S 1 ( ) / 2 2 − − = f f X f X f S (2-14) 例数较少 (2-15) 频数表 资料
例2-10甲组5名同龄男孩的身高值(cm) 90 8100 S/2X2-ΣX)2/n 95 9025 100 10000 50250-(500)2/5 105 11025 791 110 12100 ∑X=500∑X2=50250
例2-10 甲组5名同龄男孩的身高值(cm) • X X2 • 90 8100 • 95 9025 • 100 10000 • 105 11025 • 110 12100 • X = 500 50250 2 X = 7.91 5 1 50250 (500) / 5 2 = − − S = 1 ( ) / 2 2 − − = n X X n S