四章数据特征 与统计描述 Descriptive Statistic
第四章 数据特征 与统计描述 Descriptive Statistics
本章结构 第一节频数分布表与频数分布图 第二节计量资料的常用统计指标 第三节计数资料的常用统计指标 第四节统计表与统计图冬 第五节正态分布与医学参考值
第一节 频数分布表与频数分布图 第二节 计量资料的常用统计指标 第三节 计数资料的常用统计指标 第四节 统计表与统计图 第五节 正态分布与医学参考值 本章结构
第一节频数分布表与频数分布图 频数表与频数分布 平均指标(算术均数、几何均数、中 位数、众数) 变异指标(极差、百分位数与四分位 间距、方差、标准差、变异系数
第一节 频数分布表与频数分布图 ➢频数表与频数分布 ➢平均指标(算术均数、几何均数、中 位数、众数) ➢变异指标(极差、百分位数与四分位 间距、方差、标准差、变异系数)
频数表与频数分布 (frequency table and frequency distribution)
一、频数表与频数分布 (frequency table and frequency distribution)
表4-1160名正常成年女子的血清 甘油三酯(mmo) 编 血清甘油三脂编号血清甘油三脂 0.51 0.52 153 1.65 0.59 154 1.66 0.61 155 1.67 5 0.61 156 1.67 6 0.62 157 1.69 0.63 158 1.7 8 0.64 159 1.71 160 1/77
表4-1 160名正常成年女子的血清 甘油三酯(mmol/L) 编号 血清甘油三脂 编号 血清甘油三脂 1 0.51 … … 2 0.52 153 1.65 3 0.59 154 1.66 4 0.61 155 1.67 5 0.61 156 1.67 6 0.62 157 1.69 7 0.63 158 1.7 8 0.64 159 1.71 … … 160 1.77
1.频数表的编制步骤 (1)求极差( range):即最大值与最小值之差,又称 为全距。 本例极差:R=1.77-051=126(mmoI (2)决定组数、组段和组距:根据研究目的和样本含量 n确定。组距=极差阻组数,通常分1015个组,为方便计, 组距参考极差的十分之一,再略加调整。 本例户RM10=1.2610=0126≈01 (3)列出组段:第一组段的下限略小于最小值,最后 个组段上限必须包含最大值,其它组段上限值忽略。 4)划记计数:用划记法将所有数据归纳到各组段,得 到各组段的频数
1. 频数表的编制步骤 (1)求极差(range):即最大值与最小值之差,又称 为全距。 本例极差: R=1.77-0.51=1.26(mmol/L) (2) 决定组数、组段和组距:根据研究目的和样本含量 n确定。组距=极差/组数,通常分10-15个组,为方便计, 组距参考极差的十分之一, 再略加调整。 本例i= R /10=1.26/10=0.126≈0.1。 (3) 列出组段:第一组段的下限略小于最小值,最后一 个组段上限必须包含最大值,其它组段上限值忽略。 (4) 划记计数:用划记法将所有数据归纳到各组段,得 到各组段的频数
组段 划记 频数,∫:组中值,X (3 (5)=(3)×(4) 0 3 0.55 1.65 目日目 0.6 正T 0.65 585 0.7 正正T 12 0.75 9.00 0.8 正正下 13 085 11.05 0.9~正正T 17 0.95 16.15 正正正下 18 1.05 18.90 正正正正 20 1.15 23.00 1.2~ 正正正下 18 125 22.50 正正正T17 1.35 22.95 正正下 13 1.45 1885 正 1.55 12.40 正 8 1.65 14.85 1.7~1.8 下 175 合计 :160 182.30
组段 (1) 划 记 (2) 频数,f (3) 组中值,X (4) fX (5)= (3)×(4) 0.5~ 3 0.55 1.65 0.6~ 正 9 0.65 5.85 0.7~ 正正 12 0.75 9.00 0.8~ 正正 13 0.85 11.05 0.9~ 正正正 17 0.95 16.15 1.0~ 正正正 18 1.05 18.90 1.1~ 正正正正 20 1.15 23.00 1.2~ 正正正 18 1.25 22.50 1.3~ 正正正 17 1.35 22.95 1.4~ 正正 13 1.45 18.85 1.5~ 正 9 1.55 12.40 1.6~ 正 8 1.65 14.85 1.7~1.8 合计 3 1.75 5.25 160 182.30
2.频数表的分布特征 ①集中趋势( central tendency):变量值集中 位置。本例在组段“11~”。 平均水平指标 ②离散趋势( tendency of dispersion):变量 值围绕集中位置的分布情况。本例0.9~14 ,共有90人,占56%;离“中心”位置越远 ,频数越小;且围绕“中心”左右对称。 变异水平指标
2. 频数表的分布特征 ①集中趋势(central tendency):变量值集中 位置。本例在组段“1.1~”。 ——平均水平指标 ②离散趋势(tendency of dispersion):变量 值围绕集中位置的分布情况。本例0.9~1.4 ,共有90人,占56%;离“中心”位置越远 ,频数越小;且围绕“中心”左右对称。 ——变异水平指标
3频数表的用途 ①揭示计量资料的分布特征 ②描述计量资料分布的集中趋势和离散趋势 ③便于发现异常值
3. 频数表的用途 ①揭示计量资料的分布特征 ②描述计量资料分布的集中趋势和离散趋势 ③便于发现异常值
第二节计量资料的常用统计指标
第二节 计量资料的常用统计指标