第九章 数值变量资料的统计分析
第九章 数值变量资料的统计分析
主要内容 第一节数值型资料的统计描述 第二节正态分布和参考值范围的估计 第三节数值型资料的统计推断 第四节t检验和u检验 第五节方差分析
主要内容 第一节 数值型资料的统计描述 第二节 正态分布和参考值范围的估计 第三节 数值型资料的统计推断 第四节 t检验和u检验 第五节 方差分析
terminology statistical description 统计描述 statistical inference 统计推断 parameter estimation 参数估计 Frequency distribution 频数分布 frequency table 频数表 arithmetic Mean, average 算术平均值 standard deviation 标准差 varlance 方差 range 极差,全距,范围 geometric mean 几何平均值 median 中位数 normal distribution 正态分布 reference range 参考值范围
terminology statistical description 统计描述 statistical inference 统计推断 parameter estimation 参数估计 Frequency distribution 频数分布 frequency table 频数表 arithmetic Mean, average 算术平均值 standard deviation 标准差 variance 方差 range 极差,全距,范围 geometric mean 几何平均值 median 中位数 normal distribution 正态分布 reference range 参考值范围
统计分析包括统计描述和统计推断两大部分。 ●统计描述( statistical description)是用统计指标、统计 表和统计图描述资料的分析规律及其数量特征; ●统计推断( statistical inference)包括总体参数估计和假 设检验两个内容。 参数估计:是用样本统计量估计总体参数所在范围。 假设检验:是利用样本的实际资料来检验事先对总体某 些数量特征所作的假设是否成立。 统计描述 统计分析 统计推断/参数估计 假设检验
统计分析包括统计描述和统计推断两大部分。 ⚫统计描述(statistical description)是用统计指标、统计 表和统计图描述资料的分析规律及其数量特征; ⚫统计推断(statistical inference) 包括总体参数估计和假 设检验两个内容。 参数估计:是用样本统计量估计总体参数所在范围。 假设检验:是利用样本的实际资料来检验事先对总体某 些数量特征所作的假设是否成立。 假设检验 参数估计 统计推断 统计描述 统计分析
数值变量资料的频数分布 二、平均水平指标 三、离散程度指标
5 一、数值变量资料的频数分布 二、平均水平指标 三、离散程度指标
、数值变量资料的频数分布 1.频数表 frequency table)的编制方法 2频数分布的两个特征及两种类型 佛园/集中趋势 失∫对分布 离散趋势 偏态分布 3.频数表的用途
6 ⚫ 1. 频数表(frequency table)的编制方法 ⚫ 2. 频数分布的两个特征及两种类型 ⚫ 3. 频数表的用途 特征 离散趋势 类型 一、数值变量资料的频数分布 集中趋势 对称分布 偏态分布
第一节数值型变量资料的统计描述 例91某地用随机抽样的方法对140名健康成 年男性血清尿素氮(BUN)浓度进行了检测, 所得数据如表9-1,如何进行统计描述
第一节 数值型变量资料的统计描述 例9.1 某地用随机抽样的方法对140名健康成 年男性血清尿素氮(BUN)浓度进行了检测, 所得数据如表9-1,如何进行统计描述
表9-1某地140名健康成年男性血清尿素氮浓度(mmoL) 6.005.283905.304.203.905605664.104.004.50377 4.344.304.225.305.133.794805.204.70294 904.50 5.605902.854904.25.633.214.663.005963.45 3.504.233.903.884244.534882483.403.263213.6 2.734.154.604.354.965.615875.014335.74487396 3.003.933.155003.443.502.854.874.603.404.793.02 6.234982.895826.305.205.403.002.804.434.50552 6.404.865904703474.664.785702.264.103.705.40 3.704.374.206.104.805.105.552975.113.263.04601 5.074.225.395.344.473.58 264.544.073.833.976.0 4.022.692.525.21 4.284.455.154.455.373.803.73 4.492442.763.333.016433.552.63
6.00 5.28 3.90 5.30 4.20 3.90 5.60 5.66 4.10 4.00 4.50 3.77 4.34 4.30 4.22 5.30 5.13 3.79 4.80 5.20 4.70 2.94 5.90 4.50 2.10 5.60 5.90 2.85 4.90 4.22 5.63 3.21 4.66 3.00 5.96 3.45 3.50 4.23 3.90 3.88 4.24 4.53 4.88 2.48 3.40 3.26 3.21 3.60 2.73 4.15 4.60 4.35 4.96 5.61 5.87 5.01 4.33 5.74 4.87 3.96 3.00 3.93 3.15 5.00 3.44 3.50 2.85 4.87 4.60 3.40 4.79 3.02 6.23 4.98 2.89 5.82 6.30 5.20 5.40 3.00 2.80 4.43 4.50 5.52 6.40 4.86 5.90 4.70 3.47 4.66 4.78 5.70 2.26 4.10 3.70 5.40 3.70 4.37 4.20 6.10 4.80 5.10 5.55 2.97 5.11 3.26 3.04 6.01 5.07 4.22 5.39 5.34 4.47 3.58 5.26 4.54 4.07 3.83 3.97 6.05 4.02 2.69 2.52 5.21 6.55 4.28 4.45 5.15 4.45 5.37 3.80 3.73 4.49 2.44 2.76 3.33 3.01 6.43 3.55 2.63 表9-1 某地140名健康成年男性血清尿素氮浓度(mmol/L)
统计描述的内容: 制频数(分布表表9-2)和频数分布图图9-1) 频数表的用途 (1)揭示资料的分布特征和分布类型 (2)便于发现某些特大或特小的可疑值 (3)便于进一步计算统计指标和统计分析处理 计算统计指标 (1)计算平均值一代表一组资料的平均水平; (2)计算标准差-反映资料的离散程度 三、绘制统计表和统计图
统计描述的内容: 一、制频数(分布) 表(表9-2)和频数分布图(图9-1) 频数表的用途 (1) 揭示资料的分布特征和分布类型 (2) 便于发现某些特大或特小的可疑值 (3) 便于进一步计算统计指标和统计分析处理 二、计算统计指标 (1) 计算平均值—代表一组资料的平均水平; (2) 计算标准差---反映资料的离散程度。 三、绘制统计表和统计图
编制频数分布表:制表步骤: (1)求或全距( range):R=Xmax-Xmi 本例,R=655-2.10=4.45(mmoL (2)决定组数、组段数和划分组距( class interva): 根据样本含量的多少确定组数,一般设8~15组。 组段数=取整极差/组数) 本例:组段数=取整(445/12)=0.37~04 划分组距:每组段的起点和终点分别称为和 的 之差。 组段的划分 2.0~24~2.8~3.2~3.6~4.0~44~4.8~52~56~6.0~6 6.8 3 4 6
一、编制频数分布表:制表步骤: (1)求极差或全距(range):R=Xmax - Xmin 本例, R=6.55-2.10=4.45(mmol/L)。 (2)决定组数、组段数和划分组距(class interval): 根据样本含量的多少确定组数,一般设8~15组。 组段数=取整(极差/组数)。 本例:组段数=取整(4.45/12)=0.370.4 划分组距:每组段的起点和终点分别称为下限和上限。 组距:本组内的上限和下限之差。 组段的划分 2.0~ 2.4~ 2.8~ 3.2~ 3.6~ 4.0~ 4.4~ 4.8~ 5.2~ 5.6~ 6.0~ 6.4~ 6.8 1 2 3 4 5 6 7 8 9 10 11 12