1 第三篇 医学统计学方法 Statistical Methods in Medicine
1 第三篇 医学统计学方法 Statistical Methods in Medicine
2 第九章 数值变量资料的统计分析 第一节 数值型资料的统计描述 第二节 正态分布和参考值范围的估计 第三节 数值型资料的统计推断 第四节 t检验和u检验 第五节 方差分析
2 第九章 数值变量资料的统计分析 第一节 数值型资料的统计描述 第二节 正态分布和参考值范围的估计 第三节 数值型资料的统计推断 第四节 t检验和u检验 第五节 方差分析
3 terminology statistical description 统计描述 statistical inference 统计推断 parameter estimation 参数估计 Frequency distribution 频数分布 frequency table 频数表 arithmetic Mean, average 算术平均值 standard deviation 标准差 variance 方差 range 极差,全距,范围 geometric mean 几何平均值 median 中位数 normal distribution 正态分布 reference range 参考值范围
3 terminology statistical description 统计描述 statistical inference 统计推断 parameter estimation 参数估计 Frequency distribution 频数分布 frequency table 频数表 arithmetic Mean, average 算术平均值 standard deviation 标准差 variance 方差 range 极差,全距,范围 geometric mean 几何平均值 median 中位数 normal distribution 正态分布 reference range 参考值范围
4 统计分析包括统计描述和统计推断两大部分。 ⚫统计描述(statistical description)是用统计指标、统计 表和统计图描述资料的分析规律及其数量特征; ⚫统计推断(statistical inference) 包括总体参数估计和假 设检验两个内容。 参数估计:是用样本统计量估计总体参数所在范围。 假设检验:是利用样本的实际资料来检验事先对总体某 些数量特征所作的假设是否成立。 假设检验 参数估计 统计推断 统计描述 统计分析
4 统计分析包括统计描述和统计推断两大部分。 ⚫统计描述(statistical description)是用统计指标、统计 表和统计图描述资料的分析规律及其数量特征; ⚫统计推断(statistical inference) 包括总体参数估计和假 设检验两个内容。 参数估计:是用样本统计量估计总体参数所在范围。 假设检验:是利用样本的实际资料来检验事先对总体某 些数量特征所作的假设是否成立。 假设检验 参数估计 统计推断 统计描述 统计分析
5 第一节 数值型变量资料的统计描述 例9.1 2002年某市150名20~29岁正常男子的 尿酸浓度(μmol/L) ,资料见表9-1。如何进行统 计描述?
5 第一节 数值型变量资料的统计描述 例9.1 2002年某市150名20~29岁正常男子的 尿酸浓度(μmol/L) ,资料见表9-1。如何进行统 计描述?
6 362.6 359.7 285.9 300.2 333.6 334.0 288.8 338.5 341.9 344.6 3375 298.3 364.2 367.1 338.1 316.9 332.7 324.0 282.6 369.8 398.7 338.7 308.9 392.1 368.7 352.6 378.2 346.1 278.6 318.3 323.2 322.6 382.1 322.6 309.6 352.0 372.5 399.8 335.6 341.1 371.0 355.9 362.7 368.1 332.4 405.6 328.8 358.8 405.9 362.7 316.3 338.7 402.6 379.4 329.6 354.6 331.4 349.6 419.5 324.6 329.8 357.8 312.0 313.6 338.7 328.6 291.3 329.7 361.8 392.4 414.9 319.7 327.6 395.8 358.9 289.4 366.2 387.4 298.4 408.7 389.8 362.5 354.9 352.7 316.6 348.9 348.7 401.6 334.6 308.9 367.0 345.6 401.6 357.1 304.6 338.5 388.2 355.8 329.4 321.1 320.4 313.5 339.8 409.4 387.4 378.5 392.0 352.7 376.2 388.4 344.6 308.6 347.0 428.7 369.1 311.4 376.3 349.4 289.2 366.8 371.0 387.5 413.6 348.7 392.7 401.0 313.6 366.8 387.2 319.7 329.4 357.5 348.5 346.8 406.6 357.6 338.7 341.6 349.8 289.4 366.2 357.5 298.4 336.8 387.5 342.3 366.7 387.6 332.7 324.0 表9-1 2002年某市150名20~29岁正常男子的尿酸浓度(μmol/L)
6 362.6 359.7 285.9 300.2 333.6 334.0 288.8 338.5 341.9 344.6 3375 298.3 364.2 367.1 338.1 316.9 332.7 324.0 282.6 369.8 398.7 338.7 308.9 392.1 368.7 352.6 378.2 346.1 278.6 318.3 323.2 322.6 382.1 322.6 309.6 352.0 372.5 399.8 335.6 341.1 371.0 355.9 362.7 368.1 332.4 405.6 328.8 358.8 405.9 362.7 316.3 338.7 402.6 379.4 329.6 354.6 331.4 349.6 419.5 324.6 329.8 357.8 312.0 313.6 338.7 328.6 291.3 329.7 361.8 392.4 414.9 319.7 327.6 395.8 358.9 289.4 366.2 387.4 298.4 408.7 389.8 362.5 354.9 352.7 316.6 348.9 348.7 401.6 334.6 308.9 367.0 345.6 401.6 357.1 304.6 338.5 388.2 355.8 329.4 321.1 320.4 313.5 339.8 409.4 387.4 378.5 392.0 352.7 376.2 388.4 344.6 308.6 347.0 428.7 369.1 311.4 376.3 349.4 289.2 366.8 371.0 387.5 413.6 348.7 392.7 401.0 313.6 366.8 387.2 319.7 329.4 357.5 348.5 346.8 406.6 357.6 338.7 341.6 349.8 289.4 366.2 357.5 298.4 336.8 387.5 342.3 366.7 387.6 332.7 324.0 表9-1 2002年某市150名20~29岁正常男子的尿酸浓度(μmol/L)
7 统计描述的内容: 一、制频数(分布) 表(表9-2)和频数分布图(图9-1) 频数表的用途 (1) 揭示资料的分布特征和分布类型 (2) 便于发现某些特大或特小的可疑值 (3) 便于进一步计算统计指标和统计分析处理 二、计算统计指标 (1) 计算平均值—代表一组资料的平均水平; (2) 计算标准差-反映资料的离散程度。 三、绘制统计表和统计图
7 统计描述的内容: 一、制频数(分布) 表(表9-2)和频数分布图(图9-1) 频数表的用途 (1) 揭示资料的分布特征和分布类型 (2) 便于发现某些特大或特小的可疑值 (3) 便于进一步计算统计指标和统计分析处理 二、计算统计指标 (1) 计算平均值—代表一组资料的平均水平; (2) 计算标准差-反映资料的离散程度。 三、绘制统计表和统计图
8 一、编制频数分布表:制表步骤: (1)求极差或全距(range):R=Xmax - Xmin 本例, R=428.7-278.6=150.1(μmol/L)。 (2)决定组数、组段数和划分组距(class interval): 根据样本含量的多少确定组数,一般设8~15组。 组段数=取整(极差/组数)。 本例:组段数=取整(150.1/10)=15.0115 划分组距:每组段的起点和终点分别称为下界和上界。 组距:本组内的上界和下界之差。 组段的划分 270~ 285~ 300~ 315~ 330~ 345~ 360~ 375~ 390~ 405~ 420~435 1 2 3 4 5 6 7 8 9 10 11
8 一、编制频数分布表:制表步骤: (1)求极差或全距(range):R=Xmax - Xmin 本例, R=428.7-278.6=150.1(μmol/L)。 (2)决定组数、组段数和划分组距(class interval): 根据样本含量的多少确定组数,一般设8~15组。 组段数=取整(极差/组数)。 本例:组段数=取整(150.1/10)=15.0115 划分组距:每组段的起点和终点分别称为下界和上界。 组距:本组内的上界和下界之差。 组段的划分 270~ 285~ 300~ 315~ 330~ 345~ 360~ 375~ 390~ 405~ 420~435 1 2 3 4 5 6 7 8 9 10 11
9 (3)列频数表:按上述组段 序列制成表的形式,采用 划记法或计算机将原始数 据汇总,得出各组段中所 包含的观察例数,即为频 数,如表9-2的第 (2)栏。 将各组段及其相应的频数 列成表格,即为频数表 (frequency table),如表 9-2。所绘的图形见图9-1。 表9-2 2002年某市150名20~29岁 正常男子的尿酸浓度的频数分布 尿酸浓度 (μmol/L) 频数 频率(%) 270~ 2 1.33 285~ 9 6.00 300~ 11 7.33 315~ 22 14.67 330~ 24 16.00 345~ 27 18.00 360~ 20 13.33 375~ 15 10.00 390~ 11 7.33 405~ 8 5.33 420~435 1 0.67 合计 150 100.00
9 (3)列频数表:按上述组段 序列制成表的形式,采用 划记法或计算机将原始数 据汇总,得出各组段中所 包含的观察例数,即为频 数,如表9-2的第 (2)栏。 将各组段及其相应的频数 列成表格,即为频数表 (frequency table),如表 9-2。所绘的图形见图9-1。 表9-2 2002年某市150名20~29岁 正常男子的尿酸浓度的频数分布 尿酸浓度 (μmol/L) 频数 频率(%) 270~ 2 1.33 285~ 9 6.00 300~ 11 7.33 315~ 22 14.67 330~ 24 16.00 345~ 27 18.00 360~ 20 13.33 375~ 15 10.00 390~ 11 7.33 405~ 8 5.33 420~435 1 0.67 合计 150 100.00
10 资料的分布类型: 1. 对称分布或正态分布; 2. 偏态分布:高峰在左侧或右侧; 3. 不规则分布:分布很散,无明显高峰
10 资料的分布类型: 1. 对称分布或正态分布; 2. 偏态分布:高峰在左侧或右侧; 3. 不规则分布:分布很散,无明显高峰