概率用P表示,其值介于0到1之间。P越接近1 表示该事件发生的可能性越大,反之越小。P=1 为必然事件,P=0为不可能事件。 小概率事件是指P≤0.05或P≤0.01的事件。若小概 率事件出现,我们认为不发生。 统计学中统计推断结论就是利用小概率事件原理。 第二节医学统计工作的基本步骤 医学统计工作分为:设计、收集资料、整理 吉林大学远程教育学院
2 吉林大学远程教育学院 概率用P表示,其值介于0到1之间。P越接近1, 表示该事件发生的可能性越大,反之越小。 P=1 为必然事件,P=0为不可能事件。 小概率事件是指P≤0.05或P≤0.01的事件。若小概 率事件出现,我们认为不发生。 •统计学中统计推断结论就是利用小概率事件原理。 第二节 医学统计工作的基本步骤 医学统计工作分为:设计、收集资料、整理
资料、分析资料四个步骤。四步紧密联系,缺一 不可。 一、设计 设计(design)是医学统计工作中最重要的一步。 设计的好坏直接关系到下三步的工作。设计的不 合理可导致错误的结论,也可导致浪费过多的药 品、经费、时间等。 确定研究目的和研究假说 确定研究对象和观察单位 设计 确定资料的收集方法、整理方法 确定统计分析方法 3 吉林大学远程教育学院
3 吉林大学远程教育学院 资料、分析资料四个步骤。四步紧密联系,缺一 不可。 一、设计 设计(design)是医学统计工作中最重要的一步。 设计的好坏直接关系到下三步的工作。设计的不 合理可导致错误的结论,也可导致浪费过多的药 品、经费、时间等。 设计 确定研究目的和研究假说 确定研究对象和观察单位 确定资料的收集方法、整理方法 确定统计分析方法
设计的目的是尽可能用较少的人力、物力和时 间获得准确可靠的结论。 调查设计 医学科研设计 实验设计 二、收集资料 收集资料(collection of data)任务是取得准确、 可靠的原始数据。 医学统计资料主要来自以下四个方面: 吉林大学远程教育学院
4 吉林大学远程教育学院 设计的目的是尽可能用较少的人力、物力和时 间获得准确可靠的结论。 医学科研设计 调查设计 实验设计 二、收集资料 收集资料(collection of data)任务是取得准确、 可靠的原始数据。 医学统计资料主要来自以下四个方面:
①统计报表 ②报告卡 ③经常性工作记录 ④专题调查或实验研究 三、整理资料 整理资料(sorting data)任务是以统计学的思想 去净化原始数据。错误的更正,缺少的补上;去 粗取精,去伪存真,使数据系统化、条理化,便 于下一步的统计分析。 吉林大学远程教育学院
5 吉林大学远程教育学院 ① 统计报表 ② 报告卡 ③ 经常性工作记录 ④ 专题调查或实验研究 三、整理资料 整理资料(sorting data)任务是以统计学的思想 去净化原始数据。错误的更正,缺少的补上;去 粗取精,去伪存真,使数据系统化、条理化,便 于下一步的统计分析
资料整理采用手工汇总和计算机汇总两种方式。 前者适合数据量较小的资料,适合数据量较大的 资料。 四、分析资料 分析资料(analysis of data)利用统计学的原理 和方法,借助于有力的计算工具去处理数据,从 而反映出数据的综合特征,进而从中阐明事物的 内在联系和变化规律。 统计描述(statistical description) 统计分析 统计推断(statistical inference) 吉林大学远程教育学院
6 吉林大学远程教育学院 资料整理采用手工汇总和计算机汇总两种方式。 前者适合数据量较小的资料,适合数据量较大的 资料。 四、分析资料 分析资料(analysis of data)利用统计学的原理 和方法,借助于有力的计算工具去处理数据,从 而反映出数据的综合特征,进而从中阐明事物的 内在联系和变化规律。 统计分析 统计描述(statistical description ) 统计推断(statistical inference)
第十章数值变量资料的统计分析 第一节数值变量的频数分布 分布(distribution)是一个统计概念。 分布在生活、医学等上的理解是很具体的。如 绿化地带在城市中的分布;血液中红细胞的分布; 某种疾病的发病部位在人体中的分布;某班全体 学生的考试成绩的分布等。 分布上升到数学上,就被抽象起来。抽象的目 的在于概括具体。 吉林大学远程教育学院
7 吉林大学远程教育学院 分布(distribution)是一个统计概念。 第十章 数值变量资料的统计分析 第一节 数值变量的频数分布 分布在生活、医学等上的理解是很具体的。如 绿化地带在城市中的分布;血液中红细胞的分布; 某种疾病的发病部位在人体中的分布;某班全体 学生的考试成绩的分布等。 分布上升到数学上,就被抽象起来。抽象的目 的在于概括具体
我们以后要学习很多统计的分布理论,如正态 分布、分布、二项分布、Poisson分布等等。 我们正是利用统计分布的理论方法来揭示具体 事物的内在联系和变化规律。 频数分布表(frequency distribution table)通过 变量值分布在其取值范围内各组段中的频数大小 来揭示具体资料的分布规律。 了解资料的分布规律对于我们选择合理的统计 方法来分析资料大有帮助。 8 吉林大学远程教育学院
8 吉林大学远程教育学院 我们以后要学习很多统计的分布理论,如正态 分布、t分布、二项分布、Poisson分布等等。 我们正是利用统计分布的理论方法来揭示具体 事物的内在联系和变化规律。 频数分布表(frequency distribution table)通过 变量值分布在其取值范围内各组段中的频数大小 来揭示具体资料的分布规律。 了解资料的分布规律对于我们选择合理的统计 方法来分析资料大有帮助
频数分布表 频数分布表的编制步骤: 例10.1某校护理学基础教研室为研究健康成年女性体温变化 规律,随机抽取102名健康(非排卵期)女大学生测试体温(℃)变 化,测试结果如下(午饭后休息一小时测试7分钟的口腔温度)。 37.0536.9037.2037.1037.0036.8536.8537.4037.0536.85 37.2037.0037.0036.9036.8537.1537.1036.8037.4037.40 37.3037.4037.2537.1037.1036.8536.8037.0537.0036.90 37.3537.2536.9537.0536.8037.1537.0537.1537.1537.25 37.5037.0037.3537.0537.1037.0037.0537.3537.1037.10 37.2537.2036.9537.0037.1037.0036.9037.0537.0036.90 36.5536.8037.0536.6037.0537.2036.7037.2036.9037.30 36.8536.7037.1537.1037.0536.9537.2536.9037.0536.75 36.9036.8536.7036.9537.1536.9037.0536.9037.3537.05 37.0537.0037.3537.1037.2036.6536.6536.9036.9536.90 36.7036.80 0 吉林大学远程教育学院
9 吉林大学远程教育学院 一、频数分布表 频数分布表的编制步骤: 例10.1 某校护理学基础教研室为研究健康成年女性体温变化 规律,随机抽取102名健康(非排卵期)女大学生测试体温(℃)变 化,测试结果如下(午饭后休息一小时测试7分钟的口腔温度)。 37.05 36.90 37.20 37.10 37.00 36.85 36.85 37.40 37.05 36.85 37.20 37.00 37.00 36.90 36.85 37.15 37.10 36.80 37.40 37.40 37.30 37.40 37.25 37.10 37.10 36.85 36.80 37.05 37.00 36.90 37.35 37.25 36.95 37.05 36.80 37.15 37.05 37.15 37.15 37.25 37.50 37.00 37.35 37.05 37.10 37.00 37.05 37.35 37.10 37.10 37.25 37.20 36.95 37.00 37.10 37.00 36.90 37.05 37.00 36.90 36.55 36.80 37.05 36.60 37.05 37.20 36.70 37.20 36.90 37.30 36.85 36.70 37.15 37.10 37.05 36.95 37.25 36.90 37.05 36.75 36.90 36.85 36.70 36.95 37.15 36.90 37.05 36.90 37.35 37.05 37.05 37.00 37.35 37.10 37.20 36.65 36.65 36.90 36.95 36.90 36.70 36.80
1.计算全距全距(range)亦称极差,用R 表示,R=最大值-最小值。本例R=37.50-36.55 =0.95(℃)。 2.确定组距和组段组距即组段间隔数,用i 表示。常取全距的1/10取整作为组距。 本例i=0.95/10=0.095≈0.1。 组段即由组距分隔的区间,每个组段的起点 称下限,终点称上限。每个组段规定为: 下限,上限) 10 吉林大学远程教育学院
10 吉林大学远程教育学院 1. 计算全距 全距(range)亦称极差,用R 表示,R=最大值-最小值。本例 R=37.50-36.55 =0.95(℃)。 2. 确定组距和组段 组距即组段间隔数,用i 表示。常取全距的1/10取整作为组距。 本例 i = 0.95/10 = 0.095≈0.1。 组段即由组距分隔的区间,每个组段的起点 称下限,终点称上限。每个组段规定为: [下限,上限)
要求第一组段包含最小值,最后组段包含最 大值;一般划分8~15个组段为宜。 本例第一组段可定为[36.50,36.60),最 后一个组段为[37.50,37.60),共分11个组段。 3.列表划记计频列成如表10-1的形式,采 用划记法把全部原始数据划归到每个组段中,以 频数统计。划记法可采用划“正”字法或划”” 法, 最后统锐年金绵臀的笔画总数即得频数。 1 吉林大学远程教育学院
11 吉林大学远程教育学院 要求第一组段包含最小值,最后组段包含最 大值;一般划分8~15个组段为宜。 本例 第一组段可定为 [ 36.50,36.60),最 后一个组段为 [ 37.50,37.60),共分11个组段。 3. 列表划记计频 列成如表10-1的形式,采 用划记法把全部原始数据划归到每个组段中,以 频数统计。划记法可采用划“正”字法或划“ ” 法, 最后统计出每个组段的笔画总数即得频数。 本例见下表10-1: