第一节医学统计学的含义 1、医学统计学定义 医学统计学(statistics)作为一门学科的定义是:关于医学数据收集、表达和分析 的普遍原理和方法。 2、医学统计学研究方法:通过大量重复观察,发现不确定的医学现象背后隐藏的统计学 规律。 3、医学统计推论的基础:在一定条件下,不确定的医学现象发生可能性,即概率。 第二节、统计学的几个重要概念 一.资料的类型 1、计量资料(数值变量):对每一观察对象用定量的方法,测定某项指标所得的资料。一 般有度量衡单位,每个对象之间有量的区别。 2、计数资料(分类变量):对观察对象按属性或类型分组计数所得的资料。每个对象之间没 有量的差异,只有质的不同。 3、等级资料(有序分类变量):对观察对象按属性或类型分组计数,但各属性或类型之间 又有程度的差别, 注意:不同类型的资料采用的统计分析方法不同:三类资料类型可以相互转化。 二、总体 根据研究目的所确定的同质的所有观察对象某项变量值的集合 一1、有限总体:只包括在确定时间、空间范围内的有限个观察对象。 2、无限总体:没有时间、空间范围的限制,观察对象的数量是不确定的,无限的 三、样本 从总体中随机抽取部分观察对象,其某项变量值的集合。 从总体中随机抽取样本的日的是:用样本信息来推断总体特征。 四、随机事件 可以发生也可以不发生,可以这样发生也可以那样发生的事件。亦称偶然事件 五、概率 描述随机事件发生可能性大小的数值,记作P,其取值范围0≤P≤1,一般用小数表示。 P=0,事件不可能发生必然事件(随机事件的特例):P=1,事件必然发生:P一0,事件发 生的可能性愈小:P一1,事件发生的可能性愈大 六、小概率事件
第一节 医学统计学的含义 1、医学统计学定义 医学 统计学(statistics)作为一门学科的定义是:关于医学数据收集、表达和分析 的普遍原理和方法。 2、医学统计学研究方法:通过大量重复观察,发现不确定的医学现象背后隐藏的统计学 规律。 3、医学统计推论的基础:在一定条件下,不确定的医学现象发生可能性,即概率。 第二节、 统计学的几个重要概念 一.资料的类型 1、计量资料(数值变量):对每一观察对象用定量的方法, 测定某项指标所得的资料。一 般有度量衡单位,每个对象之间有量的区别。 2、计数资料(分类变量):对观察对象按属性或类型分组计数所得的资料。每个对象之间没 有量的差异,只有质的不同。 3、等级资料(有序分类变量):对观察对象按属性或类型分组计数, 但各属性或类型之间 又有程度的差别。 注意:不同类型的资料采用的统计分析方法不同;三类资料类型可以相互转化。 二、总体 根据研究目的所确定的同质的所有观察对象某项变量值的集合 1、有限总体:只包括在确定时间、空间范围内的有限个观察对象。 2、无限总体:没有时间、空间范围的限制,观察对象的数量是不确定的,无限的 三、样本 从总体中随机抽取部分观察对象,其某项变量值的集合。 从总体中随机抽取样本的目的是: 用样本信息来推断总体特征。 四、随机事件 可以发生也可以不发生,可以这样发生也可以那样发生的事件。亦称偶然事件。 五、概率 描述随机事件发生可能性大小的数值,记作P,其取值范围 0≤P≤1,一般用小数表示。 P=0,事件不可能发生 必然事件(随机事件的特例);P=1,事件必然发生;P→0,事件发 生的可能性愈小;P→1,事件发生的可能性愈大 六、小概率事件
习惯上将P≤0.05或P≤0.01的随机事件称小概率事件。表示某事件发生的可能性很小。 七、参数和统计量 参数:总体指标,如总体均数、总体率,一般用希腊字母表示 统计量:样本指标,如样本均数、样本率,一般用拉丁字母表示 八、学习医学统计学的方法 1、重点掌握“四基”:基本知识、基本概念、基本原理和基本方法: 2、重视统计方法在实际中应用,重视实习和综合训练:注意学习每种统计方法的应用范围、 应用条件,大多数公式只要求了解其意义和使用方法,不用记忆和探究数理推导 第三节统计工作的基本步骤 统计设计 收集资料 整理资料 分析资料 一、统计设计 1、调查设计 2、实验设计 (详见第十三章)》 二、收集资料 资料来源 (1)统计报表 (2)日常医疗工作原始记录和报告卡 (3)专题调查 三、整理资料 1.目的将收集的原始资料系统化、条理化,便于进一步计算和分析 2.整理分组方式 (1)性质分组 (2)数量分组 三、分析资料 1、统计描述 2、统计推断 第四节统计图表 一、统计表 1、统计表的作用
习惯上将P≤0.05 或P≤0.01 的随机事件称小概率事件。表示某事件发生的可能性很小。 七、参数和统计量 参数:总体指标,如总体均数、总体率,一般用希腊字母表示 统计量:样本指标,如样本均数、样本率,一般用拉丁字母表示 八、学习医学统计学的方法 1、重点掌握“四基”:基本知识、基本概念、基本原理和基本方法; 2、重视统计方法在实际中应用,重视实习和综合训练;注意学习每种统计方法的应用范围、 应用条件,大多数公式只要求了解其意义和使用方法,不用记忆和探究数理推导。 第三节 统计工作的基本步骤 统计设计 收集资料 整理资料 分析资料 一、统计设计 1、调查设计 2、实验设计 (详见第十三章) 二、收集资料 资料来源 (1)统计报表 (2)日常医疗工作原始记录和报告卡 (3)专题调查 三、整理资料 1.目的 将收集的原始资料系统化、条理化,便于进一步计算和分析 2.整理分组方式 (1)性质分组 (2)数量分组 三、分析资料 1、统计描述 2、统计推断 第四节 统计图表 一、统计表 1、统计表的作用
代替冗长的文字叙述,便于计算、分析和对比。 2、统计表的结构 1)标题 2)标目 横标目(主语):说明表各横行数字的涵义,通常列在表的左侧 纵标目(谓语):说明表各纵栏数字的涵义 主语和谓语连贯起来能读成一句完整而通顺的话 3、统计表的种类: 1)简单表:只按单一变量分组 2)组合表:按两个或两个以上变量分组 某地1980年男、女HBsAg阳性率 性别调查数阳性数阳性率%) 男4234303 7.16 女4530 181 4.00 合计8764484 5.52 4、列表原则:重点突出,简单明了:主谓分明,层次分明 5、统计表的基本要求: 1)标题:概括地说明表的内容,必要时注明资料的时间和地点,写在表上方。常见的缺 点:过于简略,甚至不写标题:或过于繁琐:或标题不确切。 2)标目:文字简明扼要,有单位的标目要注明单位。常见的缺点:标目过多,层次不清 3)线条:不宜过多,除上面的顶线,下面的底线,纵标目与合计之间的横线外,其余线 条一般均省去。表的左上角不宜有斜线。 4)数字: A、数字一律用阿拉伯数字表示 B、同一指标的小数位数应一致,位次对齐 C、表内不宜留空格,暂缺或未记录,用“…”表示,无数字,用“一”表示,数字为0, 填写0
代替冗长的文字叙述,便于计算、分析和对比。 2、统计表的结构 1)标题 2)标目 横标目(主语):说明表各横行数字的涵义,通常列在表的左侧 纵标目(谓语):说明表各纵栏数字的涵义 主语和谓语连贯起来能读成一句完整而通顺的话 3、统计表的种类: 1)简单表:只按单一变量分组 2)组合表:按两个或两个以上变量分组 某地 1980 年男、女 HBsAg 阳性率 ━━━━━━━━━━━━━━━━ 性别 调查数 阳性数 阳性率(%) ──────────────── 男 4234 303 7.16 女 4530 181 4.00 ────────────── 合计 8764 484 5.52 ━━━━━━━━━━━━━━━━ 4、列表原则:重点突出,简单明了;主谓分明,层次分明 5、统计表的基本要求: 1)标题:概括地说明表的内容,必要时注明资料的时间和地点,写在表上方。常见的缺 点:过于简略,甚至不写标题;或过于繁琐;或标题不确切。 2)标目:文字简明扼要,有单位的标目要注明单位。常见的缺点:标目过多,层次不清 3)线条:不宜过多,除上面的顶线,下面的底线,纵标目与合计之间的横线 外,其余线 条一般均省去。表的左上角不宜有斜线。 4)数字: A、数字一律用阿拉伯数字表示 B、同一指标的小数位数应一致,位次对齐 C、表内不宜留空格,暂缺或未记录,用“…”表示,无数字,用“—”表示,数字为 0, 填写 0
D、绝对数太小而无法计算指标,则用“”代替。 5)备注:一般不列入表内,必要时可用“率”号标出,写在表的下面。 二、统计图 1、统计图作用: 通过点、线、面等形式表达统计资料,直观地反映事物之间的数量关系。但需注意,由于统计 图对数量的表达较粗糙,不便于作深入细致的分析,一般需附相应的统计表。 2、常见统计图种类 条图、百分条图,圆图,线图,半对数线图,直方图,敢点图 3、制图的基本要求: 1)按资料的性质和分析目的,选用适合的图形 2)要有标题,扼要说明资料的内容,必要时注明时间、地点,一般写在图的下面, 3)横轴尺度从左到右,纵轴尺度从下而上,数量一律由小到大。横轴与纵轴坐标长度比例 般为5:7 4)比较不同事物,用不同线条或颜色表示,并附上图例说明。 4、常见统计图适用范围及其绘制要点 1)条图: (1)适用范围:相互独立的资料,常用形式:单式和复式 (2)绘制要点: A.用等宽的直条的长短反映各指标的数量大小。 B.纵轴的尺度必须从0开始。 C.各直条之间的间隙应相等,一般将比较的指标按大小顺序排列。 2)百分条图: (1)适用范围:构成比资料 (2)绘制要点: A.将长条全长为100%, B.将各百分构成比在长条上分制若干段, C.各段按大小顺序排列。 3)圆图 ()适用范围:构成比资料 (2)绘制要点:
D、绝对数太小而无法计算指标,则用“…”代替。 5)备注:一般不列入表内,必要时可用“*”号标出,写在表的下面。 二、 统计图 1、统计图作用: 通过点、线、面等形式表达统计资料,直观地反映事物之间的数量关系。但需注意,由于统计 图对数量的表达较粗糙,不便于作深入细致的分析,一般需附相应的统计表。 2、常见统计图种类: 条图、百分条图,圆图,线图,半对数线图,直方图,散点图 3、制图的基本要求: 1)按资料的性质和分析目的,选用适合的图形 2)要有标题,扼要说明资料的内容,必要时注明时间、地点,一般写在图的下面。 3)横轴尺度从左到右,纵轴尺度从下而上,数量一律由小到大。横轴与纵轴坐标长度比例一 般为 5:7 4)比较不同事物,用不同线条或颜色表示,并附上图例说明。 4、常见统计图适用范围及其绘制要点 1)条图: (1) 适用范围:相互独立的资料,常用形式:单式和复式 (2)绘制要点: A.用等宽的直条的长短反映各指标的数量大小。 B.纵轴的尺度必须从 0 开始。 C.各直条之间的间隙应相等,一般将比较的指标按大小顺序排列。 2)百分条图: (1)适用范围:构成比资料 (2)绘制要点: A.将长条全长为 100%, B.将各百分构成比在长条上分割若干段, C.各段按大小顺序排列。 3)圆图 (1)适用范围:构成比资料 (2)绘制要点:
A.将圆面积为100%, B.将各百分构成比乘以36度,变为圆心角度数, C.在圆上绘出各扇型面积 D.各扇型面积按大小顺序排列 4)普通线图 (1)适用范围:连续性资料 (2)绘制要点: A。纵横轴均用算术尺度 B.纵横轴尺度比一般为5:7 C.相邻两点用直线连接。 (3)意义:反映事物的变化趋势 5)半对数线图 (1)适用范围:连续性资料 (2)绘制要点: A.横轴用算术尺度,纵轴用对数尺度 B.纵横轴尺度比一般为5:7 C.相邻两点用直线连接。 (3)意义:反映事物的变化速度。 6)直方图 (1)适用范围:计量的频数表资料 (2)绘制要点: A.横轴表示观察事物,纵轴表示频数或频率。 B。用等宽的矩形面积表示各组段的频数或频率 7)散点图: (1)适用范围:双变量资料 (2)分析目的:用点的密度程度和趋势表示两变量间的相关关系
A.将圆面积为 100%, B.将各百分构成比乘以 3.6 度,变为圆心角度数, C.在圆上绘出各扇型面积 D.各扇型面积按大小顺序排列。 4)普通线图 (1)适用范围:连续性资料 (2)绘制要点: A.纵横轴均用算术尺度, B.纵横轴尺度比一般为 5:7 C.相邻两点用直线连接。 (3)意义:反映事物的变化趋势。 5)半对数线图 (1)适用范围:连续性资料 (2)绘制要点: A.横轴用算术尺度,纵轴用对数尺度, B.纵横轴尺度比一般为 5:7 C.相邻两点用直线连接。 (3)意义:反映事物的变化速度。 6)直方图 (1)适用范围:计量的频数表资料 (2)绘制要点: A.横轴表示被观察事物,纵轴表示频数或频率, B.用等宽的矩形面积表示各组段的频数或频率 7)散点图: (1)适用范围:双变量资料 (2)分析目的:用点的密度程度和趋势表示两变量间的相关关系
第一讲绪论 一、《医学统计学》的理论基础和研究对象: )问题的提出: 在人们的实践活动中,常常会遇到类似下面的一些问题: 一种新的疫苗,如何判断它是否有效? 吸烟会不会使得肺癌的机会增加? 如何抽检几百或几千人来估计某种病的流行程度? 某批产品中合格品究竟有多少?该不该报废? 如何消耗最少的资源和人力来得到我们所需要的某种信息? 某种实验方法(或饲料配方)有没有明显改进? 患者分组是否具有可比性? 所观察对象的数量是否足够说明其结论? 试验结果的误差有多大? 研究结果是否适用于观察样本以外的同类对象?…等等 其共同特点:只知道事情的不完全信息,或者是单个实验的结 果有某种不确定性
第一讲 绪 论 一、 《医学统计学》的理论基础和研究对象: a) 问题的提出: 在人们的实践活动中,常常会遇到类似下面的一些问题: 一种新的疫苗,如何判断它是否有效? 吸烟会不会使得肺癌的机会增加? 如何抽检几百或几千人来估计某种病的流行程度? 某批产品中合格品究竟有多少?该不该报废? 如何消耗最少的资源和人力来得到我们所需要的某种信息? 某种实验方法(或饲料配方)有没有明显改进? 患者分组是否具有可比性? 所观察对象的数量是否足够说明其结论? 试验结果的误差有多大? 研究结果是否适用于观察样本以外的同类对象?……等等. 其共同特点:只知道事情的不完全信息,或者是单个实验的结 果有某种不确定性
例如:为了知道产品合格与否或它的使用寿命,我们常常需要 对它作破坏性检验,此时显然不能把所有的产品都检验一下,而只能 满足于对少数几个作品的抽检,这样获得的信息显然是不完全的: 要检验疫苗的有效性,就一般来说,接种过疫苗的动物也不一定 全不发病,而未接种的也不会全发病.那么发病与不发病的差别究竞 到多大时我们才能认为接种是有效的呢? 这些均涉及了我们如何评价一些并不确定的实验结果的问题。要 从这类问题中得出科学的、可靠的结论,就必须依靠统计学.有人干 脆给统计学下了这样的定义:“统计学就是从不完全的信息里取得准 确知识的一系列技巧”。 另外,当必须根据有限的、完全的信息作出决策时(例如决定一 批产品是出厂还是报废,某种新药是否有效等等),统计学可以提供 一种方法,使我们不仅能做出合理的决策,而且知道所冒风险的大小, 并帮助我们把可能的损失减至最小。 其次,如何花费最小代价取得所关心的信息,也是统计学的一大 课题(实险设计),不注意这一点可能使辛辛苦苦的工作全成为一种 浪费 2,理论基础:“根据数理统计的原理、方法紧密结合医学实践
例如:为了知道产品合格与否或它的使用寿命,我们常常需要 对它作破坏性检验,此时显然不能把所有的产品都检验一下,而只能 满足于对少数几个作品的抽检,这样获得的信息显然是不完全的; 要检验疫苗的有效性,就一般来说,接种过疫苗的动物也不一定 全不发病,而未接种的也不会全发病.那么发病与不发病的差别究竟 到多大时我们才能认为接种是有效的呢? 这些均涉及了我们如何评价一些并不确定的实验结果的问题。要 从这类问题中得出科学的、可靠的结论,就必须依靠统计学.有人干 脆给统计学下了这样的定义:“统计学就是从不完全的信息里取得准 确知识的一系列技巧”。 另外,当必须根据有限的、完全的信息作出决策时(例如决定一 批产品是出厂还是报废,某种新药是否有效等等),统计学可以提供 一种方法,使我们不仅能做出合理的决策,而且知道所冒风险的大小, 并帮助我们把可能的损失减至最小。 其次,如何花费最小代价取得所关心的信息,也是统计学的一大 课题(实险设计).不注意这一点可能使辛辛苦苦的工作全成为一种 浪费. 2.理论基础:“根据数理统计的原理、方法紧密结合医学实践
研究医药卫生领域中的资料收集、整理、分析和推断的一门应用学科, 来分析和解释生物界各种现象和实验调查资料的科学”。随着生物医 学研究的不断发展,运用统计学方法来认识、推断和解释生命过程中 的各种现象也越来越广泛。运用统计学方法可以帮助人们分析占有信 息,达到去伪存真,去粗取精,正确认识世界的日的。 3.研究对橡:人体及与人体健康有关的各种具有不确定性的 医学数据(变异、数量、同质)。 二、《医学统计学》的主要任务和作用: 任务:1、结合专业知识和具体研究的要求进行统计设计 2、对收集资料进行整理、做统计描述 3、对资料进行统计分析和解释 作用:1、保证调查或试验设计的科学性、完整性 2、指标的确定应具有特异性、客观性,灵敏性和精密度高 3、样本含量足够大,数据真实可靠 4、选用统计分析方法正确 三、医学统计学的主要内容: 1.统计设计(design) 在进行统计工作和研究之前必须有一个周密的设计,设计的内容 包括资料收集、整理和分析全过程总的设想和安排。 统计设计可按照在研究过程中对研究对象是否进行干预分作调
研究医药卫生领域中的资料收集、整理、分析和推断的一门应用学科, 来分析和解释生物界各种现象和实验调查资料的科学”。随着生物医 学研究的不断发展,运用统计学方法来认识、推断和解释生命过程中 的各种现象也越来越广泛。运用统计学方法可以帮助人们分析占有信 息,达到去伪存真,去粗取精,正确认识世界的目的。 3.研究对象: 人体及与人体健康有关的各种具有不确定性的 医学数据(变异、数量、同质)。 二、 《医学统计学》的主要任务和作用: 任务:1、 结合专业知识和具体研究的要求进行统计设计 2、 对收集资料进行整理、做统计描述 3、 对资料进行统计分析和解释 作用:1、 保证调查或试验设计的科学性、完整性 2、 指标的确定应具有特异性、客观性,灵敏性和精密度高 3、 样本含量足够大,数据真实可靠 4、 选用统计分析方法正确 三、 医学统计学的主要内容: 1、统计设计(design) 在进行统计工作和研究之前必须有一个周密的设计,设计的内容 包括资料收集、整理和分析全过程总的设想和安排。 统计设计可按照在研究过程中对研究对象是否进行干预分作调
查研究设计和实验研究设计。 调查研究设计:研究者旨在客观地描述研究总体,未加任何干预 措施,如:调查了解某地的学龄儿童缺铁性贫血的患病率,某地新生 儿畸形的发生率,北京地区溃疡病患病率等,其目的在于了解某一医 学现象的实际情况,疾病的危害程度,以便为防治和研究这些疾病提 供依据。调查设计主要有抽样方法、调查技术、质量控制技术等。 实验研究设计:研究者根据目的(研究假设),主动加以干预措 施,并观察总结其结果,回答研究假设所提出的问题。 如:研究脂健乳是否有降脂作用,首先假设脂健乳可以降低血 脂,再将条件相似的20只大鼠先用高脂饲料喂养做成高脂血症的模 型,然后将动物随机分为实验组和对照组,实验组服用脂健乳和豆奶, 对照组单纯服用豆奶,喂养一个月后观察比较两组之间各项血脂指标 的差别有无统计学意义,进而得出脂健乳是否具有降低血脂的保健作 用的结论。 实验设计主要有各种实验设计模型、分组方法、样本量估计等。 由于统计设计的质量直接影响着试验结果的准确性、可靠性、严 密性和代表性,一旦出现设计上的失误或缺陷,可能导致整个研究的 失败。因此,专业设计是研究者对专业知识的把握能力,直接影响着 实验的深度和水平,而统计设计是研究者对医学统计知识的正确运 用,以保证统计描述和推断正确的基础。 调查设计与实验研究设计 专业设计 统计设计
查研究设计和实验研究设计。 调查研究设计:研究者旨在客观地描述研究总体,未加任何干预 措施,如:调查了解某地的学龄儿童缺铁性贫血的患病率,某地新生 儿畸形的发生率,北京地区溃疡病患病率等,其目的在于了解某一医 学现象的实际情况,疾病的危害程度,以便为防治和研究这些疾病提 供依据。调查设计主要有抽样方法、调查技术、质量控制技术等。 实验研究设计:研究者根据目的(研究假设),主动加以干预措 施,并观察总结其结果,回答研究假设所提出的问题。 如:研究脂健乳是否有降脂作用,首先假设 脂健乳可以降低血 脂,再将条件相似的 20 只大鼠先用高脂饲料喂养做成高脂血症的模 型,然后将动物随机分为实验组和对照组,实验组服用脂健乳和豆奶, 对照组单纯服用豆奶,喂养一个月后观察比较两组之间各项血脂指标 的差别有无统计学意义,进而得出脂健乳是否具有降低血脂的保健作 用的结论。 实验设计主要有各种实验设计模型、分组方法、样本量估计等。 由于统计设计的质量直接影响着试验结果的准确性、可靠性、严 密性和代表性,一旦出现设计上的失误或缺陷,可能导致整个研究的 失败。因此,专业设计是研究者对专业知识的把握能力,直接影响着 实验的深度和水平,而统计设计是研究者对医学统计知识的正确运 用,以保证统计描述和推断正确的基础。 调查设计与实验研究设计 专业设计 统计设计
运用专业知识进行设计 运用统计学知识进行设计 选题、调查(实验)、方法、材料 确定设计方案、收集整理资料、确定 角客 统计指标、分析和推断方法 探讨实验、观察结果的适用性和创探讨实验、观察结果的可重复性、高 方向 造性 效性 回答和解决科研课题,验证假说,减少和控制误差。保证样本的代表性 日的 保证科研结果的先进性 和可靠性,保证实验结果的精确性和 可重复性 2.收集资料(collection of data) 方式:1、统计报表2、经常性工作记录3、专题调查或实验 3.整理资料(sorting data) 将原始数据进行核对、整理,使其系统化、条理化,对数据进行 逻辑检查,纠正错误,提供整理和描述数据资料的科学方法,确定数 据的数量特征。 4分析资料(analysi5 of data) 根据不同的资料类型,选择不同的统计处理方法,计算有关指标, 反映数据的综合特征,阐明事物的内在联系和规律。 统计分析包括: ①统计描述(descriptive statistics):用统计指标、 统计表、统计图等方法,对资料的数量特征及分布规律进行测定 和描述。 ②统计推断(inferential statistics):包括如何抽样
要求 运用专业知识进行设计 运用统计学知识进行设计 内容 选题、调查(实验)、方法、材料 确定设计方案、收集整理资料、确定 统计指标、分析和推断方法 方向 探讨实验、观察结果的适用性和创 造性 探讨实验、观察结果的可重复性、高 效性 目的 回答和解决科研课题,验证假说, 保证科研结果的先进性 减少和控制误差。保证样本的代表性 和可靠性,保证实验结果的精确性和 可重复性 2、收集资料(collection of data) 方式:1、统计报表 2、经常性工作记录 3、专题调查或实验 3、整理资料(sorting data) 将原始数据进行核对、整理,使其系统化、条理化,对数据进行 逻辑检查,纠正错误,提供整理和描述数据资料的科学方法,确定数 据的数量特征。 4、分析资料(analysis of data) 根据不同的资料类型,选择不同的统计处理方法,计算有关指标, 反映数据的综合特征,阐明事物的内在联系和规律。 统计分析包括: ① 统计描述(descriptive statistics): 用统计指标、 统计表、统计图等方法,对资料的数量特征及分布规律进行测定 和描述。 ② 统计推断(inferential statistics): 包括如何抽样