学时:4 目标和要求:掌握现况调査中抽样调査方法及资料基夲分析方法,筛检定义及筛检实验评价 方法,一般了解普查和生态学研究的概念 教学手段:多媒体、例证、提问等 现况调查 描述性研究( descriptive study)是指利用己有的资料或特殊调查的资料 包括实验室检査结果,描述疾病或健康状况在不同时间、地点或人群中的分布特 点,为进一步开展分析流行病学研究提供病因或流行因素的线索。现况调查 ( prevalence survey)又称横断面研究(cros- ectional study)是一种较为常用的 描述性流行病学调查方法,是其他流行病学研究的基础和出发点,也是进行公共 卫生决策的立足点之一,在流行病学方法体系中占有重要地位。本章着重介绍现 况调査的概念及目的;现况调査的方法及种类;现况调査的设计步骤;现况调查 的资料来源和收集,资料整理分析与结果解释;现况调査中可能岀现的偏倚及其 防止等内容。 第一节现况调查概述 概念 现况调查是按照事先设计的要求,在某一人群中应用普査或抽样调査等方 法收集特定时间内有关变量、疾病或健康状况的资料,以描述目前疾病或健康状 况的分布及某因素与疾病的关联。从时间上说,现况调查是在特定时间内进行的, 即在某一时点或在短时间内完成,这个时间点犹如一个断面,故又称之为横断面 研究。它所收集的资料既不是过去的记录,也不是常规报告资料或随访的调查资 料,而是调查当时所得到的疾病、健康和其他有关资料。 现况调査是通过完成某特定时间该人群健康经历的一个“快照”,提供某病 频率和特征的信息。现况调查强调在一定时间内,这个时间应尽可能短一些,如 果调査的时间拖延过长,则有可能所研究的疾病或因素发生变化,使调查结果的 分析和解释较为困难 需要指出的是,现况调査并不等于只对现象作静态分析,它也可以对多个 断面的现况调查作动态分析。例如我国先后5次进行的人口普查,尽管就某一次 普查而言只能了解调查当时的人口基本状况、年龄构成、性别比例、人口素质状 况分布等,但如果对5次人口普查的资料作动态分析,那么我们就可以了解上述 指标在5次人口普查期间的变化动态和趋势,能够发现人口变化的规律,并有可 能对将来的人口变化趋势作出预测。 特点
1 学时:4 目标和要求:掌握现况调查中抽样调查方法及资料基本分析方法,筛检定义及筛检实验评价 方法,一般了解普查和生态学研究的概念。 教学手段:多媒体、例证、提问等。 现况调查 描述性研究(descriptive study)是指利用已有的资料或特殊调查的资料, 包括实验室检查结果,描述疾病或健康状况在不同时间、地点或人群中的分布特 点,为进一步开展分析流行病学研究提供病因或流行因素的线索。现况调查 (prevalence survey)又称横断面研究(cross-sectional study)是一种较为常用的 描述性流行病学调查方法,是其他流行病学研究的基础和出发点,也是进行公共 卫生决策的立足点之一,在流行病学方法体系中占有重要地位。本章着重介绍现 况调查的概念及目的;现况调查的方法及种类;现况调查的设计步骤;现况调查 的资料来源和收集,资料整理分析与结果解释;现况调查中可能出现的偏倚及其 防止等内容。 第一节 现况调查概述 一、概念 现况调查是按照事先设计的要求,在某一人群中应用普查或抽样调查等方 法收集特定时间内有关变量、疾病或健康状况的资料,以描述目前疾病或健康状 况的分布及某因素与疾病的关联。从时间上说,现况调查是在特定时间内进行的, 即在某一时点或在短时间内完成,这个时间点犹如一个断面,故又称之为横断面 研究。它所收集的资料既不是过去的记录,也不是常规报告资料或随访的调查资 料,而是调查当时所得到的疾病、健康和其他有关资料。 现况调查是通过完成某特定时间该人群健康经历的一个“快照”,提供某病 频率和特征的信息。现况调查强调在一定时间内,这个时间应尽可能短一些,如 果调查的时间拖延过长,则有可能所研究的疾病或因素发生变化,使调查结果的 分析和解释较为困难。 需要指出的是,现况调查并不等于只对现象作静态分析,它也可以对多个 断面的现况调查作动态分析。例如我国先后 5 次进行的人口普查,尽管就某一次 普查而言只能了解调查当时的人口基本状况、年龄构成、性别比例、人口素质状 况分布等,但如果对 5 次人口普查的资料作动态分析,那么我们就可以了解上述 指标在 5 次人口普查期间的变化动态和趋势,能够发现人口变化的规律,并有可 能对将来的人口变化趋势作出预测。 二、特点
1.现况调査既可以弥补常规报告资料的不足,又能在较短的时间內得到调 查结果、花费不大,是常用的流行病学调查方法。 2.现况调查在时序上属于横向研究,是指在一个时点上收集研究资料,并 用以描述研究对象在这一时点上的状况,或者探讨这一时点上不同变量之间的关 系;而病例对照研究和队列研究在时序上都属于纵向研究,只不过前者是由现在 追溯到以前(从后向前),而后者是由现在随访到将来(由前向后)。 3.由于所调査的疾病或健康状况与某些特征或因素是同时存在的,即在调 查时因与果并存,无法判断谁先谁后,故在现况调查中常进行相关性分析,只能 为病因研究提供线索,而不能得出有关病因因果关系的结论。 4.现况调查一般不用于病程比较短的疾病。因为现况调査是在一个极短的 时间完成的,如果所调查疾病的病程过短,在调查时有许多人可能已经痊愈,而 另一些人可能在调查后才发病,故不利于反映该疾病的全貌 5.现况调查中的相关因素选择有一定的限制,一般所涉及的暴露因素最好 是持续不变(或很长时间内不变)的,比如血型、性别、职业等等,这些变量的 目前的信息与其他以往的信息同样有效。而如果分析的变量是可以改变的,比如 体温、脉搏等等,那么其目前信息的利用价值不是很大。另外,现况调査还适用 于暴露因素后期累积作用的观察。 三、现况调查的目的 1描述疾病或健康状况的分布通过现况调査可以描述疾病或健康状况的 三间分布,发现髙危人群,分析疾病或健康状况的频率与哪些环境因素、人群特 征等因素有关。例如通过我国1979~1980年进行的高血压全国抽样调查,可以了 解高血压的总患病率,以及高血压在各省、地区、城市、乡村、年龄、性别中的 分布 2发现病因线索描述某些因素或特征与疾病或健康状况的联系以确定病 因假设,供分析流行病学研究。例如在对冠心病的现况调査中发现冠心病患者中 有高血压、高血脂、肥胖等因素的比例明显高于非冠心病人群,从而提出冠心病 的某些病因假设 3适用于疾病的二级预防早期发现病人,利用普査或筛检等手段,可实现 早发现,早诊断,早治疗”的目的。例如1972~1974年我国江苏省进行的三次 麻风病全民普査,发现了大量早期麻风病人,并及时进行了早期治疗,对控制麻 风病的流行、降低麻风畸残发生率有很大的促进。 4评价疾病的防治效果考核防治措施的效果,如定期在某一人群中进行横 断面研究,收集有关暴露与疾病的资料,通过这种类似前瞻性研究的研究结果
2 1. 现况调查既可以弥补常规报告资料的不足,又能在较短的时间内得到调 查结果、花费不大,是常用的流行病学调查方法。 2. 现况调查在时序上属于横向研究,是指在一个时点上收集研究资料,并 用以描述研究对象在这一时点上的状况,或者探讨这一时点上不同变量之间的关 系;而病例对照研究和队列研究在时序上都属于纵向研究,只不过前者是由现在 追溯到以前(从后向前),而后者是由现在随访到将来(由前向后)。 3. 由于所调查的疾病或健康状况与某些特征或因素是同时存在的,即在调 查时因与果并存,无法判断谁先谁后,故在现况调查中常进行相关性分析,只能 为病因研究提供线索,而不能得出有关病因因果关系的结论。 4. 现况调查一般不用于病程比较短的疾病。因为现况调查是在一个极短的 时间完成的,如果所调查疾病的病程过短,在调查时有许多人可能已经痊愈,而 另一些人可能在调查后才发病,故不利于反映该疾病的全貌。 5. 现况调查中的相关因素选择有一定的限制,一般所涉及的暴露因素最好 是持续不变(或很长时间内不变)的,比如血型、性别、职业等等,这些变量的 目前的信息与其他以往的信息同样有效。而如果分析的变量是可以改变的,比如 体温、脉搏等等,那么其目前信息的利用价值不是很大。另外,现况调查还适用 于暴露因素后期累积作用的观察。 三、现况调查的目的 1.描述疾病或健康状况的分布 通过现况调查可以描述疾病或健康状况的 三间分布,发现高危人群,分析疾病或健康状况的频率与哪些环境因素、人群特 征等因素有关。例如通过我国 1979~1980 年进行的高血压全国抽样调查,可以了 解高血压的总患病率,以及高血压在各省、地区、城市、乡村、年龄、性别中的 分布。 2.发现病因线索 描述某些因素或特征与疾病或健康状况的联系以确定病 因假设,供分析流行病学研究。例如在对冠心病的现况调查中发现冠心病患者中 有高血压、高血脂、肥胖等因素的比例明显高于非冠心病人群,从而提出冠心病 的某些病因假设。 3.适用于疾病的二级预防 早期发现病人,利用普查或筛检等手段,可实现 “早发现,早诊断,早治疗”的目的。例如 1972~1974 年我国江苏省进行的三次 麻风病全民普查,发现了大量早期麻风病人,并及时进行了早期治疗,对控制麻 风病的流行、降低麻风畸残发生率有很大的促进。 4.评价疾病的防治效果 考核防治措施的效果,如定期在某一人群中进行横 断面研究,收集有关暴露与疾病的资料,通过这种类似前瞻性研究的研究结果
可评价某些疾病防治措施的效果。 5进行疾病监测在某一特定的人群中长期进行疾病监测,可以对所监测疾 病的分布规律和长期变化趋势有深刻的认识和了解。 6.其他现况调查还可用于衡量一个国家或地区的卫生水平和健康状况;用 于卫生服务需求的研究;用于社区卫生规划的制订与评估;进行参数估计,用于 有关卫生或检验标准的制订;为卫生行政部门的科学决策提供依据。 第二节现况调査的方法及种类 、现况调查的方法 在现况调查取得成功的关键是资料的可靠性,因此在其实施过程中必须有 科学的调查方法。现况调查常用的方法有:面访、信访、电话访问、自我管理式 问卷调查、必要的体格检査和实验室检査等,今年来随着网络的普及还出现了网 上调查等新的调查方法。 1.面访也叫访问调查法、访谈法,就是访问调查者通过口头交谈等方 式向被访问者了解所要的信息,是一种最古老、最普遍的资料收集方法。访问调 查一般都是访问者向被访问者做的面对面的直接调查,是通过口头交流的方式获 取社会信息的口头调查,是双方互动的过程。访问调查的特点在于:整个访谈过 程是访问者与被访问者互相影响、互相作用的过程,调查者可以创造和谐的调査 气氛,可以获得较高的应答率。但面访花费的人力、物力、财力较大,也比较费 时 2.信访就是通过邮局传递、派人送发等方式将调查问卷交到被调查者 手中,由被调査者自行填写,然后再返回调查者。信访的优点是节约人力、物力 和财力,但其应答率不如面访高。 3.电话访问在发达国家,由于电话的普及率很高,故有许多调查是通 过电话完成的,近年来随着我国通讯工具的普及,在城市和发达地区电话访问也 越来越多地被采用。它既有面访灵活性的优点、又有信访省力、省时的优点,缺 点是在电话普及率较低的不发达地区和农村地区,有时无法实施。 4.自我管理式问卷调査它按照统一设计的有一定结构的问卷进行调查, 由调査者组织调査对象集中发放问卷,而由被调查者自己填答问卷。其优点是调 查者可以对问卷进行必要的讲解、调查集中、实施方便、省时、省力。缺点是这 种调查要求其对象相对集中在某地,否则不易实施实施。 5.体格检查和实验室检查现况调查中往往涉及到一些需要经过一定设备 进行测量的变量,如身高、体重、血压、血脂、血色素等等,这时就需要做相应 的体格检查或实验室检査
3 可评价某些疾病防治措施的效果。 5.进行疾病监测 在某一特定的人群中长期进行疾病监测,可以对所监测疾 病的分布规律和长期变化趋势有深刻的认识和了解。 6.其他 现况调查还可用于衡量一个国家或地区的卫生水平和健康状况;用 于卫生服务需求的研究;用于社区卫生规划的制订与评估;进行参数估计,用于 有关卫生或检验标准的制订;为卫生行政部门的科学决策提供依据。 第二节 现况调查的方法及种类 一、现况调查的方法 在现况调查取得成功的关键是资料的可靠性,因此在其实施过程中必须有 科学的调查方法。现况调查常用的方法有:面访、信访、电话访问、自我管理式 问卷调查、必要的体格检查和实验室检查等,今年来随着网络的普及还出现了网 上调查等新的调查方法。 1. 面访 也叫访问调查法、访谈法,就是访问调查者通过口头交谈等方 式向被访问者了解所要的信息,是一种最古老、最普遍的资料收集方法。访问调 查一般都是访问者向被访问者做的面对面的直接调查,是通过口头交流的方式获 取社会信息的口头调查,是双方互动的过程。访问调查的特点在于:整个访谈过 程是访问者与被访问者互相影响、互相作用的过程,调查者可以创造和谐的调查 气氛,可以获得较高的应答率。但面访花费的人力、物力、财力较大,也比较费 时。 2. 信访 就是通过邮局传递、派人送发等方式将调查问卷交到被调查者 手中,由被调查者自行填写,然后再返回调查者。信访的优点是节约人力、物力 和财力,但其应答率不如面访高。 3. 电话访问 在发达国家,由于电话的普及率很高,故有许多调查是通 过电话完成的,近年来随着我国通讯工具的普及,在城市和发达地区电话访问也 越来越多地被采用。它既有面访灵活性的优点、又有信访省力、省时的优点,缺 点是在电话普及率较低的不发达地区和农村地区,有时无法实施。 4.自我管理式问卷调查 它按照统一设计的有一定结构的问卷进行调查, 由调查者组织调查对象集中发放问卷,而由被调查者自己填答问卷。其优点是调 查者可以对问卷进行必要的讲解、调查集中、实施方便、省时、省力。缺点是这 种调查要求其对象相对集中在某地,否则不易实施实施。 5.体格检查和实验室检查 现况调查中往往涉及到一些需要经过一定设备 进行测量的变量,如身高、体重、血压、血脂、血色素等等,这时就需要做相应 的体格检查或实验室检查
6.敏感问题调查方法 所谓敏感性问题( sensitive problem)是指涉及个人(或单位)的隐私或利 益的问题、以及大多数人认为不便在公开场合表态或陈述的问题,在某些情况下, 还包括一些违法或犯罪的行为。敏感性问题在现况调查中经常会遇到,例如人工 流产史、婚外性行为、不洁性行为、吸毒、手淫、学生吸烟情况、学生早恋、精 神疾病等。敏感问题按其答案的特征可分为两大类:即属性特征敏感问题和数量 特征敏感问题。 属性特征敏感问题也称分类特征敏感问题,它被用于了解被调査者是否具 有敏感问题的特征,并估计具有敏感问题特征的人在总体中所占的比重,故也可 以称为敏感性比例问题。例如是否有吸毒行为?是否有婚外性行为?等等,都是 属性特征的敏感问题。这些敏感问题根据其所提供答案的数目又可进一步分为两 分类敏感问题和多分类敏感问题,前者是指能把调査人群分为相互排斥、互相独 立的两类,答案为2选1,非此即彼,例如:“你是否曾经吸毒?①是,②否”, 这就属于两分类属性特征的敏感问题。而多分类敏感问题则把调查人群分为相互 排斥、互相独立的多类,答案为多选1,例如,“您的子女对您孝顺吗?①很孝 顺,②孝顺,③一般,④不孝顺”,这就是一个多分类敏感问题 数量特征敏感问题是指被调査者具有敏感问题数额大小的特征,一般是估 计敏感问题数值的均数,故也可称为敏感性均值问题。例如“你有几个婚外性伴 侣?”,“你一个月吸毒量是多少?”,“你每月的工资外收入有多少?”等等,这 些都是数量特征的敏感问题。 对敏感性问题进行调查时,必须采取特殊的、科学可行的方法来提高应答 率、降低或消除不真实回答率,以使调査结果真实可靠。随机应答技术 randomized response technique RRT)是敏感问题调查中常用的方法之一。RRT 是指在调查过程中使用特定的随机化装置,使被调查者以一个预定的基础概率P 从两个或两个以上的问题中选择一个问题进行回答,除被调查者本人以外的所有 人(包括调査者)均不知道被调査者的回答是针对哪一个问题,以便保护被调査 者的隐私,最后根据概率论的知识计算出敏感问题特征在人群中的真实分布情况 的一种调查方法。例如在调査学生吸烟情况时,设计外形、大小、颜色等完全 样的卡片N张,其中N1张卡片上印有:“你是否有过吸烟行为?”,在剩下的N N1张卡片上印有:“你是否喜欢看NBA的蓝球比赛?”。然后把所有卡片放到 一个黑色的布袋中混匀,调查时,由每一个被调查者从袋中任意抽一张卡片,根 据卡片上的问题作回答,回答完毕后将卡片放回布袋,这样被调查者回答的是哪 一个问题,只有他本人知道,调查者无权过问,从而保护了被调查者的隐私,易 于得到被调查者的真实回答 现况调查的种类
4 6.敏感问题调查方法 所谓敏感性问题(sensitive problem)是指涉及个人(或单位)的隐私或利 益的问题、以及大多数人认为不便在公开场合表态或陈述的问题,在某些情况下, 还包括一些违法或犯罪的行为。敏感性问题在现况调查中经常会遇到,例如人工 流产史、婚外性行为、不洁性行为、吸毒、手淫、学生吸烟情况、学生早恋、精 神疾病等。敏感问题按其答案的特征可分为两大类:即属性特征敏感问题和数量 特征敏感问题。 属性特征敏感问题也称分类特征敏感问题,它被用于了解被调查者是否具 有敏感问题的特征,并估计具有敏感问题特征的人在总体中所占的比重,故也可 以称为敏感性比例问题。例如是否有吸毒行为?是否有婚外性行为?等等,都是 属性特征的敏感问题。这些敏感问题根据其所提供答案的数目又可进一步分为两 分类敏感问题和多分类敏感问题,前者是指能把调查人群分为相互排斥、互相独 立的两类,答案为 2 选 1,非此即彼,例如:“你是否曾经吸毒?①是,②否”, 这就属于两分类属性特征的敏感问题。而多分类敏感问题则把调查人群分为相互 排斥、互相独立的多类,答案为多选 1,例如,“您的子女对您孝顺吗?①很孝 顺,②孝顺,③一般,④不孝顺”,这就是一个多分类敏感问题。 数量特征敏感问题是指被调查者具有敏感问题数额大小的特征,一般是估 计敏感问题数值的均数,故也可称为敏感性均值问题。例如“你有几个婚外性伴 侣?”,“你一个月吸毒量是多少?”,“你每月的工资外收入有多少?”等等,这 些都是数量特征的敏感问题。 对敏感性问题进行调查时,必须采取特殊的、科学可行的方法来提高应答 率、降低或消除不真实回答率,以使调查结果真实可靠。随机应答技术 (randomized response technique ,RRT)是敏感问题调查中常用的方法之一。RRT 是指在调查过程中使用特定的随机化装置,使被调查者以一个预定的基础概率 P 从两个或两个以上的问题中选择一个问题进行回答,除被调查者本人以外的所有 人(包括调查者)均不知道被调查者的回答是针对哪一个问题,以便保护被调查 者的隐私,最后根据概率论的知识计算出敏感问题特征在人群中的真实分布情况 的一种调查方法。例如在调查学生吸烟情况时,设计外形、大小、颜色等完全一 样的卡片 N 张,其中 N1 张卡片上印有:“你是否有过吸烟行为?”,在剩下的 N -N1 张卡片上印有:“你是否喜欢看 NBA 的蓝球比赛?”。然后把所有卡片放到 一个黑色的布袋中混匀,调查时,由每一个被调查者从袋中任意抽一张卡片,根 据卡片上的问题作回答,回答完毕后将卡片放回布袋,这样被调查者回答的是哪 一个问题,只有他本人知道,调查者无权过问,从而保护了被调查者的隐私,易 于得到被调查者的真实回答。 二、现况调查的种类
(一)普查( census) 1.概念普查是指为了了解某病的患病率或健康状况,于特定时间内对特 定范围内的人群中每一成员所作的调査或检査。特定时间应该较短,甚至指某时 点,一般为1~2天或1~2周,最长不宜超过2~3个月,特定范围可指某一地 区或某种特征的人群。 2.目的可因不同的研究工作而异。①为了早期发现和治疗病人(如各地开 展宫颈癌的普查),如了解血吸虫病、高血压病、冠心病等的分布,;②为了了解 疾病和健康状况的分布而进行的,如对儿童发育、营养的调查等。 普查的适用条件有:①有足够的人力、物质和设备用于发现病例和及时 治疗。②只有调查目的十分明确,调查项目非常简单,方可采用普查方式。③需 有一个权威的高度统一、集中的领导班子,并且有统一部署,统一计划、统一行 动的客观条件,方可实施普査;④所普查的疾病患病率较高。⑤需有群众基础, 疾病的检验方法操作技术不很复杂,试验的敏感性和特异性均较高 普查的原则:①要有严密的组织和高质量的普查人员队伍;②要有严格 的时间要求;③调查项目和指标必须集中统一;④尽可能按一定的周期进行。 5.普查的优缺点 普查的优点:①由于是调查某一人群的所有成员,所以在确定调查对象上 比较简单:②所获得的资料全面,可以知道全部调查对象的相关情况,准确性髙; ③普査所获得的数据对疾病的流行因素研究能有一定的启示。 缺点:①工作量大,花费大,组织工作复杂;②调查内容有限;③易产生 重复和遗漏现象;④由于工作量大而可能导致调查的精确度下降,调查质量不易 控制。 (二)抽样调查( sampling survey) 1.概念抽样调査是指从全体被研究对象中,按照一定的方法抽取一部分 对象作为代表进行调査分析,以此推论全体被研究对象状况的一种调查。抽样调 査的目的是根据调査所得的样本资料估计和推断被调査现象的总体特征,根据抽 取样本所调查出的结果可以估计出该人群某病的患病率,或某些特征的情况。它 是以少窥多、以小测大、以局部估计全体的调查方法 2.基本原理抽样要遵循随机化原则,且样本必须足够大,这样才能获得 有代表性样本,通过样本信息推断总体。抽样调查中被研究的全部单位的总和被 称为总体或母体,分为二种:有限总体和无限总体。 抽样调査的一般步骤:①界定总体:②选择适当抽样方法;③确定抽样单 位,编制抽样框;④确定样本的大小;⑤收集,整理和分析样本资料 4.抽样调查的优缺点 优点:①它按随机化原则抽取调查单位,以足够数量的调查单位组成的“样
5 (一)普查(censns) 1.概念 普查是指为了了解某病的患病率或健康状况,于特定时间内对特 定范围内的人群中每一成员所作的调查或检查。特定时间应该较短,甚至指某时 点,一般为 1~2 天或 1~2 周,最长不宜超过 2~3 个月,特定范围可指某一地 区或某种特征的人群。 2.目的可因不同的研究工作而异。①为了早期发现和治疗病人(如各地开 展宫颈癌的普查),如了解血吸虫病、高血压病、冠心病等的分布,;②为了了解 疾病和健康状况的分布而进行的,如对儿童发育、营养的调查等。 3.普查的适用条件有:①有足够的人力、物质和设备用于发现病例和及时 治疗。②只有调查目的十分明确,调查项目非常简单,方可采用普查方式。③需 有一个权威的高度统一、集中的领导班子,并且有统一部署,统一计划、统一行 动的客观条件,方可实施普查;④所普查的疾病患病率较高。⑤需有群众基础, 疾病的检验方法操作技术不很复杂,试验的敏感性和特异性均较高。 4.普查的原则:①要有严密的组织和高质量的普查人员队伍;②要有严格 的时间要求;③调查项目和指标必须集中统一;④尽可能按一定的周期进行。 5.普查的优缺点 普查的优点:①由于是调查某一人群的所有成员,所以在确定调查对象上 比较简单;②所获得的资料全面,可以知道全部调查对象的相关情况,准确性高; ③普查所获得的数据对疾病的流行因素研究能有一定的启示。 缺点:①工作量大,花费大,组织工作复杂;②调查内容有限;③易产生 重复和遗漏现象;④由于工作量大而可能导致调查的精确度下降,调查质量不易 控制。 (二)抽样调查(sampling survey) 1.概念 抽样调查是指从全体被研究对象中,按照一定的方法抽取一部分 对象作为代表进行调查分析,以此推论全体被研究对象状况的一种调查。抽样调 查的目的是根据调查所得的样本资料估计和推断被调查现象的总体特征,根据抽 取样本所调查出的结果可以估计出该人群某病的患病率,或某些特征的情况。它 是以少窥多、以小测大、以局部估计全体的调查方法。 2.基本原理 抽样要遵循随机化原则,且样本必须足够大,这样才能获得 有代表性样本,通过样本信息推断总体。抽样调查中被研究的全部单位的总和被 称为总体或母体,分为二种:有限总体和无限总体。 抽样调查的一般步骤:①界定总体;②选择适当抽样方法;③确定抽样单 位,编制抽样框;④确定样本的大小;⑤收集,整理和分析样本资料。 4.抽样调查的优缺点 优点:①它按随机化原则抽取调查单位,以足够数量的调查单位组成的“样
本”来代表和说明总体;②节省人力,物力和时间;③以样本推断总体的误差可 以事先计算并加以控制;④调査的精确度髙。由于其上述众多优点,所以在流行 病学调查中占有重要的地位,是最常用的方法。抽样调查可以用于描述疾病的分 布、衡量卫生水平、研究影响因素、考核防治效果以及调査质量控制等。 缺点:①它毕竟是一种非全面调査方法,只能提供说明整个总体情况的统 计资料,而不能提供说明各级情况的资料;②抽样调査的设计、实施与资料分析 比较复杂,存在抽样误差和偏倚,不适用于变异过大的资料;③不适用于发病率 过低的疾病等 5.抽样方法依照抽样调查的理论依据和特点,可将其分为以下几类 (1)单纯随机抽样( simple ranom sampling):是最基本的抽样的方法,也 是其他抽样方法的基础。它按随机化的原理,直接从含有N个单位的总体中, 抽出n个单位作为样本进行调查。这种方法的基本原则是每个抽样单元被抽中选 入样本的机会是相等的 单纯随机抽样首先要有一份所有研究对象排列成序的编号名单,再用抽签、 摸球、随机数字法、电子计算机抽取等方法随机选出进入样本的号码,已经入选 的号码一般不能再次列入,直到达到预定的样本含量为止 例如某县有31个乡镇,欲从中抽取3个乡镇作调查,可以先将31个乡镇 进行编号(1号~31号),制作31张大小完全相同的纸片,把1~31数字分别写到 31张纸片上,然后将纸片揉成球状,全部放入一个纸箱中完全混匀,在任何人 都看不见的情况下摸出3个纸团,其上的3个数字所对应的乡镇即为所抽取的样 本 此法的优点是实施简单、易理解;其缺点是抽样范围较大时,工作量太大 难以采用,但当抽样比例较小而样本含量较小时,所得样本代表性差 (2)系统抽样( systematic sampling):又称机械抽样或等距抽样。它是把 总体中的全部调查单位按某一标志排列起来,按固定顺序和间隔抽取样本。例如, 拟选一个5%的样本(即抽样比为120),可先从1~20之间随机选一个数,设为 14,这就是选出的起点,再加上20,得34,34加20得54, 这样,14, 34,54,74,94就是前100号中入选的数字,以后依此类推。 系统抽样优点是简便易行,样本的观察单位在总体中分布均匀,抽样代表 性较好,抽样误差与单纯随机抽样相似或略小一些。缺点是如果总体各单元的排 列顺序有周期性,则抽取的样本可能有偏倚。比如在某街道以门牌号码的顺序抽 取调查对象,大多数街道的门牌号码单数在街道的同一侧,双数号码在另一侧, 那么用系统抽样方法时可能出现这样的情况:所抽到的对象均在街道的同一侧, 而街道的两侧有许多因素是不同的(如日晒、采光、通风等),如果这些因素对 某些疾病的发生有影响,那么抽到的样本的发病情况可能与总体有差异。再比如 身份证号码的末位数字男为单数、女为双数,如果以该数字为基础进行系统抽样, 6
6 本”来代表和说明总体;②节省人力,物力和时间;③以样本推断总体的误差可 以事先计算并加以控制;④调查的精确度高。由于其上述众多优点,所以在流行 病学调查中占有重要的地位,是最常用的方法。抽样调查可以用于描述疾病的分 布、衡量卫生水平、研究影响因素、考核防治效果以及调查质量控制等。 缺点:①它毕竟是一种非全面调查方法,只能提供说明整个总体情况的统 计资料,而不能提供说明各级情况的资料;②抽样调查的设计、实施与资料分析 比较复杂,存在抽样误差和偏倚,不适用于变异过大的资料;③不适用于发病率 过低的疾病等。 5.抽样方法 依照抽样调查的理论依据和特点,可将其分为以下几类。 (1)单纯随机抽样(simple ranom sampling):是最基本的抽样的方法,也 是其他抽样方法的基础。它按随机化的原理,直接从含有 N 个单位的总体中, 抽出 n 个单位作为样本进行调查。这种方法的基本原则是每个抽样单元被抽中选 入样本的机会是相等的。 单纯随机抽样首先要有一份所有研究对象排列成序的编号名单,再用抽签、 摸球、随机数字法、电子计算机抽取等方法随机选出进入样本的号码,已经入选 的号码一般不能再次列入,直到达到预定的样本含量为止。 例如某县有 31 个乡镇,欲从中抽取 3 个乡镇作调查,可以先将 31 个乡镇 进行编号(1 号~31 号),制作 31 张大小完全相同的纸片,把 1~31 数字分别写到 31 张纸片上,然后将纸片揉成球状,全部放入一个纸箱中完全混匀,在任何人 都看不见的情况下摸出 3 个纸团,其上的 3 个数字所对应的乡镇即为所抽取的样 本。 此法的优点是实施简单、易理解;其缺点是抽样范围较大时,工作量太大 难以采用,但当抽样比例较小而样本含量较小时,所得样本代表性差。 (2)系统抽样(syetematic sampling):又称机械抽样或等距抽样。它是把 总体中的全部调查单位按某一标志排列起来,按固定顺序和间隔抽取样本。例如, 拟选一个 5%的样本(即抽样比为 1/20),可先从 1~20 之间随机选一个数,设为 14,这就是选出的起点,再加上 20,得 34,34 加 20 得 54,……。这样,14, 34,54,74,94 就是前 100 号中入选的数字,以后依此类推。 系统抽样优点是简便易行,样本的观察单位在总体中分布均匀,抽样代表 性较好,抽样误差与单纯随机抽样相似或略小一些。缺点是如果总体各单元的排 列顺序有周期性,则抽取的样本可能有偏倚。比如在某街道以门牌号码的顺序抽 取调查对象,大多数街道的门牌号码单数在街道的同一侧,双数号码在另一侧, 那么用系统抽样方法时可能出现这样的情况:所抽到的对象均在街道的同一侧, 而街道的两侧有许多因素是不同的(如日晒、采光、通风等),如果这些因素对 某些疾病的发生有影响,那么抽到的样本的发病情况可能与总体有差异。再比如 身份证号码的末位数字男为单数、女为双数,如果以该数字为基础进行系统抽样
那么可能抽到的调查对象均为男性或均为女性。因此必须事先对总体的结构有所 了解才能恰当地应用。 (3)分层抽样( stratified sampling):它是把调查总体按一定的标准分为若 干类型,然后从每一类中按照相同的或不同的比例随机抽取样本。即先按照某些 人口学特征或某些标志(如年龄、性别、住址、职业、教育程度、民族等)将硏 究人群分为若干组(统计学上称为层),然后从每层抽取一个随机样本。分层抽 样又分为两类:一类叫按比例分配分层随机抽样,即各层内抽样比例相同:另 类叫最优分配分层随机抽样(或称不等比例分层随机抽样),即各层抽样比例不 同,内部变异小的层抽样比例小,内部变异大的层抽样比例大,此时获得的样本 均数或样本率的方差最小。 从分布不均匀的研究人群中抽取有代表性样本的方法。要求层内变异越小 越好,层间变异越大越好,因而可以提高每层的精确度,而且便于层间进行比较。 (4)整群抽样( cluster sampling):利用现成的集体,随机地一群一群地抽 取集体单位,加以研究,由此推断总体的情况,称为整群抽样。用此法抽样时 抽样单位不是个体而是群体,如居民区、班级、连队、乡、村、县、工厂、学校 等。抽到的样本包括若干个群体,对群体内所有个体均进行调査。群体内个体数 可以相等,也可以不等。 整群抽样要求群间的变异越小越好,否则抽样误差较大,不能提供总体的 可靠信息 这种方法的优点是便于组织,节约人力、物力,抽样和调查均比较方便, 在实际工作中易为群众所接受,因而适合大规模调査。缺点是抽样误差较大,分 析工作量也较大 (5)两级或多级抽样( two-stage or multi- stage sampling):这是大型调查时 常用的一种抽样方法。从总体中先抽取范围较大的单元,称为一级抽样单元(例 如县、市),再从抽中的一级单元中抽取范围较小的二级单元(如区、街),这就 是两级抽样。还可依次再抽取范围更小的单元,即为多级抽样。 多级抽样常与上述各种基本抽样方法结合使用 5.抽样调查样本大小的确定 (1)确定抽样调查样本大小时应根据以下几点,①考虑总体与个体之间 差异程度,如果硏究单位之间的变异较大,样本则要大些,如其间均衡性较好, 则样本可以小些;②考虑调査要求达到的精确和可信程度,调査要求的精确度髙 些,样本量就要大。反之,样本量不必过大;③预计所调查疾病的患病率,如现 患率低,则样本量要大。反之,样本可小些;④考虑调查的项目和任务的要求情 况:⑤不同的抽样方法,各种抽样方法的抽样误差有差异,所以其样本量的大小 各有要求,在此我们仅介绍单纯随机抽样的样本量估计方法。 (2)样本量大小的估计
7 那么可能抽到的调查对象均为男性或均为女性。因此必须事先对总体的结构有所 了解才能恰当地应用。 (3)分层抽样(stratified sampling):它是把调查总体按一定的标准分为若 干类型,然后从每一类中按照相同的或不同的比例随机抽取样本。即先按照某些 人口学特征或某些标志(如年龄、性别、住址、职业、教育程度、民族等)将研 究人群分为若干组(统计学上称为层),然后从每层抽取一个随机样本。分层抽 样又分为两类:一类叫按比例分配分层随机抽样,即各层内抽样比例相同;另一 类叫最优分配分层随机抽样(或称不等比例分层随机抽样),即各层抽样比例不 同,内部变异小的层抽样比例小,内部变异大的层抽样比例大,此时获得的样本 均数或样本率的方差最小。 从分布不均匀的研究人群中抽取有代表性样本的方法。要求层内变异越小 越好,层间变异越大越好,因而可以提高每层的精确度,而且便于层间进行比较。 (4)整群抽样(cluster sampling):利用现成的集体,随机地一群一群地抽 取集体单位,加以研究,由此推断总体的情况,称为整群抽样。用此法抽样时, 抽样单位不是个体而是群体,如居民区、班级、连队、乡、村、县、工厂、学校 等。抽到的样本包括若干个群体,对群体内所有个体均进行调查。群体内个体数 可以相等,也可以不等。 整群抽样要求群间的变异越小越好,否则抽样误差较大,不能提供总体的 可靠信息。 这种方法的优点是便于组织,节约人力、物力,抽样和调查均比较方便, 在实际工作中易为群众所接受,因而适合大规模调查。缺点是抽样误差较大,分 析工作量也较大。 (5)两级或多级抽样(two-stage or multi-stage sampling):这是大型调查时 常用的一种抽样方法。从总体中先抽取范围较大的单元,称为一级抽样单元(例 如县、市),再从抽中的一级单元中抽取范围较小的二级单元(如区、街),这就 是两级抽样。还可依次再抽取范围更小的单元,即为多级抽样。 多级抽样常与上述各种基本抽样方法结合使用。 5.抽样调查样本大小的确定 (1)确定抽样调查样本大小时应根据以下几点,①考虑总体与个体之间的 差异程度,如果研究单位之间的变异较大,样本则要大些,如其间均衡性较好, 则样本可以小些;②考虑调查要求达到的精确和可信程度,调查要求的精确度高 些,样本量就要大。反之,样本量不必过大;③预计所调查疾病的患病率,如现 患率低,则样本量要大。反之,样本可小些;④考虑调查的项目和任务的要求情 况;⑤不同的抽样方法,各种抽样方法的抽样误差有差异,所以其样本量的大小 各有要求,在此我们仅介绍单纯随机抽样的样本量估计方法。 (2)样本量大小的估计
①计量资料样本大小的估计公式: n 式中n:样本量大小,a:显著性水平通常取0.05或001,t:是指统计学 上的t值,当a=005时1≈2,S:标准差,d:容许误差,即样本均数与总体均 数之差的容许范围。 例1欲调査肝硬化患者的血色素含量,预定a=005,则≈2,从正常人群 的资料查知一般人群的血色素标准差约为3.0g/100mn,调查的容许误差为0.2 g/100ml,则所抽取的样本含量应为多大? 根据题意,1=2,S=3.0g/00ml,d=0.2g/l00m,则n为: n=S2/2=4X90.04=900 ②计数资料样本大小估计公式 ta PQ 式中d为容许误差,即样本率与总体均数率之差,是调査设计者根据实际 情况规定的。P为预期的某病现患率,Q=1P,余同上。 例2欲调查我国的肺结核患病率,预定a=0.05,则t≈2,从以往全国结核 病流行病学调査的资料获知以往我国的结核病患病率为367/1)0万,若调查的容 许误差定为50/10万,则所抽取的样本含量应为多大? 根据题意,t=2,P=367/10万=000367,Q=1-P=0.99633,d=50/10万=0.0005, 则n为: n=rPQ2=4×0.00367×0.996330.00052=58500 例3某工厂有职工一万余人,现需估计全体职工携带乙型肝炎表面抗原情 况。该地区乙型肝炎表面抗原携带率约10%。现采用抽样调查,要求允许误差为 0.15FP,a=005,计算需抽样调查人数 d=0.15P=0.015 n=rPQH=4×0.1X0.90.0152=1600人 其它抽样方法的样本量和抽样误差的计算公式请查阅相关统计书籍 第三节现况调查的实施步骤 在现况调査中所遇到的问题可能是复杂多样,所以现况调査的实施要遵循科 学的研究程序,对调査中的每个环节都要进行周密的设计和推敲,只有遵循科学 研究共同的规范、程序,调査结果才能被严格地检验、复测。而且只有在按照相 同程序的前提下,调查的结果才有可能相互比较,共同的程序提供了比较的准绳。 图1来简单反映了现况调查的实施步骤
8 ① 计量资料样本大小的估计公式: 2 2 2 d t S n a = 式中 n:样本量大小,α:显著性水平通常取 0.05 或 0.01,t:是指统计学 上的 t 值,当α=0.05 时 t≈2,S:标准差,d:容许误差,即样本均数与总体均 数之差的容许范围。 例 1 欲调查肝硬化患者的血色素含量,预定α=0.05,则 t≈2,从正常人群 的资料查知一般人群的血色素标准差约为 3.0g/100ml,调查的容许误差为 0.2 g/100ml,则所抽取的样本含量应为多大? 根据题意,t=2,S=3.0g/100ml,d=0.2 g/100ml,则 n 为: n= t 2S 2 /d2=4×9/0.04=900(人) ②计数资料样本大小估计公式 2 2 d t PQ n a = 式中 d 为容许误差,即样本率与总体均数率之差,是调查设计者根据实际 情况规定的。P 为预期的某病现患率,Q=1-P,余同上。 例 2 欲调查我国的肺结核患病率,预定α=0.05,则 t≈2,从以往全国结核 病流行病学调查的资料获知以往我国的结核病患病率为 367/10 万,若调查的容 许误差定为 50/10 万,则所抽取的样本含量应为多大? 根据题意,t=2,P=367/10 万=0.00367,Q=1-P=0.99633,d=50/10 万=0.0005, 则 n 为: n= t 2PQ/d2=4×0.00367×0.99633/0.00052=58500(人) 例 3 某工厂有职工一万余人,现需估计全体职工携带乙型肝炎表面抗原情 况。该地区乙型肝炎表面抗原携带率约 10%。现采用抽样调查,要求允许误差为 0.15P,α=0.05,计算需抽样调查人数。 d=0.15P=0.015 n= t 2PQ/d2=4×0.1×0.9/0.0152=1600 人 其它抽样方法的样本量和抽样误差的计算公式请查阅相关统计书籍。 第三节 现况调查的实施步骤 在现况调查中所遇到的问题可能是复杂多样,所以现况调查的实施要遵循科 学的研究程序,对调查中的每个环节都要进行周密的设计和推敲,只有遵循科学 研究共同的规范、程序,调查结果才能被严格地检验、复测。而且只有在按照相 同程序的前提下,调查的结果才有可能相互比较,共同的程序提供了比较的准绳。 图 1 来简单反映了现况调查的实施步骤
三间分布、病因线索 查阅文献 研究目的三早、考核防治效果 实地考察 参数估计、监测 专家咨询 需求评价、卫生决策 实践经验 备阶段 确定分析单位 确定调查指标 课题的具体化 确定调查对象 确定调查方法 研究设计 设计问卷和调研方案 制定抽样方案 制定总体规划 制定时间进度 调查员培训组织 预调查 进入调查地区单位 调 正式实施调查 阶 潮君渣收集资 发放问卷 填写调查表格 收集其他资料 谈、访问 收集文献和统计资料 研究阶 进行简化、汇总和分类 资料核查与整理 统计描述、相关分析 段 理论概括、综合、抽象 统计分析 结果解释 撰写调查报告 提出结论、建议 总结经验教训 总结与评估 解决实际卫生问题 研究成果发表、应用 图1现况调查的实施步骤 确定研究目的 确定研究目的是现况调查的第一步,也是关键的一步。开展一个现况调查必 须首先明确本次研究的目的是为了描述疾病的三间分布,还是要寻找疾病危险因 素的线索;是建立有关正常生理生化指标的参考值,还是进行疾病的三早预防
9 确定研究目的 研究设计 图 1 现况调查的实施步骤 一、确定研究目的 确定研究目的是现况调查的第一步,也是关键的一步。开展一个现况调查必 须首先明确本次研究的目的是为了描述疾病的三间分布,还是要寻找疾病危险因 素的线索;是建立有关正常生理生化指标的参考值,还是进行疾病的三早预防; 准 备 阶 段 三间分布、病因线索 三早、考核防治效果 参数估计、监测 需求评价、卫生决策 查阅文献 实地考察 专家咨询 实践经验 课题的具体化 确定调查对象 确定调查方法 设计问卷和调研方案 制定总体规划 确定分析单位 确定调查指标 制定抽样方案 制定时间进度 调查员培训组织 预调查 调 查 阶 段 进入调查地区单位 正式实施调查 通过各种方法收集资 料并进行检查 收集其他资料 发放问卷 填写调查表格 座谈、访问 收集文献和统计资料 研 究 阶 段 资料核查与整理 统计分析 结果解释 进行简化、汇总和分类 统计描述、相关分析 理论概括、综合、抽象 总 结 阶 段 撰写调查报告 总结与评估 研究成果发表、应用 提出结论、建议 总结经验教训 解决实际卫生问题
或者是为了评价疾病防治措施的效果。研究目的是整个现况调査的出发点,它对 现况调査的各个步骤都有决定性的影响。 确定研究目的需要做许多准备工作,包括査阅文献资料、实地考察、向专家 咨询、总结自己的经验等。只有充分地掌握背景资料,了解该问题现有的知识水 平,国内、外进展情况,才能阐明该研究的科学性、创新性和可行性,才能估价 其社会效益和经济效益。 二、确定研究对象 选择研究对象首先要考虑研究目的。如果研究目的是为了“三早”,则可 选择髙危人群;如果为了硏究某些相关因素与疾病的关联,则要选择暴露人群或 职业人群;如果是为了获得疾病的三间分布资料或确定某些生理、生化指标的参 考值,则要选择有代表性的人群;如果是为了评价疾病的防治措施的效果,则要 选择已实施了该预防或治疗措施的人群。 例如,比较某市不同区的精神疾病患病率,则可从不同区进行抽样。如果 对某职业暴露有兴趣,可选择有暴露的工厂的工人与无暴露的工厂的工人,比较 其患病率;或选择工厂中有暴露的部分工人与另一部分无暴露的工人比较。 选择硏究对象时还要结合实际进行考虑,例如经费来源的多少,是否便于调 查等等。如果是相对小的人群,则可包括全部人群;如果不实际或花费太大,则 可选择暴露组与非暴露组。 三、确定研究类型和方法 研究类型的确定也要以研究目的为依据。如目的是为了“三早”,则可以选 择其高危人群进行普査;如果为了了解调査某病的患病率,则可以采用抽样调査。 确定研究类型时,还要考虑现有的人力、物力和财力,权衡利弊后再作决定 硏究方法的确定也应从研究目的出发,结合所收集资料的特殊性,并考虑调 查对象的特点和适应性进行选择。如果调查的对象集中、且文化水平较高,则选 用自我管理式问卷调査效果较好,并能节省人力、物力和时间;如果所调查的人 群电话普及率高,则可以考虑电话采访;如果调查对象极其分散,则信访调查可 能比较合适;而如果调査的要求较高,所调查的内容需经被调查者的当面核实, 或者调査内容中有现场观察的部分,则选择面访更合适 在人群中进行现况调查时,可能会涉及到一些需要经过一定设备进行测量的 变量,需要做相应的实验室检査,应注意尽量采用简单易行的技术和灵敏度、特 异度髙的检验方法,这一点在患病率低的疾病的现况调查中尤为重要。如果特异 度过低,则会出现大量假阳性者
10 或者是为了评价疾病防治措施的效果。研究目的是整个现况调查的出发点,它对 现况调查的各个步骤都有决定性的影响。 确定研究目的需要做许多准备工作,包括查阅文献资料、实地考察、向专家 咨询、总结自己的经验等。只有充分地掌握背景资料,了解该问题现有的知识水 平,国内、外进展情况,才能阐明该研究的科学性、创新性和可行性,才能估价 其社会效益和经济效益。 二、确定研究对象 选择研究对象首先要考虑研究目的。如果研究目的是为了“三早”,则可 选择高危人群;如果为了研究某些相关因素与疾病的关联,则要选择暴露人群或 职业人群;如果是为了获得疾病的三间分布资料或确定某些生理、生化指标的参 考值,则要选择有代表性的人群;如果是为了评价疾病的防治措施的效果,则要 选择已实施了该预防或治疗措施的人群。 例如,比较某市不同区的精神疾病患病率,则可从不同区进行抽样。如果 对某职业暴露有兴趣,可选择有暴露的工厂的工人与无暴露的工厂的工人,比较 其患病率;或选择工厂中有暴露的部分工人与另一部分无暴露的工人比较。 选择研究对象时还要结合实际进行考虑,例如经费来源的多少,是否便于调 查等等。如果是相对小的人群,则可包括全部人群;如果不实际或花费太大,则 可选择暴露组与非暴露组。 三、确定研究类型和方法 研究类型的确定也要以研究目的为依据。如目的是为了“三早”,则可以选 择其高危人群进行普查;如果为了了解调查某病的患病率,则可以采用抽样调查。 确定研究类型时,还要考虑现有的人力、物力和财力,权衡利弊后再作决定。 研究方法的确定也应从研究目的出发,结合所收集资料的特殊性,并考虑调 查对象的特点和适应性进行选择。如果调查的对象集中、且文化水平较高,则选 用自我管理式问卷调查效果较好,并能节省人力、物力和时间;如果所调查的人 群电话普及率高,则可以考虑电话采访;如果调查对象极其分散,则信访调查可 能比较合适;而如果调查的要求较高,所调查的内容需经被调查者的当面核实, 或者调查内容中有现场观察的部分,则选择面访更合适。 在人群中进行现况调查时,可能会涉及到一些需要经过一定设备进行测量的 变量,需要做相应的实验室检查,应注意尽量采用简单易行的技术和灵敏度、特 异度高的检验方法,这一点在患病率低的疾病的现况调查中尤为重要。如果特异 度过低,则会出现大量假阳性者