
讲稿流行病学课程名称:课程编号:y100615授课学期:2012-2013秋季学期授课班级:08预防袁聚祥任课教师:学院河北联合大学公共卫生
讲 稿 课程名称: 流行病学 课程编号: y100615 授课学期:2012-2013 秋季学期 授课班级: 08 预防 任课教师: 袁聚祥 河北联合大学 公共卫生 学院

第3周,第1讲次课程名称:《流行病学》摘要第三章描述性研究第一节概述授课题目(章、节)第二节研究设计与实施第三节研究实例本讲目的要求及重点难点:【目的要求】通过本讲课程的学习,掌握现况研究的概念、目的与种类,普查与抽样调查的概念、目的及其优缺点;熟悉抽样调查的方法,估计样本大小的原则,现况研究中常见偏倚及其控制。了解抽样调查估计样本大小的公式。【重点】现况研究的目的及其方法:普查的概念、目的及优缺点;抽样调查的方法。[难 点】现况研究偏性的防止,现况研究的质量控制。内容【本讲课程的引入】描述性研究通过描述疾病或健康状况的三间分布情况,找出某些因素与疾病或健康状况间的关系,提供病因线索。它既是流行病学研究工作的起点,也是其他流行病学研究方法的基础。【本讲课程的内容】第一节现况研究概述一、基本概念强调现况研究描述性研究又称横断面研究,也称患病率研究。特点,不能确定研究特定时点或期间和特定范围内人群中的有关变量(因素)与疾病或健康状因果关系况的关系二、研究目的与应用范围1掌握目标群体中疾病或健康状况的分布2提供疾病病因研究的线索3确定高危人群4评价疾病监测、预防接种等防治措施效果三、研究特点与研究类型研究特点:1开始时一般不设对照组2现况研究的特定时间3在确定因果联系时受到限制4对不会发生改变的暴露因素,可以提示因果联系研究类型1普查:调查特定时点或时期、特定范围内的全部人群(总体)。普查时限:特定时间应该较短,甚至指某时点,一般为1~2天或1~2周,最长不宜超过2~3个月,特定范围可指某一地区或某种特征的人群。1
1 课程名称:《流行病学》 第 3 周,第 1 讲次 摘 要 授课题目(章、节) 第三章 描述性研究 第一节 概述 第二节 研究设计与实施 第三节 研究实例 本讲目的要求及重点难点: 【目的要求】通过本讲课程的学习,掌握现况研究的概念、目的与种类,普查与抽样调查的概 念、目的及其优缺点;熟悉抽样调查的方法,估计样本大小的原则,现况研究中常见偏倚及其控 制。了解抽样调查估计样本大小的公式。 【重 点】现况研究的目的及其方法;普查的概念、目的及优缺点;抽样调查的方法。 【难 点】现况研究偏性的防止,现况研究的质量控制。 内 容 【本讲课程的引入】描述性研究通过描述疾病或健康状况的三间分布情况,找 出某些因素与疾病或健康状况间的关系,提供病因线索。 它既是流行病学研究工作的起点,也是其他流行病学研究方法的基础。 【本讲课程的内容】 第一节 现况研究概述 一、基本概念 描述性研究又称横断面研究,也称患病率研究。 研究特定时点或期间和特定范围内人群中的有关变量(因素)与疾病或健康状 况的关系 二、研究目的与应用范围 1 掌握目标群体中疾病或健康状况的分布 2 提供疾病病因研究的线索 3 确定高危人群 4 评价疾病监测、预防接种等防治措施效果 三、研究特点与研究类型 研究特点: 1 开始时一般不设对照组 2 现况研究的特定时间 3 在确定因果联系时受到限制 4 对不会发生改变的暴露因素,可以提示因果联系 研究类型 1 普查:调查特定时点或时期、特定范围内的全部人群(总体)。 普查时限:特定时间应该较短,甚至指某时点,一般为 1~2 天或 1~2 周,最长不 宜超过 2~3 个月,特定范围可指某一地区或某种特征的人群。 强调现况研究 特点,不能确定 因果关系

普查分类:(1)以了解人群中某病的患病率或健康状况为目的:(2)以早期发现病人为目的(筛检)。普查目的与用途:(1)了解某人群中某种疾病或某危险因素的基本分布情况。(2)了解某人群的健康水平或生长发育情况。(3)建立生理指标或制定某项生物学检验标准。(4)早期发现病人,以便早期诊断、早期治疗,即便于普查普治,从而提高治愈率,减少病残或减少劳动能力。(5)在疾病爆发或流行时,可借助于普查来寻找全部病例,也可以了解疾病的全貌。普查适用于有下列特点的疾病:①患病率高;②有简便诊断方法;③有切实治疗方法;有足够人力、物力。普查的优缺点①优点:能提供疾病分布情况和流行因素或病因线索:能起到普及医学科学知识的作用:能发现人群中的全部病例,使其得到及时治疗。②缺点:工作量大,难免有遗漏:需大量人力、物力,成本高:不能获得发病率资料。普查应答率一般要求最好在85%以上。2抽样调查:随机抽样,调查特定时点、特定范围人群的一个代表性样本,以样本统计量估计总体参数所在范围。(1)优点:省时间、人力和物力,调查范围小,调查工作容易做得细致,适于调查发病率较高的疾病。(2)缺点:设计、实施与资料分析均比较复杂;重复、遗漏不易发现,且不适于变异过大的资料。第二节现况研究的设计与实施一、明确调查目的和类型1根据研究提出的问题,明确调查目的2根据具体研究目的确定是普查还是抽样调查二、确定研究对象根据研究目的规定对象的人群分布特征、地域范围以及时间点1某个区域内的全体居民或其中一部分2某一时点上的流动人员3某些特殊群体强调样本量的三、确定样本量和抽样方法确定样本量估算和抽样方1预期现患率(P)2允许误差(d)法3显著性水平(α)tapo数资料样本大小估计公式:n=dt:统计学上的t值d:容许误差P:某病现患率 Q=1-P当抽样误差d=0.1P时,则n=400g/p当抽样误差d=0.15P时,则n=178g/p例:欲调查我国的肺结核患病率,预定α=0.05,则t~2,从以往全国结核病流2
2 普查分类:(1)以了解人群中某病的患病率或健康状况为目的; (2) 以早期发现病人为目的(筛检)。 普查目的与用途: (1)了解某人群中某种疾病或某危险因素的基本分布情况。 (2)了解某人群的健康水平或生长发育情况。 (3)建立生理指标或制定某项生物学检验标准。 (4)早期发现病人,以便早期诊断、早期治疗,即便于普查普治,从而提高治愈 率,减少病残或减少劳动能力。 (5)在疾病爆发或流行时,可借助于普查来寻找全部病例,也可以了解疾病的全 貌。 普查适用于有下列特点的疾病: ①患病率高; ②有简便诊断方法;③有切实治疗方法; ④有足够人力、物力。 普查的优缺点 ①优点:能提供疾病分布情况和流行因素或病因线索;能起到普及医学科学知识 的作用;能发现人群中的全部病例,使其得到及时治疗。 ②缺点:工作量大,难免有遗漏;需大量人力、物力,成本高;不能获得发病率 资料。普查应答率一般要求最好在 85%以上。 2 抽样调查:随机抽样,调查特定时点、特定范围人群的一个代表性样本,以样本 统计量估计总体参数所在范围。 (1)优点: 省时间、人力和物力,调查范围小,调查工作容易做得细致,适于 调查发病率较高的疾病。 (2)缺点 : 设计、实施与资料分析均比较复杂;重复、遗漏不易发现,且不适 于变异过大的资料。 第二节 现况研究的设计与实施 一、明确调查目的和类型 1 根据研究提出的问题,明确调查目的 2 根据具体研究目的确定是普查还是抽样调查 二、确定研究对象 根据研究目的规定对象的人群分布特征、地域范围以及时间点 1 某个区域内的全体居民或其中一部分 2 某一时点上的流动人员 3 某些特殊群体 三、确定样本量和抽样方法 确定样本量 1 预期现患率 ( P ) 2 允许误差(d) 3 显著性水平(α) 数资料样本大小估计公式: t:统计学上的 t 值 d:容许误差 P:某病现患率 Q=1–P 当抽样误差 d=0.1P 时,则 n=400q/p 当抽样误差 d=0.15P 时,则 n=178q/p 例:欲调查我国的肺结核患病率,预定α=0.05,则 t≈2,从以往全国结核病流 强调样本量的 估算和抽样方 法 2 2 d t PQ n =

行病学调查的资料获知以往我国的结核病患病率为367/10万,若调查的容许误差定为50/10万,则所抽取的样本含量应为多大?根据题意,t=2,P=367/10万=0.00367,q=1-P=0.99633,d=50/10万=0.0005,则n为:tpqn=2=22×0.00367X0.99633/0.00052=58500(人)d?按不同预期阳性率和允许误差时的样本量允许误差预期现患率0.10P0.15P0.20P0. 057600190033820. 0754933210313280.10360016029000. 15226410095667124000.2016003000.2512005330.30930415233tas?抽样调查均数时样本量计算公式:n=d?n为样本数,ua为正态分布中自左向右的累积概率为a/2时的u值,u0.05=1.960,0为标准差,8为允许误差,一般取总体均数可信限的一半。当α取0.05时,S为样本的预期标准差,d为允许误差,则n=4S2/d2例:欲调查肝硬化患者的血色素含量,预定a=0.05,则t~2,从正常人群的资料查知一般人群的血色素标准差约为3.0g/100ml,调查的容许误差为0.2g/100ml,则所抽取的样本含量应为多大?根据题意,t2,S=3.0g/100ml,d=0.2g/100ml,则n为:n=ts/d=2×9/0.04=900(人)抽样方法:非随机抽样:随机抽样。1非随机抽样:选择样本时,加入人主观因素,使总体中每个个体被抽取的机会是不均等的。试验者根据试验调查的目的、要求和被调查对象的总体情况,有意识地选择那些具有代表性的对象进行试验。2随机抽样:遵循随机化原则,保证总体中每一个对象都有同等机会被选入作为研究对象。(1)单纯随机抽样(简单随机抽样):最简单、最基本的抽样方法。从总体N个对象中,利用抽签或其他随机方法抽取n个,总体中每个对象被抽到的概率相等,(2)系统抽样(机械抽样):按照一定顺序,机械地每隔若干单位抽取一个单位的抽样方法。·将总体各个个体单位按某种标志排列、连续编号·根据总体数N和确定的样本数n,计算抽样距离(N/n)·用单纯随机方法在第一组中确定一个起始号3
3 行病学调查的资料获知以往我国的结核病患病率为 367/10 万,若调查的容许误差 定为 50/10 万,则所抽取的样本含量应为多大? 根据题意,t=2,P=367/10 万=0.00367,q=1-P=0.99633,d=50/10 万=0.0005, 则 n 为: =22×0.00367×0.99633/0.00052=58500(人) 按不同预期阳性率和允许误差时的样本量 允许误差 预期现患率 0.10P 0.15P 0.20P 0.05 7600 3382 1900 0.075 4933 2103 1328 0.10 3600 1602 900 0.15 2264 1009 566 0.20 1600 712 400 0.25 1200 533 300 0.30 930 415 233 抽样调查均数时样本量计算公式: n 为样本数, uα 为正态分布中自左向右的累积概率为α/2 时的 u 值, u 0.05=1.960, σ为标准差,δ为允许误差,一般取总体均数可信限的一半。 当α取 0.05 时,S 为样本的预期标准差,d 为允许误差,则:n=4S2/d2 例: 欲调查肝硬化患者的血色素含量,预定α=0.05,则 t≈2,从正常人群的 资料查知一般人群的血色素标准差约为 3.0g/100ml,调查的容许误差为 0.2 g/100ml,则所抽取的样本含量应为多大? 根据题意,t=2,S=3.0g/100ml,d=0.2 g/100ml,则 n 为:n= t 2 S 2 /d 2 =2 2 × 9/0.04=900(人) 抽样方法:非随机抽样;随机抽样。 1 非随机抽样:选择样本时,加入人主观因素,使总体中每个个体被抽取的机会是 不均等的。 试验者根据试验调查的目的、要求和被调查对象的总体情况,有意 识地选择那些具有代表性的对象进行试验。 2 随机抽样:遵循随机化原则,保证总体中每一个对象都有同等机会被选入作为研 究对象。 (1)单纯随机抽样(简单随机抽样):最简单、最基本的抽样方法。从总体 N 个对 象中,利用抽签或其他随机方法抽取 n 个,总体中每个对象被抽到的概率相等, (2)系统抽样(机械抽样):按照一定顺序,机械地每隔若干单位抽取一个单位的 抽样方法。 •将总体各个个体单位按某种标志排列、连续编号 •根据总体数 N 和确定的样本数 n,计算抽样距离(N/n) •用单纯随机方法在第一组中确定一个起始号 2 2 d t pq n = 2 2 2 d t s n =

·从此起始点开始,每隔K(K=N/n)个单位抽取一个作为研究对象抽样比=n/N,抽样间隔为抽样比的倒数。如抽样比为5%(1/20),则抽样间隔为20。例如:总体中有250000个单位,决定抽取1000个作为样本。其比例应为1000/250000=1/250,即每250个中抽1个,具体做法是:先从1~250号中随机抽取1个作为起点,之后每隔250个抽取1个。(3)整群抽样:将总体分成若干群组,抽取其中部分群组作为观察单位组成样本。分类:①单纯整群抽样:被抽到的群组中的全部个体均作为调查对象②二阶段抽样:通过再次抽样后调查部分个体例:要调查20所小学约10000名小学生某疾病的现患率,现要求抽查2000人,如用单纯随机抽样抽到的对象分散在各所小学,对调查的实施不方便,但若随机抽取4所小学,抽到的学校全部学生均进行调查,则实施很方便,可节省人力、物力,也易于为调查对象接受。但由于整群抽样的误差较大,一般样本数应在原有基础上增加20%。即再增加4X20%=0.8(所),则实际样本量为5所学校。(4)分层抽样:将总体单位按某种特征分为若干次级(层),然后从每一层内单纯随机抽样组成一个样本。分类:①按比例分配分层随机抽样:各层内抽样比例相同。②最优分配分层随机抽样:各层抽样比例不同,内部变异小的层抽样比例小,内部变异大的层抽样比例大。例:某地15岁以上各年龄组的人口数如下表,欲抽取1万人调查高血压患病率。采取按比例分层抽样方法时,首先计算抽样比例:10000/177000×100%=5.65%。再计算各年龄组的抽样人数某地15岁以上人口数和按相等比例确定的抽样人数人数(2)年龄组(1)抽样人数(3)=5.65%×(2)15~25000141225~34000192135~38000214745~32000180955~28000158165~200001130合计17700010000每层内可按单纯随机抽样法或其它方法抽取所需人数。以上四种抽样方法的抽样误差由小到大依次:分层抽样<系统抽样<单纯随机抽样<整群抽样3多级抽样:将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同,即将以上抽样方法结合使用,在大型流行病学调查中常用。方法:(1)从总体中抽取范围较大的单元(一级抽样)(2)从一级单元中抽取范围较小的单元(二级抽样)(3)依此类推…四、资料的收集通过测定或检查的方法收集4
4 •从此起始点开始,每隔 K(K=N/n)个单位抽取一个作为研究对象 抽样比=n /N,抽样间隔为抽样比的倒数。如抽样比为 5%(1/20),则抽样间隔 为 20。 例如:总体中有 250000 个单位,决定抽取 1000 个作为样本。 其比例应为 1000/250000=1/250 ,即每 250 个中抽 1 个,具体做法是:先从 1~ 250 号中随机抽取 1 个作为起点,之后每隔 250 个抽取 1 个。 (3)整群抽样:将总体分成若干群组,抽取其中部分群组作为观察单位组成样本。 分类: ①单纯整群抽样:被抽到的群组中的全部个体均作为调查对象 ②二阶段抽样:通过再次抽样后调查部分个体 例:要调查 20 所小学约 10000 名小学生某疾病的现患率,现要求抽查 2000 人, 如用单纯随机抽样抽到的对象分散在各所小学,对调查的实施不方便,但若随机抽 取 4 所小学,抽到的学校全部学生均进行调查,则实施很方便,可节省人力、物力, 也易于为调查对象接受。 但由于整群抽样的误差较大,一般样本数应在原有基础上增加 20%。即再增加 4×20%=0.8(所),则实际样本量为 5 所学校。 (4)分层抽样:将总体单位按某种特征分为若干次级(层),然后从每一层内单纯 随机抽样组成一个样本。分类: ①按比例分配分层随机抽样:各层内抽样比例相同。 ②最优分配分层随机抽样:各层抽样比例不同,内部变异小的层抽样比例小,内 部变异大的层抽样比例大。 例:某地 15 岁以上各年龄组的人口数如下表,欲抽取 1 万人调查高血压患病 率。采取按比例分层抽样方法时,首先计算抽样比例:10000/177000×100%=5.65%。 再计算各年龄组的抽样人数。 某地 15 岁以上人口数和按相等比例确定的抽样人数 年龄组(1) 人数(2) 抽样人数(3)=5.65% ×(2) 15~ 25000 1412 25~ 34000 1921 35~ 38000 2147 45~ 32000 1809 55~ 28000 1581 65~ 20000 1130 合计 177000 10000 每层内可按单纯随机抽样法或其它方法抽取所需人数。 以上四种抽样方法的抽样误差由小到大依次:分层抽样<系统抽样<单纯随机抽样< 整群抽样 3 多级抽样:将抽样过程分阶段进行,每个阶段使用的抽样方法往往不同,即将以 上抽样方法结合使用,在大型流行病学调查中常用。方法: (1)从总体中抽取范围较大的单元(一级抽样) (2)从一级单元中抽取范围较小的单元(二级抽样) (3)依此类推. 四、资料的收集 通过测定或检查的方法收集

直接用调查表询问研究对象资料收集1收集的内容:个人的基本情况:年龄、出生日期、性别、民族、文化程度、婚姻状况、家庭人口数、家庭经济状况等。职业情况:具体工作性质、种类、职务、从事工作年限、与职业有关的特殊情况等。生活习惯及保健情况:饮食情况、吸烟史及量、饮酒史及量、医疗保健条件、身体锻炼情况等。妇女生育情况:月经史、生育史、避孕方式等。环境资料:生活环境和工作环境的某些数据。人口学资料:抽样总体数,按不同人口学分组的人口数。疾病测量:采用简单、易行的技术和灵敏度高的方法:对疾病必须建立严格的诊断标准。·暴露测量:暴露又称变量即我们所研究的因素,研究对象所具有的特征。对调查员的要求:具有科学态度和高度的责任心。2收集的方法:(1)常规登记和报告:(2)专题询问调查与信函调查:(3)临床检查及其他特殊检查的有关资料3调查表的设计:义称问卷,是流行病学研究的主要工具,其设计好坏,直接关系到调查的质量与水平,故需精心设计。研究变量是通过调查表来具体体现的。(1)问卷的种类代填问卷:是由调查者按照统一设计的问卷向被调查者当面提出问题,然后再由调查者根据被调查者的口头回答来填写。代填问卷多用于面访、电话访问中,故又称访问问卷。自填问卷:调查者一般不与被调查者直接见面,而由被调查者按照统一设计的有一定结构的调查表自己填答问卷,然后再返回调查者手里,为一种间接的调查。自填问卷可通过调查员直接发放、报刊发行、邮局传递、网络传送等方式交到被调查者手中。(2)问卷的基本结构一般来说,一份问卷通常包括:封面信、指导语、问题用答案、编码和其他资料。封面信:即一封致被调查者的短信,其作用在于向被调查者介绍和说明调查者的身份、调查的目的等内容。需要说明以下内容:调查的主办单位或个人的身份:调查的内容和范围:调查的目的:调查对象的选取方法和调查结果保密的措施。除此,有的问卷通常还把填答问卷的方法、要求、回收问卷的方式和时间等等具体事项写进封面信中。在信的结尾处还要向被调查者表示感谢。封面信的文笔要简明、亲切、谦虚、诚悬,切忌罗嗪。(3)填表说明处填上1、请在每一问题后适合你自己情况的答案序号上画圈,或在5
5 直接用调查表询问研究对象 资料收集 1 收集的内容: 个人的基本情况:年龄、出生日期、性别、民族、文化程度、婚姻状况、家庭 人口数、家庭经济状况等。 职业情况:具体工作性质、种类、职务、从事工作年限、与职业有关的特殊情 况等。 生活习惯及保健情况:饮食情况、吸烟史及量、饮酒史及量、医疗保健条件、 身体锻炼情况等。 妇女生育情况:月经史、生育史、避孕方式等。 环境资料:生活环境和工作环境的某些数据。 人口学资料:抽样总体数,按不同人口学分组的人口数。 •疾病测量:采用简单、易行的技术和灵敏度高的方法;对疾病必须建立严格的诊 断标准。 •暴露测量:暴露又称变量即我们所研究的因素,研究对象所具有的特征。 对调查员的要求:具有科学态度和高度的责任心。 2 收集的方法: (1)常规登记和报告: (2)专题询问调查与信函调查: (3)临床检查及其他特殊检查的有关资料 3 调查表的设计:又称问卷,是流行病学研究的主要工具,其设计好坏,直接关系 到调查的质量与水平,故需精心设计。研究变量是通过调查表来具体体现的。 (1)问卷的种类 代填问卷:是由调查者按照统一设计的问卷向被调查者当面提出问题,然后 再由调查者根据被调查者的口头回答来填写。代填问卷多用于面访、电话访问中, 故又称访问问卷。 自填问卷:调查者一般不与被调查者直接见面,而由被调查者按照统一设计 的有一定结构的调查表自己填答问卷,然后再返回调查者手里,为一种间接的调查。 自填问卷可通过调查员直接发放、报刊发行、邮局传递、网络传送等方式交到被调 查者手中。 (2)问卷的基本结构 一般来说,一份问卷通常包括:封面信、指导语、问题用答案、编码和其他 资料。 封面信:即一封致被调查者的短信,其作用在于向被调查者介绍和说明调查 者的身份、调查的目的等内容。 需要说明以下内容:调查的主办单位或个人的身份;调查的内容和范围;调 查的目的;调查对象的选取方法和调查结果保密的措施。除此,有的问卷通常还把 填答问卷的方法、要求、回收问卷的方式和时间等等具体事项写进封面信中。在信 的结尾处还要向被调查者表示感谢。封面信的文笔要简明、亲切、谦虚、诚恳,切 忌罗嗦。 (3)填表说明 1、请在每一问题后适合你自己情况的答案序号上画圈,或在 处填上

适当的内容。2、问卷每页左边的数码用短横线一一是上计算机用的,你不必填写。3、如无特殊说明,每一问题只能选择一个答案。4、填答问卷时请不要与他人商量。卷中的指导语一般是针对某些较特殊的问题所做出的特定指示。如“可选多个答案”、“请按重要程度排列”、“若不是,请跳过10~14题,直接从15题开始答起”等。总之,问卷中每一个有可能使回答者不清楚、不明白、难以理解的地方,一切有可能成为回答者填答问卷障碍的地方,都需要给予某种指导,而对于编写指导语来说,最主要的标准,就是要简明易懂。问题和答案:问题和答案是问卷的主体,可以说,被调查者的各种情况正是通过问题和答案来收集的。问卷中的问题在形式上可分为开放形式和封闭形式两大类:在内容上义可分为有关事实的、有关态度的和有关个人背景资料的三大类。所谓开放式问题,就是不为回答者提供具体的答案,而是由回答者自由回答的问题。如“你现在从事什么职业?”,“你对学校实行学分制是如何认识的?”等。开放式问题的优点是它能使回答者充分按照自己的方式和自己的想法回答问题,而不受什么限制,所得到的资料往往比封闭形式问题所得资料要丰富和生动得多。缺点是:①它要求回答者要有较高的知识水平和文字表达能力,这就大大限制了调查的范围和对象;②它要求回答者花费较多的时间和精力;③所获得的资料难于处理和进行定量分析。所谓封闭式问题,就是在提出问题的同时,还给出若干个可能的答案,供回答者根据自已的实际情况从中选择一个作为回答。封闭式问题的缺点是①由于封闭式问题已为回答者提供了可供选择的答案,所以实际上也就限制了回答者回答的范围和回答的方式:②回答者在回答中的偏误难以发现。优点是:①回答者填写问卷十分方便,对文字表达能力也无特殊的要求;②封闭式问题所得的资料十分集中,而且特别便于进行统计处理和定量分析。总体来讲,您的健康状况是:1非常好2)很好3)好4)一般5)差编码和其他资料:所谓编码就是赋予每一个问题及其答案一个数字作为它的代码,便于计算机处理,常在每项数据后留出编码用方框,以便于编码输入。除了编码以外,有些问卷还需要在封面上写上访问员姓名、问卷发放及回收日期、审核员姓名、被调查者居住地等有关资料等等。五、资料的整理与分析1检查资料的完整准确性,补缺、补漏,删除重复,纠正错误2对疾病或某健康状态按规定的标准归类核实3按不同空间、时间、人群描述分布特征和差异,进行显著性检验4按是否暴露研究因素进行分组作有对照组的比较分析结果解释一般先应表明样本的代表性,应答率等情况。然后要估计分析调查中有无偏倚及其来源、大小、方向和调整方法。1.若调查的目的是为了了解疾病的分布,可根据“三间”分布特征的结果,结合有关因素解释疾病的分布特点。2.若现况调查的目的是提供病因线索,可将描述性资料进行对比分析,寻找规律,为进一步进行分析性研究建立病因假设提供依据。六、偏倚及其控制6
6 适当的内容。 2、问卷每页左边的数码用短横线——是上计算机用的,你不必填写。 3、如无特殊说明,每一问题只能选择一个答案。 4、填答问卷时请不要与他人商量。 卷中的指导语一般是针对某些较特殊的问题所做出的特定指示。如“可选多个 答案”、“请按重要程度排列”、“若不是,请跳过 10~14 题,直接从 15 题开始 答起”等。总之,问卷中每一个有可能使回答者不清楚、不明白、难以理解的地方, 一切有可能成为回答者填答问卷障碍的地方,都需要给予某种指导,而对于编写指 导语来说,最主要的标准,就是要简明易懂 。 问题和答案:问题和答案是问卷的主体,可以说,被调查者的各种情况正是通 过问题和答案来收集的。问卷中的问题在形式上可分为开放形式和封闭形式两大 类;在内容上又可分为有关事实的、有关态度的和有关个人背景资料的三大类。 所谓开放式问题,就是不为回答者提供具体的答案,而是由回答者自由回答的 问题。如“你现在从事什么职业?” ,“你对学校实行学分制是如何认识的?” 等。开放式问题的优点是它能使回答者充分按照自己的方式和自己的想法回答问 题,而不受什么限制,所得到的资料往往比封闭形式问题所得资料要丰富和生动得 多。缺点是:①它要求回答者要有较高的知识水平和文字表达能力,这就大大限制 了调查的范围和对象;②它要求回答者花费较多的时间和精力;③所获得的资料难 于处理和进行定量分析。 所谓封闭式问题,就是在提出问题的同时,还给出若干个可能的答案,供回答 者根据自己的实际情况从中选择一个作为回答。封闭式问题的缺点是①由于封闭式 问题已为回答者提供了可供选择的答案,所以实际上也就限制了回答者回答的范围 和回答的方式;②回答者在回答中的偏误难以发现。优点是:①回答者填写问卷十 分方便,对文字表达能力也无特殊的要求;②封闭式问题所得的资料十分集中,而 且特别便于进行统计处理和定量分析。 总体来讲,您的健康状况是 : 1)非常好 2)很好 3)好 4)一般 5)差 编码和其他资料:所谓编码就是赋予每一个问题及其答案一个数字作为它的代 码,便于计算机处理,常在每项数据后留出编码用方框,以便于编码输入。除了编 码以外,有些问卷还需要在封面上写上访问员姓名、问卷发放及回收日期、审核员 姓名、被调查者居住地等有关资料等等。 五、资料的整理与分析 1 检查资料的完整准确性,补缺、补漏,删除重复,纠正错误 2 对疾病或某健康状态按规定的标准归类核实 3 按不同空间、时间、人群描述分布特征和差异,进行显著性检验 4 按是否暴露研究因素进行分组作有对照组的比较分析 结果解释 一般先应表明样本的代表性,应答率等情况。然后要估计分析调查中有无偏倚 及其来源、大小、方向和调整方法。 1.若调查的目的是为了了解疾病的分布,可根据“三间” 分布特征的结果, 结合有关因素解释疾病的分布特点。 2.若现况调查的目的是提供病因线索,可将描述性资料进行对比分析,寻找规 律,为进一步进行分析性研究建立病因假设提供依据。 六、偏倚及其控制

1偏倚定义:从研究设计、实施、到数据处理和分析的各个环节中产生的系统误差以及结果解释、推论中的片面性,导致研究结果与真实值之间出现倾向性的差异,从而错误地描述暴露与疾病之间的联系,称之为偏倚2产生原因:a主观选择研究对象、任意变换抽样方法无应答偏倚的b调查对象不合作或因种种原因拒绝参加C调查到的对象均为幸存者,无法调查死亡者控制d回答不准确或回忆不清、调查偏倚、测量误差3类型:选择偏倚:选择性偏倚、无应答偏倚、幸存者偏倚信息偏倚:回忆偏倚、报告偏倚、测量偏倚4偏倚的控制:①严格遵照抽样方法要求,确保随机化原则②提高研究对象的依从性和受检率③正确选择测量工具和检测方法④培训调查员,统一标准和认识做好资料的复查复核工作③选择正确的统计分析方法,辨析混杂因素七、研究的优点与局限性1优点:(1)常用抽样调查,结果有较强推广意义(2)有来自同一群体的自然形成的同期对照组,结果具有可比性(3)可同时观察多种因素2局限性:(1)难以确定先因后果的时相关系(2)不能获得发病率资料(3)研究对象可能处于临床前期而被误定为正常人【本讲课程的小结】今天我们主要讲了描述性研究的现况研究的概念、用途,设计:包括样本量的估计,抽样的方法,调查表设计的内容及常见的偏倚。【本讲课程的作业】1.要掌握某一人群糖尿病的基本情况,请问应作什么调查?分析什么指标?2.现况研究的结果能否获得有关因果关系的结论,为什么?7
7 1 偏倚定义:从研究设计、实施、到数据处理和分析的各个环节中产生的系统误差, 以及结果解释、推论中的片面性,导致研究结果与真实值之间出现倾向性的差异, 从而错误地描述暴露与疾病之间的联系,称之为偏倚 2 产生原因:a 主观选择研究对象、任意变换抽样方法 b 调查对象不合作或因种种原因拒绝参加 c 调查到的对象均为幸存者,无法调查死亡者 d 回答不准确或回忆不清、调查偏倚、测量误差 3 类型: 选择偏倚:选择性偏倚、无应答偏倚、幸存者偏倚 信息偏倚:回忆偏倚、报告偏倚、测量偏倚 4 偏倚的控制: ①严格遵照抽样方法要求,确保随机化原则 ②提高研究对象的依从性和受检率 ③正确选择测量工具和检测方法 ④培训调查员,统一标准和认识 ⑤做好资料的复查复核工作 ⑥选择正确的统计分析方法,辨析混杂因素 七、研究的优点与局限性 1 优点: (1)常用抽样调查,结果有较强推广意义 (2)有来自同一群体的自然形成的同期对照组,结果具有可比性 (3)可同时观察多种因素 2 局限性: (1)难以确定先因后果的时相关系 (2)不能获得发病率资料 (3)研究对象可能处于临床前期而被误定为正常人 无应答偏倚的 控制 【本讲课程的小结】 今天我们主要讲了描述性研究的现况研究的概念、用途,设计:包括样本量的 估计,抽样的方法,调查表设计的内容及常见的偏倚。 【本讲课程的作业】 1.要掌握某一人群糖尿病的基本情况,请问应作什么调查?分析什么指标? 2.现况研究的结果能否获得有关因果关系的结论,为什么?