安徽医科大学：《流行病学》课程教学资源（教案讲义，第五版）队列研究.doc_大学文库

图1队列研究原理示意图 (耿贯一,1998,略加修改) 从上述定义可以看出,队列研究的基本思路是:如果某因素是某病的危险因素,那么暴露于该因素的人群经过一定时间后,其发病的比例一定高于未暴露人群,且暴露于该因素的机会越多则发病风险越髙。反之,如果该因素不是危险因素,那么暴露与非暴露人群的发病率无差异或差异无统计意义。这里的暴露是指研究对象接触过某种欲研究的因素或具有某种特征和行为, 比如工作场所具有某种有害毒物、吸烟、饮酒等。而队列则是指具有该暴露的组人群,队列可以是固定的,即人群在相同时间进入队列并对其随访到观察期结束;也可以是动态的,即研究开始后不断有人加入或退出。所谓危险因素泛指能导致疾病的发生增加的研究因素。 (二)队列研究的特点 1.在时序上是由前向后的,属于前瞻性研究。队列研究在疾病发生前开始进行,要往后随访一段时间才能发现病例。 2.属于观察性对比研究。暴露与否是客观、自然存在于研究人群的,而不是人为确定的,这一点可以与实验性研究相区别 3.研究对象按暴露与否进行分组,而不是按是否发病进行分组的,这一点与病例对照研究正好相反;也不是随机分组的,这与实验性研究不同 4.从病因链的角度来看,队列研究是从“因”到“果”的研究,在病因推断上合乎逻辑推理的顺序,其结果的可靠性强。 (三)队列研究的类型根据研究对象进入队列的时间及资料获取的方式不同,可以将队列研究分为三种类型。 1.前瞻性队列研究( prospective cohort study)研究对象的确定与分组是根据硏究开始时的实际情况,如是否暴露来确定,研究的结局需随访观察一段时间才能得到,这种设计叫前瞻队列硏究。优点:可信度高、偏倚少。缺点:费时、费人力、物力、财力。 2.历史性队列研究( historical cohort study)研究工作是现在开始的, 而研究对象是过去某个时间进入队列的。其特点是追溯到过去某时期,决定人群对某因素的暴露史,然后追査至现在的发病或死亡情况。由于研究结局在硏究开始时已经发生,然后追溯到过去某时期,其性质是回顾性的,故这种设计又叫回顾性队列研究( retrospective cohort study)。优点:省时、省人力物力。缺

2 d 图 1 队列研究原理示意图（耿贯一，1998，略加修改）从上述定义可以看出，队列研究的基本思路是：如果某因素是某病的危险因素，那么暴露于该因素的人群经过一定时间后，其发病的比例一定高于未暴露人群，且暴露于该因素的机会越多则发病风险越高。反之，如果该因素不是危险因素，那么暴露与非暴露人群的发病率无差异或差异无统计意义。这里的暴露是指研究对象接触过某种欲研究的因素或具有某种特征和行为，比如工作场所具有某种有害毒物、吸烟、饮酒等。而队列则是指具有该暴露的一组人群，队列可以是固定的，即人群在相同时间进入队列并对其随访到观察期结束；也可以是动态的，即研究开始后不断有人加入或退出。所谓危险因素泛指能导致疾病的发生增加的研究因素。（二）队列研究的特点 1. 在时序上是由前向后的，属于前瞻性研究。队列研究在疾病发生前开始进行，要往后随访一段时间才能发现病例。 2. 属于观察性对比研究。暴露与否是客观、自然存在于研究人群的，而不是人为确定的，这一点可以与实验性研究相区别。 3. 研究对象按暴露与否进行分组，而不是按是否发病进行分组的，这一点与病例对照研究正好相反；也不是随机分组的，这与实验性研究不同。 4. 从病因链的角度来看，队列研究是从“因”到“果”的研究，在病因推断上合乎逻辑推理的顺序，其结果的可靠性强。（三）队列研究的类型根据研究对象进入队列的时间及资料获取的方式不同，可以将队列研究分为三种类型。 1.前瞻性队列研究（prospective cohort study）研究对象的确定与分组是根据研究开始时的实际情况，如是否暴露来确定，研究的结局需随访观察一段时间才能得到，这种设计叫前瞻队列研究。优点：可信度高、偏倚少。缺点：费时、费人力、物力、财力。 2.历史性队列研究（historical cohort study）研究工作是现在开始的，而研究对象是过去某个时间进入队列的。其特点是追溯到过去某时期，决定人群对某因素的暴露史，然后追查至现在的发病或死亡情况。由于研究结局在研究开始时已经发生，然后追溯到过去某时期，其性质是回顾性的，故这种设计又叫回顾性队列研究（retrospective cohort study）。优点：省时、省人力物力。缺

点:历史档案不一定符合设计要求,故适用范围较窄。 3.双向性队列研究( ambispective cohort study)根据历史档案确定暴露与否,根据将来的情况确定结局,故这种设计又叫混合性队列研究。该方法不但具有历史性队列研究的优点,还弥补了其不足。 (四)队列研究的应用范围 1.验证病因假设确定某个暴露与疾病的因果联系及其联系强度,验证病因假设。由于它是一种从“因”观“果”的研究方法,符合病因链的实际顺序故在病因学研究上的价值髙于现况研究和病例对照研究,但由于其分组不是随机的,故其效力不如实验性研究。 2.考核疾病的防治效果如考核疫苗预防效果,可以将接种过疫苗的人群作为一组,未接种人群作为另一组,比较两组发病率差异。 3.观察暴露因素与多种疾病相关结局的关系队列硏究不但可以硏究暴露因素与疾病发生与否的关系,还可以了解暴露因素对疾病的发展、转归、预后的影响。 4.研究疾病的自然史及其长期变动疾病在人群中的发生、发展到结局的全过程称为疾病的自然史。通过队列研究的随访可以观察到疾病的整个自然史, 可以弥补临床观察的不足。第二节研究实例二十世纪上半叶英国发现肺癌的死亡率与支气管炎、肺结核以及其他癌症不同,呈迅速上升趋势,而且与烟草的消耗量有平行关系,这种分布状况使卫生工作者考虑到肺癌与吸烟之间是否存在联系。所以,Doll与Hl在1948年开始进行了病例对照研究,发现肺癌患者中吸烟的比例明显高于对照组,吸烟有可能是肺癌的病因。在此基础上,他们从1951年开始,又进行了队列研究以证实此病因假设。他们选择英国医生作为研究对象,发函调查了59600名医生的一般情况与吸烟状况,来自40701名医生的调査表可供分析。按吸烟与否分成暴露组与非暴露组,然后进行随访,详细记录发病与死亡情况,并对收集到的资料进行多方核对。此研究持续了几十年,从1964年报告的资料(表1)表明,35岁及以上年龄组,每年不吸烟者肺癌死亡率为0.07‰,而每日吸烟1-14支者肺癌死亡率为0.57‰,为不吸烟者的8.1倍;15-24支者为1.39‰,为不吸烟者的19.9倍; 25支及以上者为227‰,为不吸烟者的324倍。可见吸烟者患肺癌的危险性远远高于不吸烟者,且呈明显的剂量效应关系

3 点：历史档案不一定符合设计要求，故适用范围较窄。 3. 双向性队列研究（ambispective cohort study）根据历史档案确定暴露与否，根据将来的情况确定结局，故这种设计又叫混合性队列研究。该方法不但具有历史性队列研究的优点，还弥补了其不足。（四）队列研究的应用范围 1.验证病因假设确定某个暴露与疾病的因果联系及其联系强度，验证病因假设。由于它是一种从“因”观“果”的研究方法，符合病因链的实际顺序，故在病因学研究上的价值高于现况研究和病例对照研究，但由于其分组不是随机的，故其效力不如实验性研究。 2.考核疾病的防治效果如考核疫苗预防效果，可以将接种过疫苗的人群作为一组，未接种人群作为另一组，比较两组发病率差异。 3.观察暴露因素与多种疾病相关结局的关系队列研究不但可以研究暴露因素与疾病发生与否的关系，还可以了解暴露因素对疾病的发展、转归、预后的影响。 4.研究疾病的自然史及其长期变动疾病在人群中的发生、发展到结局的全过程称为疾病的自然史。通过队列研究的随访可以观察到疾病的整个自然史，可以弥补临床观察的不足。第二节研究实例二十世纪上半叶英国发现肺癌的死亡率与支气管炎、肺结核以及其他癌症不同，呈迅速上升趋势，而且与烟草的消耗量有平行关系，这种分布状况使卫生工作者考虑到肺癌与吸烟之间是否存在联系。所以，Doll 与 Hill 在 1948 年开始进行了病例对照研究，发现肺癌患者中吸烟的比例明显高于对照组，吸烟有可能是肺癌的病因。在此基础上，他们从 1951 年开始，又进行了队列研究以证实此病因假设。他们选择英国医生作为研究对象，发函调查了 59600 名医生的一般情况与吸烟状况，来自 40701 名医生的调查表可供分析。按吸烟与否分成暴露组与非暴露组，然后进行随访，详细记录发病与死亡情况，并对收集到的资料进行多方核对。此研究持续了几十年，从 1964 年报告的资料(表 1)表明，35 岁及以上年龄组，每年不吸烟者肺癌死亡率为 0.07‰，而每日吸烟 1~14 支者肺癌死亡率为 0.57‰，为不吸烟者的 8.1 倍；15~24 支者为 1.39‰ ，为不吸烟者的 19.9 倍； 25 支及以上者为 2.27‰，为不吸烟者的 32.4 倍。可见吸烟者患肺癌的危险性远远高于不吸烟者，且呈明显的剂量效应关系

第四节队列研究的实施 (一)确定研究目的队列研究首先要确定本次研究的目的,即根据一些病因线索提出病因假设, 然后验证假设是否科学、正确。这直接关系到研究的成败,故一定要有足够的科学依据,可以先通过现况研究或病例对照研究结果初步验证假设,然后在此基础上提出队列研究的检验假设。 (二)确定研究因素及研究因素的定义一般把导致疾病事件增加的暴露因素称为危险因素或致病因素,把导致疾病事件降低的暴露因素称为保护因素。暴露既可以是致病因素或保护因素还可是另一个暴露产生的后果,即另一种疾病。例如,高血压是冠心病的暴露因素,但它可能是其它暴露因素产生的结果,这要视研究目的和研究者对暴露因素的认识水平而定。有了明确的硏究因素后,接下来就须给研究因素一个明确的定义,如果我们确定的暴露因素为吸烟,那么就必须事先明确规定何为吸烟?常用的吸烟定义为平均每天吸烟量达到1支或以上、时间持续1年以上者,也有人将1年内吸烟总量达到180支以上者定义为吸烟。究竟如何定义暴露因素,可以通过査阅文献或请教有关专家,同时结合自己的研究目的、才力和人力限度和对研究结果的精确度要求等因素,综合考虑后对暴露因素进行定义另外,要尽可能对暴露因素进行定量,并且要考虑到暴露的时间长短以及暴露是否连续。队列研究除了要确定主要暴露因素外,同时应收集其他次要暴露因素资料以便更好地说明研究结果。但一次硏究中暴露因素的数量也不能太多,否则影响研究的精确程度。 (三)选择研究对象 1.暴露人群的选择可供选择的暴露人群有 (1)特殊暴露人群或职业人群:这部分人群暴露史明确,发病率也髙,故易得出结果。特殊暴露人群指对某因素有较髙的暴露水平的人群。如果暴露因素与疾病有关,则高度暴露的人群中疾病的发病率或死亡率就可能髙于其他人群, 这将有利于探索暴露与疾病之间的联系。所以在硏究暴露与疾病的关联时,常常首先选择特殊暴露人群。例如选择遭受过原子弹爆炸危害的人群或接受过放射线治疗的人群来研究放射线辐射与白血病的关系。某些职业中常存在特殊暴露因素,它可能与某些疾病有关,所以某些职业人群也是特殊暴露人群。例如选择染料厂工人硏究联苯胺致膀脱癌的作用,选择石棉作业工人研究石棉与肺癌的关系等。 (2)一般人群:这种人群的代表性最好,得到的结果外推性好,但这部分

5 第四节队列研究的实施（一）确定研究目的队列研究首先要确定本次研究的目的，即根据一些病因线索提出病因假设，然后验证假设是否科学、正确。这直接关系到研究的成败，故一定要有足够的科学依据，可以先通过现况研究或病例对照研究结果初步验证假设，然后在此基础上提出队列研究的检验假设。（二）确定研究因素及研究因素的定义一般把导致疾病事件增加的暴露因素称为危险因素或致病因素，把导致疾病事件降低的暴露因素称为保护因素。暴露既可以是致病因素或保护因素还可是另一个暴露产生的后果，即另一种疾病。例如，高血压是冠心病的暴露因素，但它可能是其它暴露因素产生的结果，这要视研究目的和研究者对暴露因素的认识水平而定。有了明确的研究因素后，接下来就须给研究因素一个明确的定义，如果我们确定的暴露因素为吸烟，那么就必须事先明确规定何为吸烟？常用的吸烟定义为平均每天吸烟量达到 1 支或以上、时间持续 1 年以上者，也有人将 1 年内吸烟总量达到 180 支以上者定义为吸烟。究竟如何定义暴露因素，可以通过查阅文献或请教有关专家，同时结合自己的研究目的、才力和人力限度和对研究结果的精确度要求等因素，综合考虑后对暴露因素进行定义。另外，要尽可能对暴露因素进行定量，并且要考虑到暴露的时间长短以及暴露是否连续。队列研究除了要确定主要暴露因素外，同时应收集其他次要暴露因素资料，以便更好地说明研究结果。但一次研究中暴露因素的数量也不能太多，否则影响研究的精确程度。（三）选择研究对象 1.暴露人群的选择可供选择的暴露人群有（1）特殊暴露人群或职业人群：这部分人群暴露史明确，发病率也高，故易得出结果。特殊暴露人群指对某因素有较高的暴露水平的人群。如果暴露因素与疾病有关，则高度暴露的人群中疾病的发病率或死亡率就可能高于其他人群，这将有利于探索暴露与疾病之间的联系。所以在研究暴露与疾病的关联时，常常首先选择特殊暴露人群。例如选择遭受过原子弹爆炸危害的人群或接受过放射线治疗的人群来研究放射线辐射与白血病的关系。某些职业中常存在特殊暴露因素，它可能与某些疾病有关，所以某些职业人群也是特殊暴露人群。例如选择染料厂工人研究联苯胺致膀脱癌的作用，选择石棉作业工人研究石棉与肺癌的关系等。（2）一般人群：这种人群的代表性最好，得到的结果外推性好，但这部分

人群发病率低,所得的RR值较小,实施较困难。此时选择一般人群作研究对象时要考虑两点:①所研究的因素与疾病是人群中常见的;②研究需要观察一般人群的发病情况,特别是想要观察环境因素与疾病的关系时,无特殊暴露人群或不需要特殊暴露人群。 (3)有组织的人群:这部分人群易于联系,应答率较高,代表性较好,且易控制混杂。比如由医生协会登记注册的执业医师 2对照人群的选择正确选择对照人群直接影响着队列硏究的真实性。选择对照组的目的是进行比较,因此要注意与暴露人群的可比性。即对照人群除未暴露于所研究的因素外,其他因素如年龄、性别、职业等应尽可能与暴露人群相 (1)内对照:选定一群研究对象后,有暴露史的作为暴露组,余下的作为对照,这就叫内对照。队列研究应尽量选用内对照,因为这是最理想的对照,除暴露因素外,它与暴露人群的可比性好。同时选用内对照较方便可行。特别是当暴露人群来自于一般人群或有组织的人群时常用内对照。 (2)外对照:暴露人群选定后,从其他人群中选择对照人群,这叫外对照, 般当暴露人群为职业暴露或特殊暴露人群时常用外对照。如以放射科医生作为研究放射线致病的暴露人群,则可以不接触射线或接触射线极少的五官科医生为外对照。 (3)不另设对照:也叫一般人群对照,就是将结果与一般人群的发病率或死亡率进行比较,其优点是一般人群的发病率或死亡率容易得到且叫稳定,但其资料比较粗糙、可能缺乏要比较的项目。 (四)确定样本量队列研究的样本量由以下几个因素决定: 1.对照人群的估计发病率Po 2.暴露人群的估计发病率P1; 3.所要求的显著性水平a,通常a取0.05或001 4.把握度( power)即检验效力1-β,通常β取O.10 计算样本量的公式如下: n=2pq(Ua+UB)/(P,-Po) 上式中P为对照人群估计发病率,p为暴露组估计发病率p=B+P,可=1-p 2 上述公式计算的为暴露组样本量,而对照组的样本量应该大于或等于暴露组。此外由于队列研究的随访时间比较长,失访在所难免,故在确定样本量时要考虑到失访率。一般按10%估计失访率,故在原估计样本量的基础上加10%作为实际样本量。例1.用队列研究观察放射线暴露与白血病的关系,已知一般人群的白血病 6

6 人群发病率低，所得的 RR 值较小，实施较困难。此时选择一般人群作研究对象时要考虑两点：①所研究的因素与疾病是人群中常见的；②研究需要观察一般人群的发病情况，特别是想要观察环境因素与疾病的关系时，无特殊暴露人群或不需要特殊暴露人群。（3）有组织的人群：这部分人群易于联系，应答率较高，代表性较好，且易控制混杂。比如由医生协会登记注册的执业医师。 2.对照人群的选择正确选择对照人群直接影响着队列研究的真实性。选择对照组的目的是进行比较，因此要注意与暴露人群的可比性。即对照人群除未暴露于所研究的因素外，其他因素如年龄、性别、职业等应尽可能与暴露人群相同。（1）内对照：选定一群研究对象后，有暴露史的作为暴露组，余下的作为对照，这就叫内对照。队列研究应尽量选用内对照，因为这是最理想的对照，除暴露因素外，它与暴露人群的可比性好。同时选用内对照较方便可行。特别是当暴露人群来自于一般人群或有组织的人群时常用内对照。（2）外对照：暴露人群选定后，从其他人群中选择对照人群，这叫外对照，一般当暴露人群为职业暴露或特殊暴露人群时常用外对照。如以放射科医生作为研究放射线致病的暴露人群，则可以不接触射线或接触射线极少的五官科医生为外对照。（3）不另设对照：也叫一般人群对照，就是将结果与一般人群的发病率或死亡率进行比较，其优点是一般人群的发病率或死亡率容易得到且叫稳定，但其资料比较粗糙、可能缺乏要比较的项目。（四）确定样本量队列研究的样本量由以下几个因素决定： 1．对照人群的估计发病率 P0； 2．暴露人群的估计发病率 P1； 3．所要求的显著性水平α，通常α取 0.05 或 0.01； 4．把握度(power)即检验效力 1-β,通常β取 0.10。计算样本量的公式如下： 2 1 0 n = 2pq(U +U )/( p − p )   q p p p p p p = − + = , 1 2 , , 1 0 上式中 0为对照人群估计发病率 1为暴露组估计发病率，上述公式计算的为暴露组样本量，而对照组的样本量应该大于或等于暴露组。此外由于队列研究的随访时间比较长，失访在所难免，故在确定样本量时要考虑到失访率。一般按 10%估计失访率，故在原估计样本量的基础上加 10%作为实际样本量。例 1. 用队列研究观察放射线暴露与白血病的关系，已知一般人群的白血病

发病率为10/10万,有放射暴露的人白血病发病率为100/10万,当a取0.05,B 取0.1时,样本量该取多大? 即P0=0.0001,P1=0001,U和U分别为1.96和1.28,将其代入上式得: n=142658≈14266人估计失访率为10%,则实际样本量为14266×(1+0.1)=156926,即暴露组至少为15693人,而非暴露组则应大于或等于该样本量 (五)确定结局结局变量指观察过程中预期要出现的结果事件,如研究吸烟与银屑病的关系,则银屑病为结局变量。结局变量应有明确而统一的标准,最好选用国际通用的诊断标准,以便不同地区的研究结果进行比较 (六)随访结局变量须通过随访获得,随访时要注意以下问题 1.随访期对每个研究对象开始随访的时间以及随访时间的长短直接关系到队列研究的功效,因此开始随访和终止随访日期均应明确。确定随访期应了解疾病的诱导期和潜伏期,并据之做出假设。诱导期指病因开始作用至疾病发生的一段时间,在此期间充分病因逐步完成。潜伏期指从疾病发生到临床上被发现的时间间隔。理论上随访应在疾病的最短诱导期和潜伏期之后进行,最好不要在暴露一发生就开始随访,但是实际实施中往往难以做到。因为许多疾病,特别是慢性病的诱导期和潜伏期不是很清楚,如果暴露一发生就随访,则假设最短诱导期和潜伏期均为零。这种极端的假设往往是不正确的。例如, 随访原子弹爆炸后幸存者的肿瘤危险性,可在爆炸数月或数年后开始随访,随访时间长短,取决于肿瘤的特性。随访时间的长短取决于暴露与疾病的联系强度以及疾病的潜伏期长短。暴露因素作用越强,随访时间越短;潜伏期越长,随访时间也越长 2研究对象的随访保证随访成功是队列研究成功的关键之一,因为研究对象失访过多,研究的真实性就会受到怀疑。随访的目的是:①确定研究对象是否仍处于观察之中,即确定分母信息;②确定研究人群中的结局事件,即确定分子信息③进一步收集有关暴露和混杂因素的资料,以备分析时用 3.随访的方法①利用记录或档案:利用常规登记的人群和疾病资料来随访研究对象。②进行特殊安排的随访:访问研究对象或其他能够提供信息的人,定期家庭访视、电话询问或通信等。对研究对象进行测定或检查,如做体格检査或测定他们的血压、血脂、血糖等。③有时需对环境做调査与检测,以确证一项暴露。如对水质进行化验,测定环境污染、食物成分等。须注意在测量结局时要用统一的标准,统一的仪器、试剂、测量员等,以防测量偏倚。 4观察的终点与终止时间观察终点 (end-point)指观察对象出现了预期的结果,至此就不再继续观察该对象了。观察的终止时间是指整个研究工作可以得出

7 发病率为 10/10 万，有放射暴露的人白血病发病率为 100/10 万，当α取 0.05，β 取 0.1 时，样本量该取多大？即 P0=0.0001，P1=0.001， Uα和 Uβ分别为 1.96 和 1.28，将其代入上式得： n = 14265.8≈14266 人估计失访率为 10%，则实际样本量为 14266×（1+0.1）=15692.6，即暴露组至少为 15693 人，而非暴露组则应大于或等于该样本量。（五）确定结局结局变量指观察过程中预期要出现的结果事件，如研究吸烟与银屑病的关系，则银屑病为结局变量。结局变量应有明确而统一的标准，最好选用国际通用的诊断标准，以便不同地区的研究结果进行比较。（六）随访结局变量须通过随访获得，随访时要注意以下问题。 1. 随访期对每个研究对象开始随访的时间以及随访时间的长短直接关系到队列研究的功效，因此开始随访和终止随访日期均应明确。确定随访期应了解疾病的诱导期和潜伏期，并据之做出假设。诱导期指病因开始作用至疾病发生的一段时间，在此期间充分病因逐步完成。潜伏期指从疾病发生到临床上被发现的时间间隔。理论上随访应在疾病的最短诱导期和潜伏期之后进行，最好不要在暴露一发生就开始随访，但是实际实施中往往难以做到。因为许多疾病，特别是慢性病的诱导期和潜伏期不是很清楚，如果暴露一发生就随访，则假设最短诱导期和潜伏期均为零。这种极端的假设往往是不正确的。例如，随访原子弹爆炸后幸存者的肿瘤危险性，可在爆炸数月或数年后开始随访，随访时间长短，取决于肿瘤的特性。随访时间的长短取决于暴露与疾病的联系强度以及疾病的潜伏期长短。暴露因素作用越强，随访时间越短；潜伏期越长，随访时间也越长。 2.研究对象的随访保证随访成功是队列研究成功的关键之一，因为研究对象失访过多，研究的真实性就会受到怀疑。随访的目的是：①确定研究对象是否仍处于观察之中，即确定分母信息；②确定研究人群中的结局事件，即确定分子信息;③进一步收集有关暴露和混杂因素的资料，以备分析时用。 3.随访的方法 ①利用记录或档案：利用常规登记的人群和疾病资料来随访研究对象。②进行特殊安排的随访：访问研究对象或其他能够提供信息的人，定期家庭访视、电话询问或通信等。对研究对象进行测定或检查，如做体格检查或测定他们的血压、血脂、血糖等。③有时需对环境做调查与检测，以确证一项暴露。如对水质进行化验，测定环境污染、食物成分等。须注意在测量结局时要用统一的标准，统一的仪器、试剂、测量员等，以防测量偏倚。 4.观察的终点与终止时间观察终点(end-point)指观察对象出现了预期的结果，至此就不再继续观察该对象了。观察的终止时间是指整个研究工作可以得出

结论的时间,也可说此时整个研究工作到达了终点,应以暴露因素作用于人体至产生结局的一般潜伏期作为确定随访期限的依据。观察终点常为规定的疾病的发生或死亡。如规定发生冠心病或肺癌死亡为终点,则患了其它病不应视为已达观察终点,如得了糖尿病还应继续随访。但是如果研究对象在未到观察终点之前死于其它疾病,尽管不能对其继续随访,仍不能按到达随访终点对待,这是也是失访的一种。这种认识至关重要,它直接影响资料的分析。 5调査员的培训应当由经过严格培训和考核合格的调查员进行随访。调查员的工作作风、科学态度,以及调査的技巧和技术,直接影响到调査结果的真实性和可靠性。观察终点需要有经验的临床医师来判断。研究者不一定亲自参加随访,因为研究者易于带来主观的偏性。当用盲法获取信息时,更不能由研究者自己进行追踪。第五节队列研究的资料分析队列研究结束后,也应对所获得的资料进行整理,然后进行描述性分析,将研究对象的组成、随访的经过、结局的发生和失访率等情况作出描述。再按年龄、性别、时间分别计算各研究组在随访期的疾病发病率和死亡率,然后进行比较 (一)率的计算队列研究可以计算多种率,特别是能计算发病率,这是病例对照研究不可比拟的优点,因为病例对照研究无法得到病例所来自的人群的基准人口数,故无法计算发病率、患病率、死亡率等指标 1累积发病率( cumulative incidence,CI)某一固定人群在一定时期内某病新发生例数与时期开始总人数之比,也就是一般所说的发病率。随访期越长, 则病例发生越多,所以CI表示发病率的累积影响。CI又是平均危险度的一个指标,也就是一个人在特定时期内发生该病的概率 (1)累积发病率的适用条件:样本量大,人口稳定,资料比较整齐。 (2)计算公式,设观察期限为n年 n年的某病累计发病率=-n年内的新发病例数 n年内的平均暴露人口数 ×1000‰(100000710万) 暴露组与非暴露组间率的差异要进行统计学检验。当发病率髙时,可用u 检验。如果发病率比较低,则改用二项分布或泊松分布检验。检验方法査阅有关统计学书籍。 2发病密度( incidence density,ID)发病密度是一定时期内的平均发病率

8 结论的时间，也可说此时整个研究工作到达了终点，应以暴露因素作用于人体至产生结局的一般潜伏期作为确定随访期限的依据。观察终点常为规定的疾病的发生或死亡。如规定发生冠心病或肺癌死亡为终点，则患了其它病不应视为已达观察终点，如得了糖尿病还应继续随访。但是如果研究对象在未到观察终点之前死于其它疾病，尽管不能对其继续随访，仍不能按到达随访终点对待，这是也是失访的一种。这种认识至关重要，它直接影响资料的分析。 5.调查员的培训应当由经过严格培训和考核合格的调查员进行随访。调查员的工作作风、科学态度，以及调查的技巧和技术，直接影响到调查结果的真实性和可靠性。观察终点需要有经验的临床医师来判断。研究者不一定亲自参加随访，因为研究者易于带来主观的偏性。当用盲法获取信息时，更不能由研究者自己进行追踪。第五节队列研究的资料分析队列研究结束后，也应对所获得的资料进行整理，然后进行描述性分析，将研究对象的组成、随访的经过、结局的发生和失访率等情况作出描述。再按年龄、性别、时间分别计算各研究组在随访期的疾病发病率和死亡率，然后进行比较。（一）率的计算队列研究可以计算多种率，特别是能计算发病率，这是病例对照研究不可比拟的优点，因为病例对照研究无法得到病例所来自的人群的基准人口数，故无法计算发病率、患病率、死亡率等指标。 1.累积发病率（cumulative incidence， CI）某一固定人群在一定时期内某病新发生例数与时期开始总人数之比，也就是一般所说的发病率。随访期越长，则病例发生越多，所以 CI 表示发病率的累积影响。CI 又是平均危险度的一个指标，也就是一个人在特定时期内发生该病的概率。（1）累积发病率的适用条件：样本量大，人口稳定，资料比较整齐。（2）计算公式，设观察期限为 n 年。 1000 (100,000 /10 ) 0 0 0 万年内的平均暴露人口数年内的新发病例数年的某病累计发病率 =  n n n 暴露组与非暴露组间率的差异要进行统计学检验。当发病率高时，可用 u 检验。如果发病率比较低，则改用二项分布或泊松分布检验。检验方法查阅有关统计学书籍。 2.发病密度（incidence density，ID）发病密度是一定时期内的平均发病率

9 其分子仍是一个人群在期内新发生的例数，分母则是该人群的每一成员所提供的人时的总和。所谓人时（person-time，PT）是观察人数乘以随访单位时间的积。发病密度既说明了该人群发生的新病例数，又说明该人群的大小和发生这些例数所经历的时间。时间单位常用年，故又称人年数（person-years）。一定的人时（人年）数可来自不同的人数与不同的观察时间，例如 100 人年可来自 100 人观察一年，或 50 人观察 2 年，或 200 人观察 0.5 年。（1）发病密度适用条件：没有限制，一般队列研究均可用，但因其计算比较复杂，故多在人口波动较大、样本量小的情况下，不能用累积发病率时应用发病密度。（2）计算公式：万观察期内的观察对象人年数某人群在观察期内的发病数发病密度= 100,000 /10 人年数的计算请参见有关统计书。 3.标化比（1）适用条件：样本量小，发病率或死亡率低（2）常用指标及其计算公式：标化比中最常用的指标为标化死亡比（standardized mortality ratio， SMR），它是以全人口死亡率作标准，算出观察人群的理论死亡数，再用实际死亡数与之比较而得出，暴露人口数全人口死亡率研究人群实际死亡数该人群理论死亡数研究人群实际死亡数  SMR = = 如果 SMR>1，则暴露人群的死亡率大于一般人群。例 2. 某工厂有 32745 人，某年死于肺结核的为 12 人，而一般人群的肺结核死亡专率为 9.8/10 万，则 SMR=12/（32745×9.8/100000）=12/3.209=3.74 即该工厂结核病的死亡危险是一般人群的 3.74 倍。（二）暴露与疾病的关联分析首先将观察结果列成如表 2，然后进行分析。表 2 队列研究资料归纳表组别病例非病例合计发病率暴露组 a b a+b=n1 Ie=a/n1 非暴露组 c d c+d=n0 Io=a/n0 合计 a+c=m1 b+d=m0 n 1.相对危险度或率比

10 （1）定义：相对危险度（relatire risk，RR）或率比（rate ratio）是指暴露组发病率与非暴露组的发病率之比，它反映了暴露与疾病的关联强度。（2）计算公式： /( ) /( ) c c d a a b I I RR o e + + = = （3）RR 的意义：RR 说明暴露使个体发病的危险比不暴露高多少倍，或者说暴露组的发病危险是非暴露组的多少倍。（4）RR 的 95%可信区间： 2 1 1.96 ,   RRU RRL = RR 1 0 1 0 2 2 . . . ( ) . m m n n ad −bc n  = RR 的 95%可信区间的另一算法为： 95% exp[ln 1.96( )] 1/ 1/ RR RR SD SD a b  = + 的可信区间为标准差（），相对危险度（RR）无单位，比值范围在 0 至∞之间。RR=1，表明暴露与疾病无联系；RR1 时，表明两者存在正联系（提示暴露是危险因子）。比值越大，联系越强。实际上，0 与∞只是理论上存在的值，恰恰等于 1 也不多见。极强的联系既无须用流行病学研究去检测，极弱的联系也不大可能用非实验性的流行病学观察法检测出来。 2.归因危险度或率差（1）定义：归因危险度（attributable risk，AR）或率差（rate difference）是指暴露组发病率与非暴露组发病率之差，它反映发病归因于暴露因素的程度。（2）计算公式： 2 1 1.96 / 95% ( 1)   = = − + − + = − = AR CI AR I RR c d c a b a AR I I e o o 的（3）AR 的意义：AR 表示暴露可使人群比未暴露时增加的超额发病的数量，如果暴露去除，则可使发病率减少多少（AR 的值），因此 AR 在疾病预防中很有意义。 3.归因危险度百分比（AR%）或病因分值（EF） AR%是指暴露人群中由暴露因素引起的发病在所有发病中所占的百分比。 100% 1 % 100%  −  = − = RR RR I I I AR e e o 当 AR%>75%时，即可认为按到了主要病因。 4.人群归因危险度（PAR）与人群归因危险度百分比（PAR%）（1）PAR：又称病因分值（etiologic fraction， EF）表示在全人群中，由