只▣ 第四章 定性据的统计述 m(时论、等根.作业)》 氨母基平条 大学精品球想用琳+教学我派一(、✉m) ) t2错线+A4” 南对放海地对数畅兵集:玉有青克
第四章 定性数据的统计描述 预防医学系 2 课程设置 课时: 理论课: 22学时 实习课: 10学时 联系方式:预防医学系卫生统计学教研室 Tel.: 2057153 Baidu贴吧:yfyxx (讨论、答疑、作业) http://tieba.baidu.com/f?kw=yfyxx# 大学精品课程网站→教学资源→(ppt、wmv) http://eol.shzu.edu.cn/eol/jpk/course/layout/default/index.jsp?courseId=12042 小复习: 定量数据、定性数据 定量数据的统计描述 3 例: 1. 某地某年为了解该地区居民饮用含氟过高水人 群 氟斑牙情况,调查了甲区560人,乙区1200人。 其中,甲区患病人数为106人,乙区为122人。 2. 甲乙两地农村钩虫感染情况调查,甲地钩虫感染 150人,乙地钩虫感染100人。 定性数据:绝对数 4 绝对数 在调查研究中所获得的某种性质类别一系列原始计数 数据。反映事物的绝对水平或实际水平。 仅由绝对数还不能进行更深入的分析比较。 例1 患病情况 乙区比甲区多(122-106)=16人 能否说乙区比甲区患病情况严重? 例2 钩虫感染人数 甲地比乙地多(150-100)=50人 能否肯定甲地比乙地人群钩虫感染程度更为严重? 5 例1 甲区患病率=(106/560)100%=18.93% 乙区患病率=(122/1200)100%=10.17% 甲区患病情况比乙区严重。 例2 已知甲地调查1500人,乙地调查1000人 甲地感染率=150/1500 × 100%=10.0% 乙地感染率=100/1000× 100%=10.0% 两地人群钩虫感染的严重程度是一样的。 6 相对数 两个有关联的数据之比。用以说明事物的相对 关系, 便于对比分析。 相对数与绝对数的关系:互相补充 一、常用相对数 7 8 1、率 率(rate):率表示在一定空间或时间范围内某 现象的发生数与可能发生的总数之比,说明某现 象出现的强度或频度,通常以百分率(%)、千 分率(‰)、万分率(/万)、或十万分率(/ 10万)等来表示。计算公式为: 比例基数 某事物或现象发生的所 有可能数 某事物或现象发生的实 际数 率 比例常数 %,‰,1/万,1/十万 注意: (1)比例基数可根据习惯用法确定,算得的 率保留一、二位整数,如死亡率,自然增长率 等用%,肿瘤死亡率用 1/十万。 (2)计算率时,分母不宜太小。 (3)率不能直接相加。 (4)不受其它指标的影响;各率相互独立, 其之和不为1(如是则属巧合); 9
出 A秋后A线华Aa情eO 体国每远年县屋 喜以样发a 小角明海康果单直昌接 以 7,a4n 际惠量人容最无★横的1032德 对比-女0 行 的
10 例4-1 某单位在2009年有3128名职工,该单位 每年对职工进行体检,在这一年新发生高血压 病人12例,则 12 1000 =3.84 3128 高血压发病率 ‰ ‰ 2.构成比( proportion ) 概念:是指一事物内部某一构成部分在事物整体中所占比重 用以说明某一事物内部各组成部分所占的比重或分布。 公式: 第i个类别的观察单位数 构成比= ×100% k个类别的观察单位数总数 A = ×100% A+B+C+…… 11 注意: (1)构成比的特点是各部分的数值总和为100%。 (2)构成比中某一部分所占比重的增减,相应会 影响其他部分的比重和分布。 (3)构成比只能说明比重和分布大小,不能反映 事物发生的频率或强度。(率与构成比的区别) 12 13 例4-2 某医院某月住院病人数、死亡人数及统计指 标如下表所示。 疾病类型 (1) 病人数 (2) 病死人数 (3) 死亡构成(%) (4) 病死率(‰) (5) 呼吸系统疾病 620 25 23.81 40.32 循环系统疾病 1030 35 33.33 33.98 消化系统疾病 540 20 19.05 37.04 恶性肿瘤 300 25 23.81 83.33 合 计 2490 105 100.00 42.17 表4-1 某月某医疗机构住院病人数及死亡人数统计 14 相对比( relative ratio ):相对比是A、B两个有 关联指标值之比,用以描述两者的对比水平,说 明A是B的若干倍或百分之几,通常用倍数或分数 表示。这两个指标可以是性质相同,如不同时期 的患病人数;也可以是性质不同,如体重与身高 的平方之比(体重指数,BMI)。其计算公式为 100% B A 相对比 15 例如我国2010年人口普查的男性人口数为686852572 ,女性人口数为652872280人,则 即男性人口数是女性的1.052倍。 1.两类别例数之比 1.052 652872280 686852572 男女性别比 = 16 相对危险度( relative risk ,RR): 是流行病学前 瞻性研究中常用的指标,表示在两种不同条件下某 疾病发生的概率之比,反映暴露组发病或死亡的危 险是非暴露组的多少倍,说明疾病与暴露之间关联 强度。其计算公式为 P1为暴露组的发病率;P0非暴露组的发病率。 1 0 P R R P 2.相对危险度 17 例4-3 某地市区非吸烟女性饮酒者和不饮酒者的肺 癌发病资料如下表所示,试计算其相对危险度。 说明该地市区非吸烟女性饮酒者的肺癌发 病率是非吸烟女性不饮酒者的1.15倍。 表4-2 某地市区非吸烟女性饮酒者和不饮酒者的肺癌发病资料 饮酒与否 发病数 观察人年数 发病率(1/10万人年) 是 6 12965.2 46.3 否 265 660291.4 40.1 18 比数比( Odds ratio ,OR) : 常用于流行病学 中病例-对照研究资料,表示病例组和对照组中的 暴露比例与非暴露比例的比值之比,是反映疾病 与暴露之间关联强度的指标。其计算公式为 1 1 0 0 /(1 ) /(1 ) P P OR P P P1为病例组的暴露比例或在暴露状态下的发病率 P0为对照组的暴露比例或在非暴露状态下的发病率 3.比数比
二,虚眉有对款的位会率项 - 票C435身版上山执子线6AA土 前 8 人夏高一通坐钟相业是地中持独弹花华德比平、得鱼中 滋 行57行行不P6个我 每痕化直甚墙的康季摸火 P=MA+++MAyN
19 例4-4 母亲围孕期是否有发热或感冒病史与婴儿 神经血管畸形关系的病例对照研究的资料如下表 所示。试计算母亲围孕期是否有发热或感冒病史 引起婴儿神经血管畸形的比数比。 表4-3 母亲围孕期有否发热或感冒病史与婴儿神经血管畸形关联 病例组中的暴露比例与非暴露比例分别为 对照组的暴露比例与非暴露比例分别为 由OR计算公式可以得出 本例 母亲围孕期是否有发热或感冒病史引起婴儿神经血管畸 形的优势比为3.63倍。 1 a P a c 1 1 c P a c 0 b P b d 0 1 d P b d 1 1 0 0 / (1 ) [ / ( )] / [ / ( )] / (1 ) [ / ( )] / [ / ( )] P P a a c c a c ad OR P P b b d d b d bc 3.63 20 112 40 203 OR Odds ratio 二、应用相对数的注意事项 注意资料的可比性: 研究对象同质、研究方法相同、观察时间相近、地区、 民族、年龄、性别等; 所比较资料内部构成相同; 同地区不同时期资料对比,要注意客观条件有无变化 计算相对数时分母不能太小 观察例数不等的几个率,不能直接相加求平均值 分析时不能以(构成)比代(替)率 讨论例4-15 21 当两组或多组率之间比较,其内部各小组的率明显不同, 各小组观察例数的构成比,如:年龄、性别、工龄、病情 轻重、长短也明显不同时,则不能直接比较两组或多组的 总率,得出结论。 标准化法:两组或多组率进行比较,当内部构成不同时, 为了消除内部构成的差异,需要按统一的“标准” 进行调整,使之具备可比性。 采用统一的标准调整后的率为标准化率(标化率、调整率)。 率的标准化: 22 检查人数 236 375 384 402 1397 病人数 16 27 38 59 140 患病率% 6.78 7.20 9.90 14.68 10.02 检查人数 478 379 235 157 1249 病人数 33 28 24 24 109 患病率% 6.90 7.39 10.21 15.29 8.73 年龄 (岁) 35~ 45~ 55~ 65-78 合计 甲校 乙校 甲乙两校35岁以上知识分子的高血压患病率 甲校各年龄组的高血压患病率均略低于乙校, 但总的患病率甲校明显高于乙校? 问题: 23 年 龄 (岁) (1) 35~ 45~ 55~ 65-80 合计 标准组 人 数 Ni (2) 714 754 619 559 2646 原患病率 Pi (3) 6.78 7.20 9.90 14.68 10.02 预期患病数 NiPi (4)=(2)(3) 48 54 61 82 245 原患病率 Pi (5) 6.90 7.39 10.21 15.29 8.73 预期患病数 NiPi (6)=(2)(5) 49 56 63 85 253 甲校 乙校 直接法计算甲乙两校的高血压患病标化率 甲校高血压患病标化率P’=245/2646=9.26% 乙校高血压患病标化率P’=253/2646=9.56% 乙校高于甲校,与各年龄组的对比结论一致, 解决了未标化前出现的矛盾。 24 25 上例以各层例数的合计作为标准构成,计算得到甲 医院标准化后的总治愈率为 乙医院标准化后的总治愈率为 由上可见,甲医院标准化后的总治愈率高于乙医院 标准化后的总治愈率。 ' 4130 100% 82.6% 5000 P甲 ' 4000 100% 80.0% 5000 P 乙 26 例4-5 试对下表资料计算甲乙两个医院的 标准化率。 科室 甲医院 乙医院 入院人数 治愈人数 治愈率(%) 入院人数 治愈人数 治愈率(%) 内科 1500 975 65.0 500 315 63.0 外科 500 470 94.0 1500 1365 91.0 传染病 500 475 95.0 500 460 92.0 合计 2500 1920 76.8 2500 2140 85.6 表 4-5 甲乙两医院治愈率的比较 标准化直接法的数学模式 式中P’为标准化率,N1,N2,…,NK为某一影响因素标 准构成的每层例数,P1,P2,…,PK为原每层的率,N为标 准构成的总例数。上式也写成: P’=( C1P1 + C2P2 +…+ CKPK )=ΣCi Pi 式中 Ci = Ni / N 为标准构成的构成比。 P’=( N1P1 + N2P2 +…+ NKPK )/ N =(ΣNi Pi)/ N 27
都准化直热漆的计幕少康 化直热油的计乡 D开 预南支生长 3.计募每准觉平。 合与通花康的计量 准化法使用江意 出 是者题 经g 使用构对款零儿的附保有年必? 华省韩水话 去创计幕 8 s:-可 S,=-严=004=49
标准化直接法的计算步骤 1.选取标准构成。标准构成选取方法有三种: (1)另外选取一个包含比较各组(如各地区)的有代表 性的、较稳定的、数量较大的构成为标准。如世界的 、全国的、全省的数据为标准构成。 (2)取比较各组的各层例数的合计为标准构成。 (3)从比较的各组(如各地区)中任选其一的构成作 为标准构成。 28 标准化直接法的计算步骤 2.在标准构成下,以原分层率计算各组的 预期发生数。 3.计算标准化率。 29 30 标准化率的计算方法 方法选择 直接法:已知被观察人群中各年龄组的患病率 (或发病率等)资料。 间接法:仅有各年龄组的观察单位数和总患病率。 标准选择 1、选择具有代表性的、内部构成相对稳定的较大人群 作标准。 2、将要比较的两组资料内部各相应小组的观察单位数相加, 作为共同的标准。 3、从要比较的两组中任选一组的内部构成作为标准。 30 标准化率的计算 直接法: 1、已知标准组年龄别人口数时 P’=(∑NiPi)/N 2、已知标准组年龄别人口构成比时 P’=(∑Ni/N) Pi 间接法: P’=P·r/(∑niPi) * r 为实际患病人数 ∑NiPi为根据标准组的患病率推算出来的 预期患病人数。 r/∑niPi 为标化患病比(发病比、死亡比) 31 标准化法使用注意事项 1、标准化法是采用统一标准人口年龄构成,以清除由于 构成明显差异造成对率的影响,使算得的标准总率具有 可比性;直接法计算简便,易于理解,更为常用;如果 原资料中有些年龄组人口过少,致使年龄别死亡率波动 较大时,则宜用间接法。 2、标准化后的率并不表示某地实际水平,只能表明相互 比较资料间的相对水平,且仅限于采用共同标准构成的 组间比较,选用标准不同,所得的标准化率也不同。 3、如不计算标准化率,而分别比较各分组的率,也可得 出正确结论,但不能比较总率的大小。 4、两样本标化率是样本值,存在抽样误差,若欲得出标 化组和被标化组的总率是否相等的结论,还应作假设 检验。 32 思考题: 使用相对数常见的错误有哪些? 33 率的标准误 由于抽样引起的样本率之间及样本率与总体率 之间的误差,称为率的抽样误差。这个误差的 大小我们用率的标准误来描述,用σp表示。 式中π为总体率,n为样本例数。 (1 ) p n p p s - = 34 率的标准误 由于在实际中,总体率π往往未知,我们常用 样本率 P 来近似代替总体率π,则上述公式变 为: 式中Sp 称为样本率的标准误,P 为样本率,n为 样本例数。 (1 ) p P P S n - = 35 实例计算 为了解某药的疗效,对100名患者治疗的结 果进行调查,结果为80人有效,有效率为 80%。则样本率的抽样误差为: 100 0.04 4% (1 ) 0.80(1 0.80) n P P Sp 36
善体平齿佑计 A 。- 0* 。1819-9474%9992
总体率的估计 点估计 区间估计 正态近似法 查表法 pˆ = P ( , ) P u S P u S a a p p - + 计算 置信区间(Confidence Interval) 101/107=94.39% (87.70-97.70) 18/19= 94.74% (71.89-99.72) 37 38 小 结 1.定性资料的变量形式包括多分类变量和两分类变 量,这些变量可以通过相对数进行统计描述。 2.常用的相对数指标有率、构成比和相对比。相对 数的性质取决于其分子和分母的意义,不同的相 对数其指标的定义和结果解释是不同的。 39 3.标准化法的目的是消除重要因素的构成不同对 粗率比较的影响,选择统一的“标准”,计算标 准化率。 4.医学人口统计和疾病统计中有关人口死亡和疾 病的一系列指标是定性资料统计描述的应用。这 些统计指标在确定卫生政策、了解人群健康水平 和评价卫生工作效果、反映疾病负担和医疗质量 方面等具有重要作用