÷2015/1/9 ■ 回回 课程设置 恋石何于大学 瀑财:覆论瀑:22净对 共月绿:10学财 第四章 方式:预防医季卫生晚 定性数据的统计描述 Tel:2057153 Baidu账巴:Yfa(讨论.米是、作业) 防医季 wmv) 小复月: ■定量散梅、定位教据 春T厦560k元1200k ■定量款梅的能计括速 中,甲区痛人为106人,乙区122人. 2。甲乙两地表村的离垂鼻情况调去.甲地的女感缘 150人,乙地真墙泰100人 地对散 >在调女研充中所获得的茶种世项真利一象列原始计款 1&年=(106/560)×100%=18.93% 款每。反映李新的绝对水平或未际水平。 乙&年=(122/1200)×100%=10.17% 甲直春病情元此乙直严重。 1嘉4排么乙道地P事22106)-16 能备远乙区比甲显惠痛情况严重? 制2巴甲地调套1500人,乙地1000人 制2药支意热人量甲地比地意150-100)=50A 甲地=150/n500×100%=10.0 乙地墙#年=100/1000×100%=10.09% 两她人厚的真墙排的严重程度是一年的, 1
2015/1/9 1 第四章 定性数据的统计描述 预防医学系 2 课程设置 课时: 理论课: 22学时 实习课: 10学时 联系方式:预防医学系卫生统计学教研室 Tel.: 2057153 Baidu贴吧:yfyxx (讨论、答疑、作业) http://tieba.baidu.com/f?kw=yfyxx# 大学精品课程网站→教学资源→(ppt、wmv) http://eol.shzu.edu.cn/eol/jpk/course/layout/default/index.jsp?courseId=1204 2 小复习: 定量数据、定性数据 定量数据的统计描述 3 例: 1. 某地某年为了解该地区居民饮用含氟过高水人 群 氟斑牙情况,调查了甲区560人,乙区1200人。 其中,甲区患病人数为106人,乙区为122人。 2. 甲乙两地农村钩虫感染情况调查,甲地钩虫感染 150人,乙地钩虫感染100人。 定性数据:绝对数 4 绝对数 在调查研究中所获得的某种性质类别一系列原始计数 数据。反映事物的绝对水平或实际水平。 仅由绝对数还不能进行更深入的分析比较。 例1 患病情况 乙区比甲区多(122-106)=16人 能否说乙区比甲区患病情况严重? 例2 钩虫感染人数 甲地比乙地多(150-100)=50人 能否肯定甲地比乙地人群钩虫感染程度更为严重? 5 例1 甲区患病率=(106/560)100%=18.93% 乙区患病率=(122/1200)100%=10.17% 甲区患病情况比乙区严重。 例2 已知甲地调查1500人,乙地调查1000人 甲地感染率=150/1500 × 100%=10.0% 乙地感染率=100/1000× 100%=10.0% 两地人群钩虫感染的严重程度是一样的。 6
÷2015/1/9 一、常用相对款 1、* 湘对 而个者展的最海之比。眉以远物的对 来(rate):来表杀在一走变间或时同能圆内禁 头集, 现来的发业表与可色发生的恶款之此,远呵盖现 便于对比分新。 泰出观的强度或频表,通常以百分平(%)、千 分年%)、万分/石)、戴+石分年(/ 10石)普象表添。计算会成为: 湘对款与绝对款的兵条:互相补光 比制常最%,%,V万,V十万 例41等華位在2009年有3128名斯三,盖单台 ”门)比制基款可根据月惯用债墙定,算得的 备年对取工退仔体“,在达一平新发生高么压 平条留一、二位些兼,女无亡年,自然婚长平 满人12例,时 等厢%,肿走无七来1十万, 2)计第财,不宝小 之(3)单不®直楼湘如· 高直压发病率=写品×10384 ,(4)不是鼻老指标的萝响,各来相至秋立, 其走系和不希1【南是则是号合), 2.构咸地(pr0 因以说园盖一来教内单春血成每金所点他比重成企重。 上泰k: ,2)物成此中一分所占比重增流,湘 第引个热利的观套平位款 ×100% A ×100% A+B+C+.. ÷2
2015/1/9 2 相对数 两个有关联的数据之比。用以说明事物的相对 关系, 便于对比分析。 相对数与绝对数的关系:互相补充 一、常用相对数 7 8 1、率 率(rate):率表示在一定空间或时间范围内某 现象的发生数与可能发生的总数之比,说明某现 象出现的强度或频度,通常以百分率(%)、千 分率(‰)、万分率(/万)、或十万分率(/ 10万)等来表示。计算公式为: 比例基数 某事物或现象发生的所有可能数 某事物或现象发生的实际数 率 比例常数 %,‰,1/万,1/十万 注意: (1)比例基数可根据习惯用法确定,算得的 率保留一、二位整数,如死亡率,自然增长率 等用%,肿瘤死亡率用 1/十万。 (2)计算率时,分母不宜太小。 (3)率不能直接相加。 (4)不受其它指标的影响;各率相互独立, 其之和不为1(如是则属巧合); 9 10 例4-1 某单位在2009年有3128名职工,该单位 每年对职工进行体检,在这一年新发生高血压 病人12例,则 12 1000 =3.84 3128 高血压发病率 ‰ ‰ 2.构成比( proportion ) 概念:是指一事物内部某一构成部分在事物整体中所占比重 用以说明某一事物内部各组成部分所占的比重或分布。 公式: 第i个类别的观察单位数 构成比= ×100% k个类别的观察单位数总数 A = ×100% A+B+C+…… 11 注意: (1)构成比的特点是各部分的数值总和为100%。 (2)构成比中某一部分所占比重的增减,相应会 影响其他部分的比重和分布。 (3)构成比只能说明比重和分布大小,不能反映 事物发生的频率或强度。(率与构成比的区别) 12
÷2015/1/9 ▣创42禁医晓米月位成痛人业、元亡人k反晚计指 标加下表所示。 兴展指梅值之此,眉以描适两★的对比水平,花 明A是B的着平倍或百分之几,道常用倍版或合成 表示。达西个指梅可以是性质有同,如不同财潮 的喜病人最:也可以是楼项不同,和体重与者高 的平者之此(体童指表,BM)。其计算套或希 相对比=100%) ■ 1.而类副创数之此 2相对危险度 侧如成周2010年人口普女的多性人▣数为686852572 有对电脸度(relative risk,RR):是流仔病季普 ,女:人▣k为652872280人,则 墙枝研充中章商的西标,表杀在局种不两春件下盖 病高发坐的版单之此,反映是康复发高或无亡 %男楼人口数是★楼随1.052德 RR= 为基来血的发高年)P非基意氢首发病平。 ■ 创43常地市区弗缓娟女性长通★和不长酒奇的帅 感发痛養并下表所示,就计算其相对危隆皮: 比k比(Oddsratio,OR):帝于德痛季 中高创~对属研充资料,表杀高创血和对藏血中的 暴常比创与非暴康此侧的此值之比,是反肤病病 与暴意之网头展强度的湘标。养计算会或为 4板」 6291.4 4级1 说啊诚地市区谗暖如女性饮通青的肺癌发 只为病创组的暴意比创或在暴意状态下的发病华 是非★性不的1.15倍 P为对照组的暴意比制或在非暴意状态下的发病丰 3
2015/1/9 3 13 例4-2 某医院某月住院病人数、死亡人数及统计指 标如下表所示。 疾病类型 (1) 病人数 (2) 病死人数 (3) 死亡构成(%) (4) 病死率(‰) (5) 呼吸系统疾病 620 25 23.81 40.32 循环系统疾病 1030 35 33.33 33.98 消化系统疾病 540 20 19.05 37.04 恶性肿瘤 300 25 23.81 83.33 合 计 2490 105 100.00 42.17 表4-1 某月某医疗机构住院病人数及死亡人数统计 14 相对比( relative ratio ):相对比是A、B两个有 关联指标值之比,用以描述两者的对比水平,说 明A是B的若干倍或百分之几,通常用倍数或分数 表示。这两个指标可以是性质相同,如不同时期 的患病人数;也可以是性质不同,如体重与身高 的平方之比(体重指数,BMI)。其计算公式为 100% B A 相对比 15 例如我国2010年人口普查的男性人口数为686852572 ,女性人口数为652872280人,则 即男性人口数是女性的1.052倍。 1.两类别例数之比 1.052 652872280 686852572 男女性别比 = 16 相对危险度( relative risk ,RR): 是流行病学前 瞻性研究中常用的指标,表示在两种不同条件下某 疾病发生的概率之比,反映暴露组发病或死亡的危 险是非暴露组的多少倍,说明疾病与暴露之间关联 强度。其计算公式为 P1为暴露组的发病率;P0非暴露组的发病率。 1 0 P RR P 2.相对危险度 17 例4-3 某地市区非吸烟女性饮酒者和不饮酒者的肺 癌发病资料如下表所示,试计算其相对危险度。 说明该地市区非吸烟女性饮酒者的肺癌发 病率是非吸烟女性不饮酒者的1.15倍。 表4-2 某地市区非吸烟女性饮酒者和不饮酒者的肺癌发病资料 饮酒与否 发病数 观察人年数 发病率(1/10万人年) 是 6 12965.2 46.3 否 265 660291.4 40.1 18 比数比( Odds ratio ,OR) : 常用于流行病学 中病例-对照研究资料,表示病例组和对照组中的 暴露比例与非暴露比例的比值之比,是反映疾病 与暴露之间关联强度的指标。其计算公式为 1 1 0 0 /(1 ) /(1 ) P P OR P P P1为病例组的暴露比例或在暴露状态下的发病率 P0为对照组的暴露比例或在非暴露状态下的发病率 3.比数比
÷2015/1/9 高侧氢中齿泰奉比例与华泰春比侧分州为 R-atc 血管专形的病侧对属研充的资料下表 1-R=a+e 所示。试计算◆东国孕期是香有发燕或通胃高史 对属血台县意比侧与来委意此侧会利为 引施暴儿种旋血普号形的此颜比。 1-R=b+d 表村卡泰国票制有吾发山或本胃高火小春儿计能点管中移兵居 南OR计会式可以每出 发為成有史神超血普形租对限题合计 20b60 1124 2030 315 来OR=0x20=3.63 Odds ratio 二、皮用相对散的注意事项 率的标准化: ,计算有对长对分季不6支小 惠*,得出论。 >见素制象不学的几个来,不色直热湘杂求平的值 地石 ,讨格倒415 乘周能一的赫准调整后的率务梅准化率(梅化率,调业来) 甲乙两换35岁以上知邮分于的毒血届嘉病来 直热计甲乙投的高压喜标化中 37 9 8元 6 甲校各年龄组的高压惠病率均略低于乙校 但总的怎病率甲校明显高于乙校? 4
2015/1/9 4 19 发热或感冒病史 神经血管畸形组 对照组 合计 有 40(a) 20(b) 60 无 112(c) 203(d) 315 合 计 152(a+c) 223(b+d) 375 例4-4 母亲围孕期是否有发热或感冒病史与婴儿 神经血管畸形关系的病例对照研究的资料如下表 所示。试计算母亲围孕期是否有发热或感冒病史 引起婴儿神经血管畸形的比数比。 表4-3 母亲围孕期有否发热或感冒病史与婴儿神经血管畸形关联 病例组中的暴露比例与非暴露比例分别为 对照组的暴露比例与非暴露比例分别为 由OR计算公式可以得出 本例 母亲围孕期是否有发热或感冒病史引起婴儿神经血管畸 形的优势比为3.63倍。 1 a P a c 1 1 c P a c 0 b P b d 0 1 d P b d 1 1 0 0 / (1 ) [ / ( )] / [ / ( )] / (1 ) [ / ( )] / [ / ( )] P P a a c c a c ad OR P P b b d d b d bc 3.63 20 112 40 203 OR Odds ratio 二、应用相对数的注意事项 注意资料的可比性: 研究对象同质、研究方法相同、观察时间相近、地区、 民族、年龄、性别等; 所比较资料内部构成相同; 同地区不同时期资料对比,要注意客观条件有无变化 计算相对数时分母不能太小 观察例数不等的几个率,不能直接相加求平均值 分析时不能以(构成)比代(替)率 讨论例4-15 21 当两组或多组率之间比较,其内部各小组的率明显不同, 各小组观察例数的构成比,如:年龄、性别、工龄、病情 轻重、长短也明显不同时,则不能直接比较两组或多组的 总率,得出结论。 标准化法:两组或多组率进行比较,当内部构成不同时, 为了消除内部构成的差异,需要按统一的“标准” 进行调整,使之具备可比性。 采用统一的标准调整后的率为标准化率(标化率、调整率)。 率的标准化: 22 检查人数 236 375 384 402 1397 病人数 16 27 38 59 140 患病率% 6.78 7.20 9.90 14.68 10.02 检查人数 478 379 235 157 1249 病人数 33 28 24 24 109 患病率% 6.90 7.39 10.21 15.29 8.73 年龄 (岁) 35~ 45~ 55~ 65-78 合计 甲校 乙校 甲乙两校35岁以上知识分子的高血压患病率 甲校各年龄组的高血压患病率均略低于乙校, 但总的患病率甲校明显高于乙校? 问题: 23 年 龄 (岁) (1) 35~ 45~ 55~ 65-80 合计 标准组 人 数 Ni (2) 714 754 619 559 2646 原患病率 Pi (3) 6.78 7.20 9.90 14.68 10.02 预期患病数 NiPi (4)=(2)(3) 48 54 61 82 245 原患病率 Pi (5) 6.90 7.39 10.21 15.29 8.73 预期患病数 NiPi (6)=(2)(5) 49 56 63 85 253 甲校 乙校 直接法计算甲乙两校的高血压患病标化率 甲校高血压患病标化率P’=245/2646=9.26% 乙校高血压患病标化率P’=253/2646=9.56% 乙校高于甲校,与各年龄组的对比结论一致, 解决了未标化前出现的矛盾。 24
÷2015/1/9 ■ 创45对下表拼计算甲乙两个医晚的 医晚梅准化后的善意率为 称准化平。 P=0x100%=82.6% 45甲乙两医晚海拿率的比较 乙医晚准化居女平为 2-000x10%=80.0n 准化后的恶。 ■■ 标准化直接击的散拳棋式 标准化直接法的计算步骤 P'=(NiP+Napa++NxPk )/N 1,流痕秦准构成。海清南成通痕方债有至种。 =tΣNMAU/N 1)易外流表一小色合此故春鱼(声喜地置)的有化泰 性的。根稳史的、版蛋根大的物高西都操。品香票齿 ,金通的。金者的量海场海准的 2)此象春血骑春属制整的香研希奉准扬点 ■P'=(GA+a2++Cj=ΣGm 标准化直接法的计算步赚 标准化率的计算方法 心方情选桥 2在标准构成下,以原分属车计算春触的 预物发生款。 标准选择 1,适赫具有化泰位斯、内部格成制对德走的候大人耳 3.计算标准化平。 作排准。 2、桥要比晨的局血业屏内解善和点小血的观基平位长和 05
2015/1/9 5 25 上例以各层例数的合计作为标准构成,计算得到甲 医院标准化后的总治愈率为 乙医院标准化后的总治愈率为 由上可见,甲医院标准化后的总治愈率高于乙医院 标准化后的总治愈率。 ' 4130 100% 82.6% 5000 P甲 ' 4000 100% 80.0% 5000 P 乙 26 例4-5 试对下表资料计算甲乙两个医院的 标准化率。 科室 甲医院 乙医院 入院人数 治愈人数 治愈率(%) 入院人数 治愈人数 治愈率(%) 内科 1500 975 65.0 500 315 63.0 外科 500 470 94.0 1500 1365 91.0 传染病 500 475 95.0 500 460 92.0 合计 2500 1920 76.8 2500 2140 85.6 表 4-5 甲乙两医院治愈率的比较 标准化直接法的数学模式 式中P’为标准化率,N1,N2,…,NK为某一影响因素标 准构成的每层例数,P1,P2,…,PK为原每层的率,N为标 准构成的总例数。上式也写成: P’=( C1P1 + C2P2 +…+ CKPK )=ΣCi Pi 式中 Ci = Ni / N 为标准构成的构成比。 P’=( N1P1 + N2P2 +…+ NKPK )/ N =(ΣNi Pi)/ N 27 标准化直接法的计算步骤 1.选取标准构成。标准构成选取方法有三种: (1)另外选取一个包含比较各组(如各地区)的有代表 性的、较稳定的、数量较大的构成为标准。如世界的 、全国的、全省的数据为标准构成。 (2)取比较各组的各层例数的合计为标准构成。 (3)从比较的各组(如各地区)中任选其一的构成作 为标准构成。 28 标准化直接法的计算步骤 2.在标准构成下,以原分层率计算各组的 预期发生数。 3.计算标准化率。 29 30 标准化率的计算方法 方法选择 直接法:已知被观察人群中各年龄组的患病率 (或发病率等)资料。 间接法:仅有各年龄组的观察单位数和总患病率。 标准选择 1、选择具有代表性的、内部构成相对稳定的较大人群 作标准。 2、将要比较的两组资料内部各相应小组的观察单位数相加, 作为共同的标准。 3、从要比较的两组中任选一组的内部构成作为标准。 30
÷2015/1/9 令标准化率的计算 标准化法使用注意事项 直热: 2装牛二密 P'=P./OnIP) 3 率的标准误 思考题; 使用相对款常见的精头有哪业? P(1-P) 5,2n )式中为体,n为本侧。 率的标准误 实创计算 ■南于在去际中,悬体平零钱拉未知,成妇常用 年来中P来近照代鲁唇体单x,则上速会式史 ·为丁导茶葛的守故,对100名春奇海守的地 清 暴造仔调套,地暴为80人有数,有兼年为 P(1-P) s,n 80%。则拆来率的格拆满业为: ■或中S絲务杯来来的标准领,P希拆来平,n为 S,==a=0.04=4% 排桌制数。 ¥6
2015/1/9 6 标准化率的计算 直接法: 1、已知标准组年龄别人口数时 P’=(∑NiPi )/N 2、已知标准组年龄别人口构成比时 P’=(∑Ni/N) Pi 间接法: P’=P〃r/(∑niPi ) * r 为实际患病人数 ∑NiPi为根据标准组的患病率推算出来的 预期患病人数。 r/∑niPi 为标化患病比(发病比、死亡比) 31 标准化法使用注意事项 1、标准化法是采用统一标准人口年龄构成,以清除由于 构成明显差异造成对率的影响,使算得的标准总率具有 可比性;直接法计算简便,易于理解,更为常用;如果 原资料中有些年龄组人口过少,致使年龄别死亡率波动 较大时,则宜用间接法。 2、标准化后的率并不表示某地实际水平,只能表明相互 比较资料间的相对水平,且仅限于采用共同标准构成的 组间比较,选用标准不同,所得的标准化率也不同。 3、如不计算标准化率,而分别比较各分组的率,也可得 出正确结论,但不能比较总率的大小。 4、两样本标化率是样本值,存在抽样误差,若欲得出标 化组和被标化组的总率是否相等的结论,还应作假设 检验。 32 思考题: 使用相对数常见的错误有哪些? 33 率的标准误 由于抽样引起的样本率之间及样本率与总体率 之间的误差,称为率的抽样误差。这个误差的 大小我们用率的标准误来描述,用σp表示。 式中π为总体率,n为样本例数。 (1 ) p n p p s - = 34 率的标准误 由于在实际中,总体率π往往未知,我们常用 样本率 P 来近似代替总体率π,则上述公式变 为: 式中S p 称为样本率的标准误,P 为样本率,n为 样本例数。 (1 ) p P P S n - = 35 实例计算 为了解某药的疗效,对100名患者治疗的结 果进行调查,结果为80人有效,有效率为 80%。则样本率的抽样误差为: 100 0.04 4% (1 ) 0.8 0(1 0.8 0) n P P Sp 36
÷2015/1/9 ■ 惑体率的估计 小 1,走性贵拼的史量形火包梅多分真史量和两分真史 D=P 量,这要史量可以通过湘对旅进骨能计指速。 ■区洞估计 2.舍眉的相对版面标者本、构成比和制对比。湘对 正杰近似凑 (P-u.S.P+u.S) 款的丝顶取染于其分于和分卡的意义,不同的湘 查表法 对款其指每的走义结暴解解是不两的。 计算重信E间(Confidence Interval). 10/107=94.39% (87.70-97.70) 18/19=94.74% (71.89-99.72) 3.标准化的的是膝童要★的构或不对 准化平 4.医人口能计病病计中有人口无亡不 离的一泰列指梅是支丝養料跳计指远的在眉。这 业能计指热在确走工生政巢、丁解人耳使桌水干 和评价卫鱼工作故暴、反映病痛黄起不盖守度量 方面羊具者重要作用。 7
2015/1/9 7 总体率的估计 点估计 区间估计 正态近似法 查表法 p ˆ = P ( , ) P u S P u S a a p p - + 计算 置信区间(Confidence Interval) 101/107=94.39% (87.70-97.70) 18/19= 94.74% (71.89-99.72) 37 38 小 结 1.定性资料的变量形式包括多分类变量和两分类变 量,这些变量可以通过相对数进行统计描述。 2.常用的相对数指标有率、构成比和相对比。相对 数的性质取决于其分子和分母的意义,不同的相 对数其指标的定义和结果解释是不同的。 39 3.标准化法的目的是消除重要因素的构成不同对 粗率比较的影响,选择统一的“标准”,计算标 准化率。 4.医学人口统计和疾病统计中有关人口死亡和疾 病的一系列指标是定性资料统计描述的应用。这 些统计指标在确定卫生政策、了解人群健康水平 和评价卫生工作效果、反映疾病负担和医疗质量 方面等具有重要作用