第一节分类变量的统计描述 五、常用的相对数指标 (一)描述疾病频率的指标 [,发病率是表示在一定时间内某人群中发生某 病新病例的频率。 某病发病率= 某时期发生某病的新病例数 xK 同时期暴露人口数 K=100%,1000%,10000/万或100000/10万。 2.患病率又称现患率,是表示在短时间内某人 群中某病新旧病例所占的比重。 吉林大学远程教育学院
2 吉林大学远程教育学院 五、常用的相对数指标 ㈠ 描述疾病频率的指标 1. 发病率 是表示在一定时间内某人群中发生某 病新病例的频率。 = K 同时期暴露人口数 某时期发生某病的新病例数 某病发病率 K =100%,1000‰,10000/万或100000/10万。 2. 患病率 又称现患率,是表示在短时间内某人 群中某病新旧病例所占的比重。 第一节 分类变量的统计描述
患病率= 某时期发生某病的新旧病例数 K 同时期平均人口数 K=100%,1000%0,10000/万或100000/10万。 3,感染率是表示在受检人群中某病发生感染人 数所占的比重。 某病的感染室一感染某病原体人数 受检人数 ×100% (白)描述死亡频率的指标 1.死应率是表示在一定时期内某人群中死 3 吉林大学远程教育学院
3 吉林大学远程教育学院 = K 同时期平均人口数 某时期发生某病的新旧病例数 患病率 K =100%,1000‰,10000/万或100000/10万。 3. 感染率 是表示在受检人群中某病发生感染人 数所占的比重。 = 100% 受检人数 感染某病原体人数 某病的感染率 ㈡ 描述死亡频率的指标 1. 死亡率 是表示在一定时期内某人群中死
亡人数与该人群同期平均人口数之比。 死亡率= 某人群某时期死亡人数 该人群同期平均人口数 K=1000%。,若时期为一年,一般用年中人口数 或年初人口数加年终人口数除以2作为年平均人口数。 注意,上述的死亡率只是一个广义的定义,实际 当中需根据疾病的种类、人群的年龄、性别、职业 等分类计算,称为死亡专率。如年龄别死亡率、死 因别死亡率、婴儿死亡率、孕产妇死亡率等等。 吉林大学远程教育学院
4 吉林大学远程教育学院 亡人数与该人群同期平均人口数之比。 K =1000‰,若时期为一年,一般用年中人口数 或年初人口数加年终人口数除以2作为年平均人口数。 = K 该人群同期平均人口数 某人群某时期死亡人数 死亡率 注意,上述的死亡率只是一个广义的定义,实际 当中需根据疾病的种类、人群的年龄、性别、职业 等分类计算,称为死亡专率。如年龄别死亡率、死 因别死亡率、婴儿死亡率、孕产妇死亡率等等
2.病死率是表示在一定时间内患某病的人群中 因该病死亡的人数所占的比重。 病死率= 某时期因某病死亡人数 同期患该病的人数 ×100% 第二节 率的抽样误差和可信区间 一、率的抽样误差 吉林大学远程教育学院
5 吉林大学远程教育学院 2. 病死率 是表示在一定时间内患某病的人群中 因该病死亡的人数所占的比重。 = 100% 同期患该病的人数 某时期因某病死亡人数 病死率 第二节 率的抽样误差和可信区间 一、率的抽样误差
对于抽样研究,率和均数一样,也存在抽样误差 ,即由抽样造成的样本率与总体率之间的差异。同 样,率的抽样误差的大小也用率的标准误来表 示,其公式为: π(1-π) Op 公式(11.3) n 式中op为样本率的总体标准误,π为总体率,n 为样本含量。 吉林大学远程教育学院
6 吉林大学远程教育学院 对于抽样研究,率和均数一样,也存在抽样误差 ,即由抽样造成的样本率与总体率之间的差异。同 样,率的抽样误差的大小也用率的标准误来表 示,其公式为: n p (1 ) − = 公式(11.3) 式中σP 为样本率的总体标准误,π为总体率,n 为样本含量
实际工作中,总体率常常未知,常用样本率乳 代替,公式(11.3)就变为: S.=V p(I-p) 公式(11.4) n 式中Sp为样本率的样本标准误,π为总体率,n为 样本含量。 例11.3某研究者抽样调查了某地区三联疫苗接种者500人, 接种后35名出现皮疹,发生率为7%,试计算率的标准误。 SP00oon =0.0114 500 吉林大学远程教育学院
7 吉林大学远程教育学院 实际工作中,总体率π常常未知,常用样本率p 代替,公式(11.3)就变为: n p p Sp (1− ) = 公式(11.4) 式中SP 为样本率的样本标准误,π为总体率,n为 样本含量。 例11.3 某研究者抽样调查了某地区三联疫苗接种者500人, 接种后35名出现皮疹,发生率为7%,试计算率的标准误。 0.0114 500 (1 ) 0.07(1 0.07) = − = − = n p p Sp
二、总体率的区间估计 当n较大,p和1-p均不太小时,即p和np 均大于等于5时,样本率近似正态分布。根据正 态分布的原理由样本率印估计总体率π的可信区间的 公式为: p±uaSp 公式(11.5) 式中u。为u界值,lo.0s=1.96,40.01=2.58。 例11.3中,皮疹发生率的95%的可信区间为: 0.07-1.96×0.0114,0.07+1.96×0.0114) 即该地皮疹发生率的95%的可信区间为(4.77,9.23)%。 吉林大学远程教育学院
8 吉林大学远程教育学院 公式(11.5) 式中uα 为u界值,u0.05=1.96,u0.01 =2.58。 二、总体率的区间估计 当n较大,p和1-p均不太小时,即np和n(1-p) 均大于等于5时,样本率p近似正态分布。根据正 态分布的原理由样本率p估计总体率π的可信区间的 公式为: p u Sp 例11.3中,皮疹发生率的95%的可信区间为: (0.07-1.96×0.0114,0.07+1.96×0.0114) 即该地皮疹发生率的95%的可信区间为(4.77, 9.23)%
第三节率的山检验 当样本率与已知的总体率或两个样本率进行比 较时,需做假设检验。 当样本率p满足正态近以条件(即p和u①Lp ≥5)时,可用u检验。 一、样本率与总体率的比较 用于一组二项分类资料的样本率代表未知的总 体率π和已知的总体率π0(一般为理论值、标 0 吉林大学远程教育学院
9 吉林大学远程教育学院 当样本率与已知的总体率或两个样本率进行比 较时,需做假设检验。 当样本率p满足正态近似条件(即np和n(1-p) ≥5)时,可用u检验。 第三节 率的u 检验 一、样本率与总体率的比较 用于一组二项分类资料的样本率p代表未知的总 体率π和已知的总体率π0 (一般为理论值、标
准值或经大量观察所得的稳定值)进行比较。其检 验统计量的计算公式为: p-zo V= 公式(11.6) π1-πo) 1 n 式中P为样本率,元0为已知的总体率,为样本例数。 例11.4某研究者用新方法治疗脑梗死患者8人,治疗四周后 其生活能力改善率为50%。一般情况下脑梗死患者治疗四周后生活能 力改善率为30%,问该治疗方法与一般情况相比其生活能力改善率是 否有统计学意义。 10 吉林大学远程教育学院
10 吉林大学远程教育学院 准值或经大量观察所得的稳定值)进行比较。其检 验统计量的计算公式为: 公式(11.6) 式中P为样本率,π0为已知的总体率,n 为样本例数。 ( ) n p u 0 0 0 1 − − = 例11.4 某研究者用新方法治疗脑梗死患者98人,治疗四周后 其生活能力改善率为50%。一般情况下脑梗死患者治疗四周后生活能 力改善率为30%,问该治疗方法与一般情况相比其生活能力改善率是 否有统计学意义
本例样本率p=50%,n=98,p=98×50%=49和 n(1-p)=98×(1-50%)=49均大于5,则满足正态近似 条件:又已知π0=30%,故可用单样本检验。 H0:π=元0=30% H1:π≠π0≠30% 0=0.05 0.5-0.3 u 卫-π =4.32 π1-π) 0.31-0.3) n 98 11 吉林大学远程教育学院
11 吉林大学远程教育学院 本例样本率p=50%,n=98,np=98×50%=49和 n(1-p)=98×(1-50%)=49均大于5,则满足正态近似 条件;又已知π0=30%, 故可用单样本u检验。 H0 : π=π0=30% H1 : π ≠π0 ≠30% α= 0.05 ( ) ( ) 4.32 98 0.3 1 0.3 0.5 0.3 0 1 0 0 = − − = − − = n p u