新世纪全国高等中医药院校规划款材 使医药完计封 主编 周仁郁
主编 周仁郁
生存分析 9.1生存时间 9.1.1生存函数 生存分析,是把事件的结果和出现这一结果所经历 的时间,结合起来分析的一种统计方法 例16名肝癌病人在1~12月进入观察,其中A,D, E在研究结束前死亡,C由于某种原因失访,B、F 到研究结束仍未获得确切的生存时间
9.1 生存时间 9.1.1 生存函数 生存分析,是把事件的结果和出现这一结果所经历 的时间,结合起来分析的一种统计方法. 例1 6名肝癌病人在 1~12月进入观察,其中A,D, E在研究结束前死亡,C由于某种原因失访,B、F 到研究结束仍未获得确切的生存时间
病人 开始月 终止月 生存天数 结局 A 1 5 150 死亡 B 2 12 330 生存 C 3 7 120 失访 D 4 8 120 死亡 E 5 9 120 死亡 7 12 180 生存 可以看出,A、D、E在研究结束前死亡,C由于某 种原因失访,B、F到研究结束仍未获得确切的生存 时间
病人 开始月 终止月 生存天数 结局 A 1 5 150 死亡 B 2 12 330 生存 C 3 7 120 失访 D 4 8 120 死亡 E 5 9 120 死亡 F 7 12 180 生存 可以看出,A、D、E在研究结束前死亡,C由于某 种原因失访,B、F到研究结束仍未获得确切的生存 时间
0 2 3 45678 91011 12 生存时间是指从某事件开始发生到出现某种反应所 经历的时间,可分为完全数据与截尾数据两种类型 完全数据是指从起点到死亡所经历的时间,截尾数 据,是指由于病人发生迁移或死于其他疾病造成失 访、或者改变方案、结束时间尚未发生等截尾情况
A B C D E F 0 2 7 12 1 3 4 5 6 8 9 10 11 生存时间是指从某事件开始发生到出现某种反应所 经历的时间,可分为完全数据与截尾数据两种类型 完全数据是指从起点到死亡所经历的时间,截尾数 据,是指由于病人发生迁移或死于其他疾病造成失 访、或者改变方案、结束时间尚未发生等截尾情况
生存时间有其特定的分布,描述生存时间的分布规 律,可以使用死亡密度函数、生存函数、危险函数 等3种方法 死亡密度函数f()表示患者在时间t的瞬间死亡概率 f(t)=lim Pt<T<t+△=F'(U) △1-→0 △t f() 其中,F()称为死亡分布 函数。以t为横轴、f)为 纵轴绘制的曲线,称为死 S(t) 亡密度曲线 F(0
生存时间有其特定的分布,描述生存时间的分布规 律,可以使用死亡密度函数、生存函数、危险函数 等3种方法 死亡密度函数f(t)表示患者在时间t的瞬间死亡概率 ( ) ( ) ( ) lim 0 F t t P t T t t f t t 其中,F(t) 称为死亡分布 函数。以 t 为横轴、f(t)为 纵轴绘制的曲线,称为死 亡密度曲线 f (t) S (t) F (t)
生存函数S),表示患者生存时间大于的累积概率 S)=P(T>0=1一Ft) S)为t右边死亡密度曲线下面积,也称为生存率。 以t为横轴、S)为纵轴绘制的曲线,称为生存率曲 线或Kaplan一Meier曲线 S(1) h( 0 危险函数(d)又称风险函数,表示t的瞬间死亡概率
O t S (t) t h(t) O 生存函数S(t),表示患者生存时间大于t的累积概率 S(t)=P(T>t)=1-F(t) S(t)为t右边死亡密度曲线下面积,也称为生存率。 以t为横轴、S(t)为纵轴绘制的曲线,称为生存率曲 线或Kaplan-Meier曲线 危险函数h(t)又称风险函数,表示t的瞬间死亡概率
h(t)= f(f( 1-F(t)S(t) 以t为横轴、h()为纵轴绘制的曲线称危险函数曲线 9.1.2 生存率计算 生存率的计算,有非参数方法与参数方法。参数方 法虽然效率较高,但对生存时间的分布要求符合某 种类型,而且计算复杂。非参数方法,主要有寿命 表与概率乘积两种方法,计算比较容易,应用广泛 概率乘积法也称为乘积极限法,对不分组资料用概 率乘法估计生存率,1958年由Kaplan一Meier提出
( ) ( ) 1 ( ) ( ) ( ) S t f t F t f t h t 以t为横轴、h(t)为纵轴绘制的曲线称危险函数曲线 9.1.2 生存率计算 生存率的计算,有非参数方法与参数方法。参数方 法虽然效率较高,但对生存时间的分布要求符合某 种类型,而且计算复杂。非参数方法,主要有寿命 表与概率乘积两种方法,计算比较容易,应用广泛 概率乘积法也称为乘积极限法,对不分组资料用概 率乘法估计生存率,1958年由Kaplan-Meier提出
把生存时间从小到大排序,重复数据只列一次。分 别计算各时段的初始例数n及该时段的死亡例数d, 得到死亡概率g及生存概率p q=dln,p=1-q 生存率St切的估计式 St)=P(T≥)=P1p2…Pk 生存率St)的标准误为 su空
把生存时间t从小到大排序,重复数据只列一次。分 别计算各时段的初始例数n及该时段的死亡例数d, 得到死亡概率q及生存概率p q=d/n,p=1-q 生存率S(tk)的估计式 S(tk)=P(T≥t)=p1 p2 …pk 生存率S(tk)的标准误为 k i i i i k p n q S S t 1 ( )
例2中药组与对照组两种疗法治疗白血病,估计两 组的生存率 中药组 5 17 22 3137 373928+ 36+ 40+ 40+ 对照组 2 4 9 9 10 16 24 27 27 4+ 40+ 对照组按生存时间排序,并分段进行计算 在第1时段,t=2,存活时间大于等于2例数为11, 死亡时间为2的例数为1,得初始例数n1=11,死亡 例数d1=1,死亡概率q1=1/11,生存概率p1=10/11 生存率S)=p,=10/11S=10 1/11 =0.0867 1V11×10/11
例2 中药组与对照组两种疗法治疗白血病,估计两 组的生存率 中药组 5 17 22 31 37 37 39 28+ 36+ 40+ 40+ 对照组 2 4 9 9 10 16 24 27 27 4+ 40+ 对照组按生存时间t排序,并分段进行计算 在第1时段,t1=2,存活时间大于等于2例数为11, 死亡时间为2的例数为1,得初始例数n1=11,死亡 例数d1=1,死亡概率q1=1/11,生存概率p1=10/11 生存率S(t1)=p1=10/11 0.086 7 11 10 /11 1/11 11 10 1 S
在第2时段,死亡概率q2=1/10,生存概率p2=9/10 1099 S(2)=P1P2=× 9 1/11 1/10 111011 =0.1163 111V11×10/1110×9/10 序号 生存月 初始数 死亡数 截尾数 死亡概率 生存概率 生存率 标准误 1 2 1 1 1/11 10/11 0.9091 0.0867 2 4 10 1 1 1/10 9/10 0.8182 01163 3 9 8 2 2/8 6/8 0.6136 0.1557 4 10 6 1 1/6 5/6 0.5114 0.1599 5 16 5 1 1/5 4/5 0.4091 0.1572 6 24 4 1 1/4 3/4 0.3068 0.1475 7 27 3 2 213 1/3 0.1023 0.0969 8 40 1 1
在第2时段,死亡概率q2=1/10,生存概率p2=9/10 11 9 10 9 11 10 ( ) S t2 p1 p2 0.116 3 10 9 /10 1/10 11 10 /11 1/11 11 9 2 S 序号 生存月 初始数 死亡数 截尾数 死亡概率 生存概率 生存率 标准误 1 2 11 1 1/11 10/11 0.9091 0.0867 2 4 10 1 1 1/10 9/10 0.8182 0.1163 3 9 8 2 2/8 6/8 0.6136 0.1557 4 10 6 1 1/6 5/6 0.5114 0.1599 5 16 5 1 1/5 4/5 0.4091 0.1572 6 24 4 1 1/4 3/4 0.3068 0.1475 7 27 3 2 2/3 1/3 0.1023 0.0969 8 40 1 1