第十四章生存分析的 Stata实现 本章使用的 STATA命令 设置生存分析数据结构set生存时间变量,f(结局变量) 作图(先执行stst命令)单个生存曲线 sts graph 多组生存曲线 sts graph, by(分组变量) 生存率(先执行 stset命令)单组生存率 sts list 多组生存率 sts list,by(分组变量) Logrank检验 sts test分组变量 (先执行sst命令) 寿命表 单组寿命表 Itable生存时间结局变量, graph 多组寿命表 Itable生存时间结局变量,by(分组变量) graph 结局变量为1表示失效事件发生 例14-2 McKelvey et a(1976)收集了3期的某型淋巴瘤患者的生存时间(天) 分别是6,19,32,42,42,43+,94,126+,169+,207,211+,227+,253, 255+,270+,310+,316+,335+,346+。现用 Kaplan-Meier法计算生存率。 Stata数据为: time 6 42 126 169 207 211 0 310 316 335 346
第十四章 生存分析的 Stata 实现 本章使用的 STATA 命令: 设置生存分析数据结构 stset 生存时间变量, f(结局变量) 作图(先执行 stset 命令) 单个生存曲线 sts graph 多组生存曲线 sts graph ,by(分组变量) 生存率(先执行 stset 命令) 单组生存率 sts list 多组生存率 sts list, by(分组变量) Logrank 检验 (先执行 stset 命令) sts test 分组变量 寿命表 单组寿命表 ltable 生存时间 结局变量,graph 多组寿命表 ltable 生存时间 结局变量, by(分组变量) graph 结局变量为 1 表示失效事件发生 例 14-2 McKelvey et al(1976)收集了 3 期的某型淋巴瘤患者的生存时间(天)。 分别是 6,19,32,42,42,43+,94,126+,169+,207,211+,227+,253, 255+,270+,310+,316+,335+,346+。现用 Kaplan-Meier 法计算生存率。 Stata 数据为: time d 6 1 19 1 32 1 42 1 42 1 43 0 94 1 126 0 169 0 207 1 211 0 227 0 253 1 255 0 270 0 310 0 316 0 335 0 346 0
Stata命令为: stset time, failure(d) sts list sts graph 结果为 failure d:d≡1 analysis time t: time Be Net Survivor Std Time Total Fail Lost Function error [95% Conf. Int] 0 0.94740.05120.68120.9924 9876432 0.89470.0704 .64080.9726 0.84210.0837 0.58650.9462 2 0.73680.1010 0.47890.8810 0 0.73680.1010 0.47890.8810 0 0.68020.10800.42140.8421 0.68020.1080 0.42140.8421 0.68020.10800.42140.8421 0 0.61210.116 0.34970.7951 0.61210.1167 0.34970.7951 0.61210.11670.34970.7951 253 0.52470.12870.25700.7363 255 0.52470.12870.25700.7363 270 0.52470.1287 0.25700.7363 3 87654321 1001001000000 0.52470.1287 0.25700.7363 0.52470.12870.25700.7363 0.52470.12870.25700.7363 0.52470.12870.25700.7363
Stata 命令为: stset time,failure(d) sts list sts graph 结果为: failure _d: d == 1 analysis time _t: time Beg. Net Survivor Std. Time Total Fail Lost Function Error [95% Conf. Int.] ------------------------------------------------------------------------------- 6 19 1 0 0.9474 0.0512 0.6812 0.9924 19 18 1 0 0.8947 0.0704 0.6408 0.9726 32 17 1 0 0.8421 0.0837 0.5865 0.9462 42 16 2 0 0.7368 0.1010 0.4789 0.8810 43 14 0 1 0.7368 0.1010 0.4789 0.8810 94 13 1 0 0.6802 0.1080 0.4214 0.8421 126 12 0 1 0.6802 0.1080 0.4214 0.8421 169 11 0 1 0.6802 0.1080 0.4214 0.8421 207 10 1 0 0.6121 0.1167 0.3497 0.7951 211 9 0 1 0.6121 0.1167 0.3497 0.7951 227 8 0 1 0.6121 0.1167 0.3497 0.7951 253 7 1 0 0.5247 0.1287 0.2570 0.7363 255 6 0 1 0.5247 0.1287 0.2570 0.7363 270 5 0 1 0.5247 0.1287 0.2570 0.7363 310 4 0 1 0.5247 0.1287 0.2570 0.7363 316 3 0 1 0.5247 0.1287 0.2570 0.7363 335 2 0 1 0.5247 0.1287 0.2570 0.7363 346 1 0 1 0.5247 0.1287 0.2570 0.7363 -------------------------------------------------------------------------------
Kaplan-Meier survival estimate 300 analysis time 例14-3下面是来自于 Berkson&Gage(1950)的一个研究队列。为了叙述 方便,把原来的出院后的生存时间改称为某恶性肿瘤术后生存时间。共有374 名患者进入研究队列 表14-3寿命表法计算生存率的计算用表 (1) (3)(4)(5) 7)(8)(9) 序号术后生存期初观察期内期内截尾校正期初死亡生存生存率 年数例数死亡人数人数概率概率 0.24060.75940.7594 1234 c000259935 2840.26760.73240.5561 208 150 0.24520.75480.4198 2345678 0.16560.83440.3503 11750.17020.82980.2907 56789 90.50.07730.92270.2682 59624 74132 74.50.05370.94630.2538 64.50.01550.98450.2498 59.50.05040.94960.2372 10 51.50.03880.96120.2280 0.61760.38240.0872 Stata数据格式为 time
0.00 0.25 0.50 0.75 1.00 0 100 200 300 400 analysis time Kaplan-Meier survival estimate 例 14-3 下面是来自于 Berkson & Gage(1950)的一个研究队列。为了叙述 方便,把原来的出院后的生存时间改称为某恶性肿瘤术后生存时间。共有 374 名患者进入研究队列。 表 14-3 寿命表法计算生存率的计算用表 (1) (2) (3) (4) (5) (6) (7) (8) (9) 序号 术后生存 年数 期初观察 例数 期内 死亡 期内截尾 人数 校正期初 人数 死亡 概率 生存 概率 生存率 t n d c nc=n-c/2 q=d/nc p=1-q S(t) 1 0~ 374 90 0 374 0.2406 0.7594 0.7594 2 1~ 284 76 0 284 0.2676 0.7324 0.5561 3 2~ 208 51 0 208 0.2452 0.7548 0.4198 4 3~ 157 25 12 151 0.1656 0.8344 0.3503 5 4~ 120 20 5 117.5 0.1702 0.8298 0.2907 6 5~ 95 7 9 90.5 0.0773 0.9227 0.2682 7 6~ 79 4 9 74.5 0.0537 0.9463 0.2538 8 7~ 66 1 3 64.5 0.0155 0.9845 0.2498 9 8~ 62 3 5 59.5 0.0504 0.9496 0.2372 10 9~ 54 2 5 51.5 0.0388 0.9612 0.2280 11 10+ 47 21 26 34 0.6176 0.3824 0.0872 Stata 数据格式为: time w d 1 90 1 2 76 1
51 345678 21 000 0000 2599355 0 5678 10 000000 11 Stata命令为: stset time weight=w), failure(d=1) Itable time d lweight=wl, graph 结果为: Interval Total Deaths t survival ror [95%Conf. Int] 374 00.75940.022 0.71270.7995 284 00.55610.02570.50430.6048 2345 4 208 51 00.41980.0255 0.36950.4692 157 0.35030.0248 0.30200.3989 6 120 20 50.29070.02390.24470.3381 95 90.26820.0235 22320.3150 90.25380.02330.20940.3004 30.24980.02330.20550.2965 50.23720.02320.19320.2839 50.22800.02320.18420.2748 11 0.08720.0210 0.05180.1339
3 51 1 4 25 1 5 20 1 6 7 1 7 4 1 8 1 1 9 3 1 10 2 1 11 21 1 1 0 0 2 0 0 3 0 0 4 12 0 5 5 0 6 9 0 7 9 0 8 3 0 9 5 0 10 5 0 11 26 0 Stata 命令为: stset time [weight=w],failure(d=1) ltable time d [weight=w],graph 结果为: Beg. Std. Interval Total Deaths Lost Survival Error [95% Conf. Int.] ------------------------------------------------------------------------------- 1 2 374 90 0 0.7594 0.0221 0.7127 0.7995 2 3 284 76 0 0.5561 0.0257 0.5043 0.6048 3 4 208 51 0 0.4198 0.0255 0.3695 0.4692 4 5 157 25 12 0.3503 0.0248 0.3020 0.3989 5 6 120 20 5 0.2907 0.0239 0.2447 0.3381 6 7 95 7 9 0.2682 0.0235 0.2232 0.3150 7 8 79 4 9 0.2538 0.0233 0.2094 0.3004 8 9 66 1 3 0.2498 0.0233 0.2055 0.2965 9 10 62 3 5 0.2372 0.0232 0.1932 0.2839 10 11 54 2 5 0.2280 0.0232 0.1842 0.2748 11 12 47 21 26 0.0872 0.0210 0.0518 0.1339
time 例14-4在例14-3中介绍了 McKelvey et al收集了19名3期淋巴瘤病 人的生存资料,该研究者还同时收集了4期淋巴瘤病人的生存数据共61例:4, 6,10,11,11,11,13,17,20,20,21,22,24,24,29,30,30,31,33, 9,90,93,104,110,134,137,160,169,171,173,175,184,201,222, 235,247,260,284,290,291,302,304,341,345。要比较3期淋巴 瘤患者和4期淋巴瘤患者的生存率是否有差异。 Stata数据格式为: d 19 0 169 0
------------------------------------------------------------------------------- 0 .2 .4 .6 .8 Proportion Surviving 2 4 6 8 10 12 time 例 14-4 在例 14-3 中介绍了 McKelvey et al 收集了 19 名 3 期淋巴瘤病 人的生存资料,该研究者还同时收集了 4 期淋巴瘤病人的生存数据共 61 例:4, 6,10,11,11,11,13,17,20,20,21,22,24,24,29,30,30,31,33, 34,35,39,40,41+,43+,45,46,50,56,61+,61+,63,68,82,85,88, 89,90,93,104,110,134,137,160+,169,171,173,175,184,201,222, 235+,247+,260+,284+,290+,291+,302+,304+,341+,345+。要比较 3 期淋巴 瘤患者和 4 期淋巴瘤患者的生存率是否有差异。 Stata 数据格式为: time d group 6 1 1 19 1 1 32 1 1 42 1 1 42 1 1 43 0 1 94 1 1 126 0 1 169 0 1 207 1 1 211 0 1
0 22223 5571 350065 1000000 46 6—0 11137 111 33333 44900134 111 222222222222222222222222222 9⑩456066 00 66688 001 y 222222
227 0 1 253 1 1 255 0 1 270 0 1 310 0 1 316 0 1 335 0 1 346 0 1 4 1 2 6 1 2 10 1 2 11 1 2 11 1 2 11 1 2 13 1 2 17 1 2 20 1 2 20 1 2 21 1 2 22 1 2 24 1 2 24 1 2 29 1 2 30 1 2 30 1 2 31 1 2 33 1 2 34 1 2 35 1 2 39 1 2 40 1 2 41 0 2 43 0 2 45 1 2 46 1 2 50 1 2 56 1 2 61 0 2 61 0 2 63 1 2 68 1 2 82 1 2 85 1 2
104 110 137 169 171 173 175 184 201 235 247 260 0000000000 22222222222222222222222222 291 302 304 Stata命令为: stset time, failure(d=1) sts test group sts graph, by(group) 结果 g-rank test for equality of survivor functions Event Events group observed expected 16.69 37.31 54.00
88 1 2 89 1 2 90 1 2 93 1 2 104 1 2 110 1 2 134 1 2 137 1 2 160 0 2 169 1 2 171 1 2 173 1 2 175 1 2 184 1 2 201 1 2 222 1 2 235 0 2 247 0 2 260 0 2 284 0 2 290 0 2 291 0 2 302 0 2 304 0 2 341 0 2 345 0 2 Stata 命令为: stset time,failure(d=1) sts test group sts graph,by(group) 结果: Log-rank test for equality of survivor functions | Events Events group | observed expected ------+------------------------- 1 | 8 16.69 2 | 46 37.31 ------+------------------------- Total | 54 54.00
chi2(1)= 6.71 P=00096,3期淋巴瘤患者和4期淋巴瘤患者的生存率有差别。 Kaplan-Meier survival estimates, by group analysis tim group=1
chi2(1) = 6.71 Pr>chi2 = 0.0096 P=0.0096,3 期淋巴瘤患者和 4 期淋巴瘤患者的生存率有差别。 0.00 0.25 0.50 0.75 1.00 0 100 200 300 400 analysis time group = 1 group = 2 Kaplan-Meier survival estimates, by group