2014/10/15 Focus on 诊断试验证据评价与临床应用 诊断试验案例:阅读并评价文就 论文报告标准 陈世 复且大学临床流行病学循证医学中心 设计案例 复旦大学附属中山医院 m诊断试验临床应用 文献评价内容 临床案例1 ■先进性评估:是否首先报道( First one)1是 男性,35岁 否科学评价① ast one 既往有乙型肝炎病史, HBSAg(+、 HBeAb(+) 前肝肾功能、甲胎蛋白 真实性评估:是否纳入全部者或代表性如何 AFP检查结果正常,血常规(包括血红蛋白 ■结果大小:灵敏度特异度/似然比 血小板、白细胞正常 本次检查,AFP高于正常值高限2倍(定义为阳 科学性评估:“ 性),肝腔B型彩超检未发现占位。这位息者来 到门诊就诊,门诊医师该如何处理呢? 循证实践的步骤 案例分析:AFP诊断肝癌情况分析 ①依据瘪者问题提出临床可以回答的问题 ②文献检或者查找证据 金标准评价最终结果 非肝癌 文献评价,即证据是否科学 AFP+)肝细肝 杆硬化、生殖系统种会、其他种 ④应用证据,即证据是否适应我们目前的瘪者 AF管组胞肝 ⑤后效评价,即临床问题是否解决
2014/10/15 1 诊断试验证据评价与临床应用 陈世耀 复旦大学临床流行病学/循证医学中心 复旦大学附属中山医院 1 Focus on 诊断试验案例:阅读并评价文献 论文报告标准 设计案例 诊断试验临床应用 2 文献评价内容 先进性评估:是否首先报道 (First one) (First one);是 否科学评价(Last one) (Last one) 真实性评估:是否纳入全部患者或代表性如何 :是否纳入全部患者或代表性如何 结果大小:灵敏度 结果大小:灵敏度/特异度/似然比 科学性评估:…… 3 临床案例1: 男性,35岁 既往有乙型肝炎病史,HBsAg(+)、HBeAb(+) 、HBcAb( ) + ,一年前肝肾功能 、甲胎蛋白 (AFP)检查结果正常,血常规(包括血红蛋白、 血小板、白细胞)正常 本次检查,AFP高于正常值高限2倍(定义为阳 性),肝脏B型彩超检未发现占位。这位患者来 到门诊就诊,门诊医师该如何处理呢? 4 循证实践的步骤 ①依据患者问题提出临床可以回答的问题; ②文献检索或者查找证据 ③文献评价,即证据是否科学 ④应用证据,即证据是否适应我们目前的患者 ⑤ 后效评价,即临床问题是否解决 后效评价,即临床问题是否解决 5 案例分析:AFP诊断肝癌情况分析 6
2014/10/15 肝癌的临床诊断依据 临床问题 慢性肝病病史,息者存在乙型肝炎基础,是量 E通过进一步检查明确或排除该息者是否是肝癌。 要的病史依据 E选择cT检查是否能帮助我们确定或者排除该息 (2)肝病体征,该息者没有; 肝癌的 (3)肿瘤标准物,AFP升高是肝癌量娶标志物,该 或者,选择CT检查诊斷或者排除该瘪者肝癌, 瘪者为阳性,提示肝癌 其诊斷肝癌的灵敏度和特异度是多少? 4)影像学检查肝内异常占位,该息者B型彩超没 有发现异常占位,不符合肝癌诊断 cT诊断肝癌情况分析 诊断试验的四格表 冀金标准 金标准评价最终结果 非病例组 非轩 诊斷阳性(真阳性ab(假阳性)ab cT判断+)肝癌 轩硬化结节,转移性种症,其他肝占位 成验阴性(假阴性)c可真阴性)c+d 小肝爆、无化日,表葚肝 现的肝癌、末现为硬 化结节的肝症、表现为类 灵敏度=aa+c 阳性孔圳值= 帕异度=dh+d 阴性孔值=c 似多发转移肝程 神确B= a+/a+b+c+d 息亲率= +++c+d 评价诊断试验的指标(1) 评价诊断试验的指标(2) 灵敏度(my)特异度 (Specificity) 预测值 灵敏度指病人组中经诊新-特异度指非病人组中经诊斷 阳性预测值指诊断试验阳性 是否 验查出阳性人的比例 试验查出阴性人敷的比例 阳性 (d/btd) 结果中真正患病的比例 痛人组中经谁新验查出 经修断试险查出阳性人数的 贾性人教的比例(cac即比例bbd即为似阳性率, 阴性预测值指诊断试险阴性 为性率,又称诊率 结果中真正未息病的比例 侵阴性率=1一灵敏度
2014/10/15 2 肝癌的临床诊断依据 (1) 慢性肝病病史,患者存在乙型肝炎基础,是重 要的病史依据; (2) 肝病体征,该患者没有; (3) 肿瘤标准物,AFP升高是肝癌重要标志物,该 患者为阳性,提示肝癌; (4) 影像学检查肝内异常占位,该患者B型彩超没 有发现异常占位,不符合肝癌诊断。 7 临床问题 通过进一步检查明确或排除该患者是否是肝癌。 选择CT检查是否能帮助我们确定或者排除该患 者肝癌的诊断? 或者,选择CT检查诊断或者排除该患者肝癌, 其诊断肝癌的灵敏度和特异度是多少? 8 CT诊断肝癌情况分析 9 黄金标准 病例组 非病例组 诊断 阳性 (真阳性)a b(假阳性) a+b 试验 阴性 (假阴性)c d(真阴性) c+d 诊断试验的四格表 试验 阴性 (假阴性)c d(真阴性) c+d a+c b+d a+b+c+d 灵敏度=a/a+c 阳性预测值=a/a+b 特异度=d/b+d 阴性预测值=d/c+d 准确度=a+d/a+b+c+d 患病率=a+c/a+b+c+d 10 评价诊断试验的指标(1) 灵敏度(Sensitivity ) – 灵敏度指病人组中经诊断 试验查出阳性人数的比例 特异度(Specificity ) – 特异度指非病人组中经诊断 试验查出阳性人数的比例 试验查出阴性人数的比例 (a/a+c); – 病人组中经诊断试验查出 阴性人数的比例(c/a+c)即 为假阴性率,又称漏诊率; – 假阴性率=1-灵敏度。 是 否 阳性 a b 阴性 c d (d/b+d); – 经诊断试验查出阳性人数的 比例(b/b+d)即为假阳性率, 又称误诊率; – 假阳性率=1-特异度。 11 评价诊断试验的指标(2) 预测值: – 阳性预测值指诊断试验阳性 结果中真正患病的比例 是 否 阳性 a b (a/a+b) – 阴性预测值指诊断试验阴性 结果中真正未患病的比例 (d/c+d) 阳性 a b 阴性 c d 12
2014/10/15 预测值的特点 评价诊断试验的指标(3) 灵敏度越高的试验,阴性预测值越高; 似然比( Likelihood ratio,LR) 一试验阳性鳍果的似然比系真阳性率 特异度越高的试验,阳性预测值越高 和假阳性率之比 患病率的高低对预测值的影响更大。 试验阴性结果的似然比系假阴性率 和真阴性率之比 似然比的计算 似然比的特点和应用 例监护病房cK诊断心cK<80=cK) ■比灵敏度和特异度更稳定,不受息病率影响; 无心梗 CK+ 215(9348%)16(1231%)231|R=76 用于估计爽病概率。 15(652%114(8769%129LR=0.07 Total 诊断试验评价中的常用基本概念 诊断试验似然比应用举例 例:女45y,典型心纹痛就诊,息冠心病概率多少? 疾病概率=病人病人十非病人)=aa+b 文獻就资料,息病率1% 宪病比率=人申病人 着息者有典型心敏痛,其似然比=100 验前比=验前率(1验前率)=aatb[1 验前概率=1% 一验前比=0。01/(10.01)=001 验后比一验前比X似然比 验后比=001X100=1 验后标率=验后比1十验后比)=AB+AB)=AA+B 验后概率=1(1+1=05=50%
2014/10/15 3 预测值的特点 灵敏度越高的试验,阴性预测值越高; 特异度越高的试验,阳性预测值越高; 患病率的高低对预测值的影响更大。 13 评价诊断试验的指标(3) 似然比(Likelihood ratio, LR) – 试验阳性结果的似然比系真阳性率 和假阳性率之比 – 试验阴性结果的似然比系假阴性率 和真阴性率之比 14 似然比的计算 例. 监护病房CK诊断心梗(CK<80=CK (CK<80=CK-) 心梗 无心梗 CK+ 215(93.48%) 215(93.48%) 16(12.31%) 16(12.31%) 231 +LR=7.6 +LR=7.6 CK- 15(6.52%) 15(6.52%) 114(87.69%) 114(87.69%) 129 -LR=0.07 LR=0.07 Total 230 130 360 15 似然比的特点和应用 比灵敏度和特异度更稳定,不受患病率影响; 用于估计疾病概率。 16 诊断试验评价中的常用基本概念 疾病概率=病人/(病人+非病人) =a/a+b 疾病比率=病人/非病人 =a/b 验前比=验前概率/(1-验前概率) =(a/a+b)/[1 ) =(a/a+b)/[1- a/(a+b)]=a/b 验后比=验前比 验后比=验前比×似然比 =a/b×LR=a1/b1 验后概率=验后比/(1+验后比) =(A/B)/(1+A/B)=A/A+B =(A/B)/(1+A/B)=A/A+B 17 诊断试验似然比应用举例 例:女45y, 典型心绞痛就诊, 患冠心病概率多少? – 文献资料,患病率1% – 若患者有典型心绞痛,其似然比=100 – 验前概率=1% – 验前比=0.01/(1 0.01/(1-0.01)=0.01 – 验后比=0.01×100=1 – 验后概率=1/(1+1)=0.5=50% 18
2014/10/15 似然比应用举例 处理综合试验结果 例:女45y,典型心纹痛,心电图检查ST段压低 验后比 22mm,惠冠心病概率为多少? 文就资料,ST压低22,似溶比=11 验前比X试验1似然比X试验2似然比 意者有典型心皱痛,估计患病新率=50% 验前概率=50% 验前比=05/105)=1 验后比一验前比×似然比=1X11=11 验后概率=11(1+1=9% 文献评价内容 临床案例2:食管癌术前分期诊断评估 先进性评估:是否首先报道( irst one);是 临床问题 否科学评价 Last one) 如何确定食管癌术前分期(TNM 真实性评估:是否纳入全部意者或代表性如何 三种分期诊方法如何选择:EUs增强 CT/PET-CT 结果大小:灵敏度/异度/似然比 科学性评估:“ 案例分析:食管癌术前分期诊断评估 研究报告摘要 研究问题 参考试验〔金标准)是什么? ■目的 方法 ■结果 结论 如如如 scopic ultrasonography (USI, posite computed tonm preoperative locoregional staging of ble esophageal 770 and it w n eth he fed i liar cinstr sua tiar ler s m wr e s kim 二一
2014/10/15 4 似然比应用举例 例:女45y, 典型心绞痛, 心电图检查ST段压低 2.2mm,患冠心病概率为多少? – 文献资料,ST压低2.2,似然比=11 – 患者有典型心绞痛,估计患病概率=50% – 验前概率=50% – 验前比=0.5/(1-0.5)=1 – 验后比=验前比 验后比=验前比×似然比=1×11=11 – 验后概率=11/(1+11)=91% 19 处理综合试验结果 验后比 =验前比×试验1似然比×试验2似然比 20 文献评价内容 先进性评估:是否首先报道 (First one) (First one);是 否科学评价(Last one) (Last one) 真实性评估:是否纳入全部患者或代表性如何 :是否纳入全部患者或代表性如何 结果大小:灵敏度 结果大小:灵敏度/特异度/似然比 科学性评估:…… 21 临床案例2:食管癌术前分期诊断评估 临床问题: – 如何确定食管癌术前分期(TNM) – 三种分期诊断方法如何选择 种分期诊断方法如何选择:EUS/增强CT/PET-CT 22 案例分析:食管癌术前分期诊断评估 研究问题: – 参考试验(金标准)是什么? – 实验设计? 23 研究报告摘要 目的: 方法: 结果: 结论: 24
2014/10/15 诊断试验科学性评价 http://www.stard-statement.org 评价试验是否与金标准试验进行了独立、盲法 比较? STARD: m所研究息者样本是否包括临床试验中将使用该 诊断试验的各种息者? 评价试验结果有无影响参照标准检查的实施; 诊斷试验的精确性 题目摘要/关键词 介绍 ■1.把文章标记为诊斷准确性推荐使用MeSH主题 2.陈述研究问题或目的,如估计诊斷准确性或比 词“灵敏度与特异度”) 较不同试验或不同病例群体之间准确性 preoperative locoregional staging of resectable esophageal accuracy of EUS staging with that of PET and CT ere 42%% fo staging using postoperative pathologic staging as a gold standard E lt also aimed to determine the impact of EUS in 关健词( Keywords) Computed tomography, Endosonography er, Positron emission tomograph preoperative locoregional staging of resectable 方法:研究对象 方法:研究对象 3.描述研究人群:纳入和排除标准,数据收集的 ■4.描述研究对象的募集:募集基于表现的症状 机构和场所 还是以前试验的结果,还是研究对象已经接受过 E没有具体排除标准,如术前放疗排除等(结果有 目标试验或参考标准的事实? From September 2005 to July 2008. patients with a diag- ■研究对象已经接受过目标试验和参考试验 回顾性研究:可接受切除手术的食管癌瘪者一段 时间、一个单位的总体 ho had ne the staging protocol were allocated to esophageal resection and extensive regional lymph node dissention. The Insti- 5
2014/10/15 5 诊断试验科学性评价 评价试验是否与金标准试验进行了独立、盲法 试验是否与金标准试验进行了独立、盲法 比较? 所研究患者样本是否包括临床试验中将使用该 诊断试验的各种患者? 评价试验结果有无影响参照标准检查的实施; 诊断试验的精确性 25 http://www.stard-statement.org/ 26 题目/摘要/关键词 1. 把文章标记为诊断准确性(推荐使用MeSH主题 词“灵敏度与特异度”) 题目(Title): Comparison Comparison of EUS, PET, and CT in the of EUS, PET, and CT in the preoperative preoperative locoregional locoregional staging of staging of resectable resectable esophageal esophageal cancer 摘要(Results): The (Results): The sensitivities sensitivities for N staging were 42% for for N staging were 42% for EUS, 49% for PET, and 35% for CT, and their EUS, 49% for PET, and 35% for CT, and their specificities specificities were, respectively, 91, 87, and 93%. 关键词(Keywords):Computed tomography, Computed tomography, Endosonography Endosonography Esophageal cancer, Positron emission tomography, Tumor staging 27 介绍 2. 陈述研究问题或目的,如估计诊断准确性或比 较不同试验或不同病例群体之间准确性 This large postoperative study aimed to This large postoperative study aimed to compare the compare the accuracy accuracy f EUS i i h h f PET d CT of EUS staging with that of PET and CT staging staging using postoperative pathologic staging as a using postoperative pathologic staging as a gold standard. It also aimed to It also aimed to determine the impact of EUS determine the impact of EUS in preoperative preoperative locoregional locoregional staging of staging of resectable resectable esophageal cancer. 28 方法:研究对象 3. 描述研究人群:纳入和排除标准,数据收集的 机构和场所 没有具体排除标准,如术前放疗排除等(结果有) 29 方法:研究对象 4. 描述研究对象的募集:募集基于表现的症状, 还是以前试验的结果,还是研究对象已经接受过 目标试验或参考标准的事实? 研究对象已经接受过目标试验和参考试验 回顾性研究:可接受切除手术的食管癌患者-一段 时间、一个单位的总体 30
2014/10/15 方法:研究对象 方法:研究对象 ■5.描述研究对象的抽样。研究人群是一个根据第 6.描述数据收集:数据收集的计划是在目标试验 3项或第4项定义的选择标准下的连续系列吗?如 和参考标准实施之前(前瞻性研究),还是之后(回 果不是,说明研究对象是如何选择的 顾性研究)? 数据收集在之后(回顾性研究}-收集信息偏移如缺 失、不确定等 对象选择偏移 and extensive regional lymph nole dissection. The Insti- 验影响手术唐者按受手术回顾性检查待评估的 tutional Review Board of the Seoul National University 试验排除手术未获得标本如探查不可切除 Hospital approved this study, and written informed con- sents were obtained from all the patients, All information was collected and analyzed retrospectively. 方法:试验方法 方法:试验方法 7.描述参考标准和它的原理 8.描述所使用的材料和方法的技木说明,包括何 时、如何进行测量,列出目标试验和参考标准的 E参考试验:手术+病理检查 引用文献 staging with that of PLT and CI staging using postopera- tive pathologic staging as a gold standard. It also aimed to ■描述,非盲窗法,目标评价试验之间存在互相影响 Pathologic staging was determined using the tumor node metastasis (TNM) classification system according to the American Joint Committee on Cancer (AJCC) esophageal cancer staging 1101. The regional lymph nodes included 方法:试验方法 方法:试验方法 9.描述目标试验和参考标准结果单位、截断值和 10描述实施目标试验和参考标准以及阅读结果 /或分类的定义和原理 的人员数量,培训情况和经验 The EUS critcria uscd for T staging were as follows: TI (tumor invades the mucosa or submucosa but not the 测量偏移:未描述 muscularis propria),I2(tumor invades but docs not cxtcnd and distant organ metastasis. The lymph nodes with the hortest diameter (% mm) were considered positive for
2014/10/15 6 方法:研究对象 5. 描述研究对象的抽样。研究人群是一个根据第 3项或第4项定义的选择标准下的连续系列吗?如 果不是,说明研究对象是如何选择的 对象选择偏移: 连续活检证实食管癌-评估可手术(评估的诊断试 验影响手术)-患者接受手术-回顾性检查待评估的 试验-排除手术未获得标本(如探查不可切除) 31 方法:研究对象 6. 描述数据收集:数据收集的计划是在目标试验 和参考标准实施之前(前瞻性研究),还是之后(回 顾性研究)? 数据收集在之后 数据收集在之后(回顾性研究)-收集信息偏移如缺 收集信息偏移如缺 失、不确定等 32 方法:试验方法 7. 描述参考标准和它的原理 参考试验:手术+病理检查 33 方法:试验方法 8. 描述所使用的材料和方法的技术说明,包括何 时、如何进行测量,列出目标试验和参考标准的 引用文献 描述,非盲法,目标评价试验之间存在互相影响 34 方法:试验方法 9. 描述目标试验和参考标准结果单位、截断值和 /或分类的定义和原理 35 方法:试验方法 10. 描述实施目标试验和参考标准以及阅读结果 的人员数量,培训情况和经验 测量偏移:未描述 36
2014/10/15 方法:试验方法 方法:统计方法 11.描述目标试验和参考标准里读取结果的人是 12描述计算或比较诊断准确性测量结果的方法 否对另一个试验的结果设盲,描述任何读取结果 以及对结果不确定性定量的统计方法 者可以获得的临床信息 不确定结果未说明处理 测量偏移:未设盲 empanel T 诊断试验相互影响,诊断试验本身影响手术 手术取材(如淋巴结清扫)依据诊断试 nf EUIS, PET, and cT staying [1]. All tedx 病理取材、切片、读片受手术影响(清楚全部临 signifcance were two-tailed, and p values to July 2008, patients with a diag- nosis of biopsy-proven esophageal cancer were prospe vely enrolled in Scoul National (University Hospital to ndcrgo a prcopcrative staging protocol that included EUS whole-body PLT/CT, and chest CT scan concomitantly 结果:研究对象 结果:研究对象 15报告研究人群的临床和人口学特征如年 m16报告满足人选标准进行或未进行目标试验和 性别、症状谱、其他伴随疾病、当前治疗、征集 /或参考标准的研究对象的数量,描述研究对象 中心 未能参加试验的原因强烈推荐使用流程图) Examnation by EUS was completed for yI patents(M1%). A tolal of &9 parients underwent For 18 paticnts (1680). obstructing tumor did not permit ectomy with two-tield (thoracoabdominal lymph node atonal any eas 12 patieats had tlwee-field (towaco Because Ct and Pet cannot differ Findings eudyuvunt chemotherapy (n= 1) or concurrent cheTh radiation therapy (n-4) before surgery
2014/10/15 7 方法:试验方法 11. 描述目标试验和参考标准里读取结果的人是 否对另一个试验的结果设盲,描述任何读取结果 者可以获得的临床信息 测量偏移:未设盲 诊断试验相互影响,诊断试验本身影响手术 手术取材(如淋巴结清扫)依据诊断试验 病理取材、切片、读片受手术影响(清楚全部临 床信息) 37 方法:统计方法 12. 描述计算或比较诊断准确性测量结果的方法, 以及对结果不确定性定量的统计方法 不确定结果未说明处理 38 方法:统计方法 13. 如果可能,则描述计算试验可重复性的方法 未报告试验重复检查或者审查报告,未采用计算 重复性方法,如均数、多数法则、Kpa值等 39 结果:研究对象 14. 报告研究完成的时间,包括征集研究对象开 始和停止的日期 作者在方法学中介绍了时间,可以确定,该研究 为回顾性研究;部分患者缺少某项试验或者术前 化疗/放疗等影响同样说明回顾性 40 结果:研究对象 15. 报告研究人群的临床和人口学特征(如年龄、 性别、症状谱、其他伴随疾病、当前治疗、征集 中心) 41 结果:研究对象 16. 报告满足人选标准进行或未进行目标试验和 /或参考标准的研究对象的数量,描述研究对象 未能参加试验的原因(强烈推荐使用流程图) 42
2014/10/15 结果:试验结果 结果:试验结果 17报告从目标试验到参考标准的时间间隔,以 18.有目标状态的研究对象,报告疾病严重性的 及期间采取的任何治疗措施 分布程度;对没有目标状态的,描述其他的诊断 测量偏移:缺少盲法比较,诊断试验相互影响, 疾病轻重程度的分析,本例中分期诊斷。 放化疗影响手术分期 期状态下仍然有不同程度会有影响 评价试验在先,参考标准在后,但没有具体间隔 转移的不同部位描述、淋巴结转移的不 时间说明 要比较的试验之间的先后顺序以及间隔时间也 断试验影响处理(部分阳性不手术,剧除选择 没有说明 偏移) 结果:试验结果 结果:试验结果 19报告根据参考标准结果的目标试验结果(包括 20报告实施目标试验或参考标准期间的任何 不确定和缺失的结果)的交叉表;对连续型结果, 不良事件 报告根据参考标准结果的目标试验结果的分布 E真实性评估: E回顾性收集资料,未报告,如CT过敏、麻醉 意外、内锦操作损伤或者出血等 结果:结果估计 结果:结果估计 21.报告诊断准确性估计结果和统计学不确定性 22报告目标试验里不确定结果,缺失结果和异 的测量结果如95%c 常结果是如何处理的 缺少估计结果(95%c) E没有具体交待,按照缺失处理EUs病例数不同)
2014/10/15 8 结果:试验结果 17. 报告从目标试验到参考标准的时间间隔,以 及期间采取的任何治疗措施 测量偏移:缺少盲法比较,诊断试验相 影响 诊断试验相互影响, 放化疗影响手术分期 评价试验在先,参考标准在后,但没有具体间隔 时间说明 需要比较的试验之间的先后顺序以及间隔时间也 没有说明 43 结果:试验结果 18. 有目标状态的研究对象,报告疾病严重性的 分布程度;对没有目标状态的,描述其他的诊断 疾病轻重程度的分析 疾病轻重程度的分析,本例中分期诊断 本例中分期诊断。在 种一 分期状态下,仍然有不同程度会有影响。如对远 处转移的不同部位描述、淋巴结转移的不同部位 描述 诊断试验影响处理(部分阳性不手术,剔除-选择 偏移) 44 结果:试验结果 19. 报告根据参考标准结果的目标试验结果(包括 不确定和缺失的结果)的交叉表;对连续型结果, 报告根据参考标准结果的目标试验结果的分布 45 结果:试验结果 20. 报告实施目标试验或参考标准期间的任何 不良事件 真实性评估: 回顾性收集资料,未报告,如CT过敏、麻醉 意外、内镜操作损伤或者出血等 46 结果:结果估计 21. 报告诊断准确性估计结果和统计学不确定性 的测量结果(如95%CI) 缺少估计结果(95%CI) 47 结果:结果估计 22. 报告目标试验里不确定结果,缺失结果和异 常结果是如何处理的 没有具体交待,按照缺失处理(EUS病例数不同) 48
2014/10/15 结果:结果估计 结果:结果估计 23.报告诊斷准确性在不同亚组,不同读取结果 24.如果可能,则报告试验可重复性的估计结果 者或不同中心之间差异的估计 理论上可以,未报告 测量偏移:单中心回顾性研究,缺少估计,直 对每一试验计算Kpa值,包括参考试验 接使用临床报告结果 E不同读取结果者之间的差异如何估计(重新检查 评估读片) 讨论 总体评价 E25讨论研究结果的临床适用性 ■选择偏移 人群特征与代表性(不可切除,类窄不能超声) 可切除息者 Another factor that may affect accuracy in staging of 食臂类窄息者 ophageal cancer is the presence of tinctures that lmt passage of an echoendoscope. Up to one-third of patients 测量偏移 金标准客夙,但未实现盲法评估 somewhat narrowed clinical spectrm of discase he 诊断试验之间影响放化疗对金标准影响 only surgically resectable patients were enrolled in thi sudy, Patients with advanced disease stages were exclu- dod, which may be related to underestimation of both 处理:全部试验重新盲法双评价,计算Kpa sensitivity and accuracy in the detecton of metastasis to lymph nodes. Kappa值计算 如何评估诊断试验结果测量重复性 甲、乙医生阅读同样100张脚部X线片的诊断一政性 肺门淋巴结彼正常 评价方法: Kappa值计算 Kappa值是排除了机遇一致率后的观察一致率 乙医生肺门淋巴蝻核46 察一率(po)=adN 46+32100=78% 机通一事pQF(r;xcN+(2 x)N)/N pc=(56×58y10042100 非机過欢率=1c 非机遇一敢率=100%51%=49% 实际一率=popc 实际一致率=78%51%=27% Kappa值=popc Kappa=27%49%=0.55
2014/10/15 9 结果:结果估计 23. 报告诊断准确性在不同亚组,不同读取结果 者或不同中心之间差异的估计 测量偏移:单中心,回顾性研究,缺少估计,直 接使用临床报告结果 不同读取结果者之间的差异如何估计(重新检查 评估-读片) 49 结果:结果估计 24. 如果可能,则报告试验可重复性的估计结果 理论上可以,未报告 对每一试验计算Kpa值,包括参考试验 50 讨论 25. 讨论研究结果的临床适用性 人群特征与代表性(不可切除,狭窄不能超声) 51 总体评价 选择偏移: – 可切除患者 – 食管狭窄患者 测量偏移 – 金标准客观,但未实现盲法评估 – 诊断试验之间影响/放化疗对金标准影响 – 时间间隔影响/报告人之间影响 处理:全部试验重新盲法双评价,计算Kpa 52 如何评估诊断试验结果测量重复性 评价方法:Kappa值计算 Kappa值是排除了机遇一致率后的观察一致率 53 Kappa值计算 甲、乙医生阅读同样100张胸部X线片的诊断一致性 甲医生 肺门淋巴结核 正常 乙医生 肺门淋巴结核 46 a b 10 56(r1) 正常 12 c d 32 44(r2 正常 12 c d 32 44(r )2 58(c1) 42(c2) 观察一致率(po)= a+d/N po= 46+32/100=78% 机遇一致率(pc)= ((r1 c1)/N+ (r2 c2)/N)/N pc=((5658)/100+(4442)/100)/100 =51% 非机遇一致率=1-pc 非机遇一致率=100%-51%=49% 实际一致率=po-pc 实际一致率= 78%-51%=27% Kappa值=po-pc/1-pc Kappa值 =27%/49%=0.55
2014/10/15 问题:如何进行诊断研究设计 设计要求 同癌是一种常见性肿瘤,通过同镜检查+活检确诊。 处理包括早期胃痛的内镜下治疗、进展期同癌的根治 ■研究目的 性手术治疗和晚期同癌的化疗。采用何种处理方式 研究设计类型 除了根据息者意、病人状态,最主要的依据是同癌 E人群与病例选择 的分期。目前临床上用于同癌分期TNM分期的手段 诊断试验金标准 主包括超产EUS)、增强cT 金标准与诊断试验的实施方法 评价指标: 意使址度物是物分期检一 设计要点1 设计要点2 ■研究目的 研究设计类型: 比较超声同镜、增强cT检查用于同癌侵犯深度 诊断试验评价病例非病例对照):2个评价试 验之间无相互影响,2个试验联合应用时相互 和是否周围淋巴结转移的分期诊斷价值 比较(RcT研究):增加样本,减少息者损客, 成者2个诊断试验之间有明确相互影响 RcT设计比较诊断试验之间相互影响 Randomized controlled trial The NEW ENGLAND JoURNAL of MEDICINE Coronary CT Angiography versus Standard Evaluation n Acute ch a.cane MD MPH PIO 守P 10
2014/10/15 10 问题:如何进行诊断研究设计 胃癌是一种常见恶性肿瘤,通过胃镜检查+活检确诊。 处理包括早期胃癌的内镜下治疗、进展期胃癌的根治 性手术治疗和晚期胃癌的化疗。采用何种处理方式, 除了根据患者意愿、病人状态,最主要的依据是胃癌 的分期。目前临床上用于胃癌分期(TNM分期)的手段 主要包括超声胃镜(EUS)、增强CT。 请设计一项临床研究,比较EUS、增强CT检查用于胃 癌侵犯深度和是否周围淋巴结转移的分期诊断价值。 55 设计要求 研究目的: 研究设计类型: 人群与病例选择: 诊断试验金标准: 金标准与诊断试验的实施方法: 评价指标: 56 设计要点-1 研究目的: 比较超声胃镜、增强CT检查用于胃癌侵犯深度 检查用于胃癌侵犯深度 和是否周围淋巴结转移的分期诊断价值 57 设计要点-2 研究设计类型: – 诊断试验评价(病例-非病例对照):2个评价试 验之间无相互影响,2个试验联合应用时相互 个试验联合应用时相互 作用大小 – 比较(RCT研究):增加样本,减少患者损害, 或者2个诊断试验之间有明确相互影响 58 RCT设计-比较诊断试验之间相互影响 59 Randomized controlled trial