正在加载图片...
优先出版 袁凯琦,等:医学知识图谱构建技术与研究进展 第35卷第7期 2.2医疗问答系统 人2通过搜集中文开放链接数据中的医疗信息(ICD9、ICD10 问答系统也是知识图谱的典型应用场景。目前在基于知识等)和主流医学站点中的医疗知识(39健康网、寻医问药等) 图谱的问答系统中采用的方法主要包括:基于信息提取的方法构建了医疗知识图谱,并将其应用于上海林康医疗信息技术有 ,利用问句信息结合知识库资源获取候选答案:基于语义解限公司的医疗质量与患者安全辅助监控系统和处方审核智能系 析的方法,将自然语言问句解析成一种逻辑表达形式8,通过统中,前者基于知识图谱来进行抗生素不合理使用的监控、危 这种结构化表达从知识库中寻找答案:基于向量空间建模的方急值预测,后者快速判断处方为合理、疑似不合理和不规范处 法叫,使用向量空间描述自然语言问句以及知识图谱中的实体方,从而促进用药的合理性 和关系,通过机器学习、深度学习等方法生成问答模型进行回将知识图谱应用于医疗决策是目前的研究热点。但是,在 实际应用中,主要存在着两方面的问题:一是缺少完备的全科 早期的医疗问答系统的研究主要集中于信息检索、提取和医学知识图谱,二是医疗决策的可靠性。对于前者,目前基于 摘要技术m0。知识图谱概念的提出,致使问答系统研究热知识图谱实际应用的医疗决策系统,主要还是针对于特定疾病 转移到基于知识图谱的问答系统研究。 Terol!1o等人使用了类型的决策,无法广泛应用,如IBM的 Watson Health主要面 UMLS以及 WordNet两种知识库,设置了10类医学问题类型,向肿瘤和癌症的决策支持,基于巨大的知识库和强大的认知计 利用自然语言处理技术的应用来生成和处理问题的逻辑形式,算能力,为临床医师提供快速的、个性化的循证肿瘤治疗方案 从知识库中提取答案。 Abacha等人10对比了基于医学本体的对于后者,医疗决策是直接关系到使用者的身体健康问题,依 医疗问答系统,结合医学本体、领域知识,NLP相关技术和语靠人工智能进行医疗决策对结果的准确性和可靠性有更高的要 义关系,实现了一个医疗自动问答系统。华东理工大学阮形、求。现阶段,基于知识图谱的医疗决策只是扮演着支持和辅助 王吴奋等人与上海曙光医院合作构建了包括疾病库、证库 的角色 症状库、中草药库和方剂库的中医药知识图谱,并基于该知识 图谱进行中医药问答和辅助开药。该系统通过基于知识图谱的3挑战及研究展望 分词、模板匹配、模板的翻译执行来回答概念、实体、属性 知识图谱是语义网与知识库的融合与升华。知识图谱的优 性值的模板组合问题,并将图谱中存储的数据自动转换成推势是具备强大的语义处理与开放互联能力。对医学领域而言 理引擎适用的推理规则,再结合医生工作站传来的病人事实数由于其专业性、规范性、术语有限性等特点,可以从医学词典、 据,辅助医生开方 医学标准、电子病历等来源获取到高质量数据:另外在科教行 在医疗垂直领域的问答系统研究中,受限于现有医学知识业中,存在着知识管理、语义检索、商业分析、决策支持等需 图谱的推理能力,以及医学知识表示的复杂性,尚未出现重大求,医学知识图谱的研究能推进海量数据的智能处理,催生上 的突破。而反观开放领域,对特定领域专业知识要求不高的情层智能医学的应用。医学知识图谱是大数据与医学的结合,将 况下,IBM的 Watson系统、微软的小冰υ3都是融合传统问答系成为知识图谱和大数据智能的前沿问题, 统和知识图谱的成功案例 1)人工智能 23医疗决策支持系统 人工智能,尤其是深度学习己经在计算机视觉、语音识别 借助医疗知识图谱,医疗决策支持系统可以根据患者症状机器翻译等领域超越了传统算法,而其在医学领域中的知识融 描述及化验数据,给出智能诊断、治疗方案推荐及转诊指南,合与推理等方面的研究潜力还有待挖掘。拥有强大学习能力的 还可以针对医生的诊疗方案进行分析、查漏补缺,减少甚至避深度学习与有着丰富数据储备的知识库相结合,将逐步扩展认 免误诊 知能力,为大规模知识图谱找到更宽广的应用场景。 Angel等人lo设计了一个本体驱动的,基于逻辑推理和概 2)复杂多样的数据源(跨语言,开放域 率统计优化的医学鉴别诊断系统ODDN,系统的知识库框架包 互联网和电子病例带来了医疗数据的爆炸性增长,然而 含一个逻辑规则知识库和一个医学本体知识库,在逻辑规则知些数据在语种、主题、存储等方面都存在较大差异。现有的研 识库中,定义了四种逻辑规则,而医学本体知识库则是综合了究成果多集中在特定数据集上,普遍存在算法准确率低、限制 多个医学本体资源,支持多种本体表示形式,包括RDF、RDFS、条件多、扩展性差等问题,同时知识复用、实体消歧等问题也 OwL和 SPARQL,诊断方法的核心是基于贝叶斯理论进行改有待进一步研究。跨语言医学知识图谱成为当前的研究热点 进。 Martinez- Romero等人o设计的iOSC3系统是一个基于本我国的研究者更应发挥自身在中文信息处理方面的优势。 体针对急性心脏病进行智能监控和诊断的系统,该系统分析患 3)众包技术 者的状况并提供最佳治疗方案的建议,其知识库由OWL本体 众包反馈机制不仅可以有效提高数据质量[43],还能作为 和表示专家知识的一组SwRL规则所构成。王吴奋、张金康等质量评估的重要补充。众包平台与知识库的有机结合,能够修 正机器无法识别的错误,提高知识图谱的质量与性能。39健康 http://www.msxiaoice.com/ 网,寻医问药网的问答区都有专业人士在线解答问题:A+医药优先出版 袁凯琦,等:医学知识图谱构建技术与研究进展 第 35 卷第 7 期 2.2 医疗问答系统 问答系统也是知识图谱的典型应用场景。目前在基于知识 图谱的问答系统中采用的方法主要包括:基于信息提取的方法 [97],利用问句信息结合知识库资源获取候选答案;基于语义解 析的方法,将自然语言问句解析成一种逻辑表达形式[98],通过 这种结构化表达从知识库中寻找答案;基于向量空间建模的方 法[99],使用向量空间描述自然语言问句以及知识图谱中的实体 和关系,通过机器学习、深度学习等方法生成问答模型进行回 答。 早期的医疗问答系统的研究主要集中于信息检索、提取和 摘要技术[100-102]。知识图谱概念的提出,致使问答系统研究热 点转移到基于知识图谱的问答系统研究。Terol[103]等人使用了 UMLS 以及 WordNet 两种知识库,设置了 10 类医学问题类型, 利用自然语言处理技术的应用来生成和处理问题的逻辑形式, 从知识库中提取答案。Abacha 等人[104]对比了基于医学本体的 医疗问答系统,结合医学本体、领域知识,NLP 相关技术和语 义关系,实现了一个医疗自动问答系统。华东理工大学阮彤、 王昊奋等人[4]与上海曙光医院合作构建了包括疾病库、证库、 症状库、中草药库和方剂库的中医药知识图谱,并基于该知识 图谱进行中医药问答和辅助开药。该系统通过基于知识图谱的 分词、模板匹配、模板的翻译执行来回答概念、实体、属性、 属性值的模板组合问题,并将图谱中存储的数据自动转换成推 理引擎适用的推理规则,再结合医生工作站传来的病人事实数 据,辅助医生开方。 在医疗垂直领域的问答系统研究中,受限于现有医学知识 图谱的推理能力,以及医学知识表示的复杂性,尚未出现重大 的突破。而反观开放领域,对特定领域专业知识要求不高的情 况下,IBM 的 Watson 系统、微软的小冰13都是融合传统问答系 统和知识图谱的成功案例。 2.3 医疗决策支持系统 借助医疗知识图谱,医疗决策支持系统可以根据患者症状 描述及化验数据,给出智能诊断、治疗方案推荐及转诊指南, 还可以针对医生的诊疗方案进行分析、查漏补缺,减少甚至避 免误诊。 Ángel 等人[105]设计了一个本体驱动的,基于逻辑推理和概 率统计优化的医学鉴别诊断系统 ODDIN,系统的知识库框架包 含一个逻辑规则知识库和一个医学本体知识库,在逻辑规则知 识库中,定义了四种逻辑规则,而医学本体知识库则是综合了 多个医学本体资源,支持多种本体表示形式,包括 RDF、RDFS、 OWL 和 SPARQL,诊断方法的核心是基于贝叶斯理论进行改 进。Martnez-Romero 等人[106]设计的 iOSC3 系统是一个基于本 体针对急性心脏病进行智能监控和诊断的系统,该系统分析患 者的状况并提供最佳治疗方案的建议,其知识库由 OWL 本体 和表示专家知识的一组 SWRL 规则所构成。王昊奋、张金康等 13 http://www.msxiaoice.com/ 人[27]通过搜集中文开放链接数据中的医疗信息(ICD9、ICD10 等)和主流医学站点中的医疗知识(39 健康网、寻医问药等) 构建了医疗知识图谱,并将其应用于上海林康医疗信息技术有 限公司的医疗质量与患者安全辅助监控系统和处方审核智能系 统中,前者基于知识图谱来进行抗生素不合理使用的监控、危 急值预测,后者快速判断处方为合理、疑似不合理和不规范处 方,从而促进用药的合理性。 将知识图谱应用于医疗决策是目前的研究热点。但是,在 实际应用中,主要存在着两方面的问题:一是缺少完备的全科 医学知识图谱,二是医疗决策的可靠性。对于前者,目前基于 知识图谱实际应用的医疗决策系统,主要还是针对于特定疾病 类型的决策,无法广泛应用,如 IBM 的 Watson Health 主要面 向肿瘤和癌症的决策支持,基于巨大的知识库和强大的认知计 算能力,为临床医师提供快速的、个性化的循证肿瘤治疗方案。 对于后者,医疗决策是直接关系到使用者的身体健康问题,依 靠人工智能进行医疗决策对结果的准确性和可靠性有更高的要 求。现阶段,基于知识图谱的医疗决策只是扮演着支持和辅助 的角色。 3 挑战及研究展望 知识图谱是语义网与知识库的融合与升华。知识图谱的优 势是具备强大的语义处理与开放互联能力。对医学领域而言, 由于其专业性、规范性、术语有限性等特点,可以从医学词典、 医学标准、电子病历等来源获取到高质量数据;另外在科教行 业中,存在着知识管理、语义检索、商业分析、决策支持等需 求,医学知识图谱的研究能推进海量数据的智能处理,催生上 层智能医学的应用。医学知识图谱是大数据与医学的结合,将 成为知识图谱和大数据智能的前沿问题。 1)人工智能 人工智能,尤其是深度学习已经在计算机视觉、语音识别、 机器翻译等领域超越了传统算法,而其在医学领域中的知识融 合与推理等方面的研究潜力还有待挖掘。拥有强大学习能力的 深度学习与有着丰富数据储备的知识库相结合,将逐步扩展认 知能力,为大规模知识图谱找到更宽广的应用场景。 2)复杂多样的数据源(跨语言,开放域) 互联网和电子病例带来了医疗数据的爆炸性增长,然而这 些数据在语种、主题、存储等方面都存在较大差异。现有的研 究成果多集中在特定数据集上,普遍存在算法准确率低、限制 条件多、扩展性差等问题,同时知识复用、实体消歧等问题也 有待进一步研究。跨语言医学知识图谱成为当前的研究热点, 我国的研究者更应发挥自身在中文信息处理方面的优势。 3)众包技术 众包反馈机制不仅可以有效提高数据质量[43],还能作为 质量评估的重要补充。众包平台与知识库的有机结合,能够修 正机器无法识别的错误,提高知识图谱的质量与性能。39 健康 网,寻医问药网的问答区都有专业人士在线解答问题;A+医药
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有