历安毛子代枚大兽 知识表示学习 XIDIAN UNIVERSITY 1.知识图谱 2.知识图补全 3.知识表示学习 2
1.知识图谱 2.知识图补全 3.知识表示学习 知识表示学习 2
历安毛子种枝大学 1 知识图谱 XIDIAN UNIVERSITY ● 当你在百度搜索时,搜索结果右侧的联想,就来自于知识图谱技术的应用: ● 你问百度某个字怎么念,答案也来自知识图谱的应用 ● 你和度秘聊天,问他中国女足的教练是谁、都取得了哪些成就?姚明的妻子 是谁?等等,背后都是知识图谱在发挥作用。 Google 姚明的爱子是谁 X↓Q Q全部日图片国新间回视领:更多 设适工具 找到的4,160.000条话果(用时065秒】 姚明/配偶 葉莉 话墙时同:207年
1 知识图谱 3 当你在百度搜索时,搜索结果右侧的联想,就来自于知识图谱技术的应用; 你问百度某个字怎么念,答案也来自知识图谱的应用 你和度秘聊天,问他中国女足的教练是谁、都取得了哪些成就?姚明的妻子 是谁?等等,背后都是知识图谱在发挥作用
历要毛子种枝大票 1 知识图谱 XIDIAN UNIVERSITY ●知识图谱于2012年由Google公司正式提出,其旨在利用多方面的信息提升搜 索引擎的效果。搜索引擎要做的不仅仅是返回匹配到的关键词,而是要真正 理解搜索语句的语义,理解用户的意图。因此,谷歌的搜索引擎会根据搜索 语句中提及的实体信息进行知识检索,并展示与其密切相关的实体信息。 ·现在,知识图谱已经广泛应用于搜索、地图、金融、问答系统、智能对话系 统、个性化推荐系统等任务中,越来越多的应用,都依赖知识图谱。 知识图谱一就是通过不同事物的关联性形成一个图状的知识结构,对机器 来说就是图谱。建立知识图谱的过程本质上就是在建立认知,存储和理解知 识的过程。每个人都有自己掌握的知识,拥有不同的知识结构,本质就是不 同的知识图谱。你的知识结构取决于你获取和形成知识的能力。 ● Freebase,Yago,DBPedia,Wikidata
1 知识图谱 4 知识图谱于2012年由Google公司正式提出,其旨在利用多方面的信息提升搜 索引擎的效果。搜索引擎要做的不仅仅是返回匹配到的关键词,而是要真正 理解搜索语句的语义,理解用户的意图。因此,谷歌的搜索引擎会根据搜索 语句中提及的实体信息进行知识检索,并展示与其密切相关的实体信息。 现在,知识图谱已经广泛应用于搜索、地图、金融、问答系统、智能对话系 统、个性化推荐系统等任务中, 越来越多的应用,都依赖知识图谱。 知识图谱——就是通过不同事物的关联性形成一个图状的知识结构,对机器 来说就是图谱。建立知识图谱的过程本质上就是在建立认知,存储和理解知 识的过程。每个人都有自己掌握的知识,拥有不同的知识结构,本质就是不 同的知识图谱。你的知识结构取决于你获取和形成知识的能力。 Freebase,Yago,DBPedia,Wikidata
历安毛子代枝士学 知识图谱 XIDIAN UNIVERSITY ● 知识图谱描述了事物及概念之间的联系。具体的事物与抽象的概念统称为实 体(entity),实体之间的联系称为关系(relation)。知识图谱一般的存 储形式为三元组。以“姚明的出生地是上海市”这一客观事实为例,存储时 会将其切分为(头实体,关系,尾实体)形式,即(姚明,出生地,上海市 叶莉 上海市 配偶 出生地 姚明 实体 身高 关系 229厘米 5
1 知识图谱 5 知识图谱描述了事物及概念之间的联系。具体的事物与抽象的概念统称为实 体(entity),实体之间的联系称为关系(relation)。知识图谱一般的存 储形式为三元组。以“姚明的出生地是上海市”这一客观事实为例,存储时 会将其切分为(头实体,关系,尾实体)形式,即(姚明,出生地,上海市 )。 姚明 叶莉 配偶 上海市 出生地 229厘米 身高 实体 关系
历安毛子种枚大兽 1 知识图谱 XIDIAN UNIVERSITY 3“ 第73届奥斯 蜜员 卡展佳外语片 论 事件 以女每 电影 其他主病 行程 出生日用 197902.03
1 知识图谱
○. 王小客 袁越 朱智明 王文涓 倪新海 李海燕 静脉血栓形成 张久贾 李静 栓 柯元南 陈江天 杨跃进 彭伟 鲁卫星 并发症 王云 刘红 高连如 费宇行 周红 市水朋 唐浩勋 心血管内科 关医生 格 宋云虎 王 相关疾 贾海忠 检查 心脏杂音 科室 李军 王欣 丙酸钠 超声心动描记术 呼吸闲难 心力哀喝 李平 奥卡西平 侯晓中 徐浩 黄力 氨苯蝶 治疗 发病部位 王俊华 水肿 茶隔 林利 禁忌 宋成运 药物治疗 临床表现 布美他尼 区吐 醋酸氢化可的松 氨力本 伐他订钙 心脏 醋酸可的松阿替洛尔 苄塞图 单硝酸异山梨酯 禁忌药物 盐酸拉贝洛尔 安钠 疲劳 恶心 盐酸阿卧鸭啡 压素西洛他唑 咳嗽 黄疸 咯血 氢 化可利达列地尔
1 知识图谱
历些毛子种枚大学 1知识图谱 XIDIAN UNIVERSITY 百度知识图谱发展历程 Pre-KG 垂类领域知识图谱 通用蜘识图请 通用/行业知识图谱+多元异构 (-2013) (2014-2015) (2016-2017) (2018-与 发布知识中台 规模化行业落地 多模态 知识图谐 行业 知识图谱 知识图谱 自学习 落地百度 事件图谱 知识生产 各产品线 规模化落地 全流程平台化 ·50亿实体,5500亿事实 知识图谐 图数据库 百度搜索 立项 图谱问答 日均响应400亿次请求 2012 2013 2014 2015 2016 2017 2018 2019 2020
1 知识图谱 8
历安毛子代枚大等 2知识图谱补全 XIDIAN UNIVERSITY 然而,这些知识图谱远非到达完备的水平。 Freebase中缺失的关系与比例情况 缺失的关系 缺失比例 PROFESSION 68% PLACE OF BIRTH 71% NATIONALITY 75% EDUCATION 91% SPOUSES 92% PARENTS 94% CHILDREN 94% SIBLINGS 96% ETHNICITY 99% ·知识图谱补全是指向缺失的或者未完善的知识图谱中添加实体或者关系,以 及实体或者关系的属性(1abel)。 9
2 知识图谱补全 9 • 然而,这些知识图谱远非到达完备的水平。 • 知识图谱补全是指向缺失的或者未完善的知识图谱中添加实体或者关系,以 及实体或者关系的属性(label)。 缺失的关系 缺失比例 PROFESSION 68% PLACE OF BIRTH 71% NATIONALITY 75% EDUCATION 91% SPOUSES 92% PARENTS 94% CHILDREN 94% SIBLINGS 96% ETHNICITY 99% Freebase中缺失的关系与比例情况
历些毛子代枝大学 3知识表示学习 XIDIAN UNIVERSITY 知识图谱补全的方法可以分为两大类:第一类是指从外部多源信 息中抽取出需要的三元组信息加入到知识图谱中;第二类是指从 不完备的知识图谱中进行推理推断,也就是基于知识表示学习。 本课程所讲的知识图谱补全指的是第二类。 ·什么是知识表示学习? 简单的说,知识表示学习就是将知识图谱中的实体和关系表示 成低维向量。基于实体和关系的表示,就可以完成各种推理、预测 任务。 10
3 知识表示学习 10 • 知识图谱补全的方法可以分为两大类:第一类是指从外部多源信 息中抽取出需要的三元组信息加入到知识图谱中;第二类是指从 不完备的知识图谱中进行推理推断,也就是基于知识表示学习。 本课程所讲的知识图谱补全指的是第二类。 • 什么是知识表示学习? 简单的说,知识表示学习就是将知识图谱中的实体和关系表示 成低维向量。基于实体和关系的表示,就可以完成各种推理、预测 任务
历安毛子代枚大浮 3知识表示学习 XIDIAN UNIVERSITY ▣知识表示学习的方法有哪些: ·基于翻译的表示学习方法。 把表示学习看成翻译空间的翻译操作 ·图神经网络方法。 R-GCN Input DistMult 图神经网络由于其天然的可以处理 图结构数据,而知识图谱属于图结 h7Mt Score 构数据,因此展现出了良好的表达 能力,与传统的神经网络作出区分。 Encoder Decoder ·基于信息融合的方法。 在翻译模型的基础上融合语言信息。 11
3 知识表示学习 11 知识表示学习的方法有哪些: • 基于翻译的表示学习方法。 把表示学习看成翻译空间的翻译操作 • 图神经网络方法。 • 基于信息融合的方法。 在翻译模型的基础上融合语言信息。 Score Encoder Decoder T h M t Input R-GCN DistMult 图神经网络由于其天然的可以处理 图结构数据,而知识图谱属于图结 构数据,因此展现出了良好的表达 能力,与传统的神经网络作出区分