3.1 数据采集与预处理基于知识图谱的推荐系统的实现首先是数据采集，包

正在加载图片...

·212· 智能系统学报第14卷 3.1数据采集与预处理关联规则技术B”、贝叶斯网络技术等自动构建基于知识图谱的推荐系统的实现首先是数据用户模型，对用户偏好进行计算。由于用户的兴采集，包括用户信息、交互信息、项目信息、上下趣是随着时间不断变化的，偏好也会发生转移，文信息等。其中，用户信息主要是用户注册信为了获取用户最新的偏好以保证推荐的精确性，息、交互信息从日志中获取、上下文信息由用户需要实时对用户偏好进行更新，主要用到的方法自主录人或者通过传感器获取、项目信息从各大包括动态偏好建模技术、自适应技术等。垂直网站及百科网站中获取。在现有文献中， 3.4基于知识图谱的推荐 Gradgyenge等2利用SPARQL语句从DBpedia中该部分是整个基于知识图谱推荐系统的核抽取音乐相关数据；Dodwad等o从工作门户网站心。传统的推荐系统中，例如协同过滤、基于内中抽取数据。容的推荐等基本算法同样也可以与基于知识图谱 3.2知识图谱的构建的推荐系统结合。在该过程中，主要是把知识图知识图谱构建过程主要包括四个阶段：信息谱作为一个语义丰富、逻辑推理能力强的数据集抽取、知识融合、知识加工、知识更新。信息抽取融入到推荐生成过程中。本文第2节已经从基于阶段旨在从异构数据源中自动抽取信息得到候选本体、基于LOD以及基于图嵌入的推荐生成3个知识单元，相关技术有实体抽取、关系抽取、属性方面对基于知识图谱的推荐进行了考察。其中不抽取。如Liu等B利用K-最近邻算法和条件随机仅涉及到传统的推荐算法，还包括图算法、相似模型，实现了对Twitter文本数据中实体的识别。性度量、贝叶斯网络等相关机器学习算法的应知识融合阶段的目的是消除概念的歧义，剔除冗用。尤其是，文献[24]中结合最短路径和K步马余和错误概念，从而保证知识的质量，它包括实体链接和知识合并。比如苹果既可以代表水果也尔科夫链完成推荐任务；文献[18]中结合基于内可以代表苹果公司，必须增加更多的描述信息来容的推荐算法为用户进行推荐；文献[40]通过结加以区别，用户的点击操作可以采用二进制量化合贝叶斯网络生成推荐列表。表示。文献[21]利用Babelfy,对给定的单词返回 3.5推荐效用评价相关的wordNet以及相关的维基百科页面。想效用评价在整个推荐流程中非常重要。朱郁要得到结构化、网络化的知识体系，还需要经历筱等对推荐系统的评价指标进行了综述，从准知识加工的过程。它包括三方面内容：本体构确度、基于排序加权、覆盖率以及多样性指标等建、知识推理和质量评估。如Wang等B利用跨 4个方面来对系统进行评价。语言知识链接方法来构建中英文本体库，使二者在基于知识图谱的环境下，推荐系统的多样相互确认，从而提高了中文与英文关系的准确性受到更多关注。Vargas等基于多样性提出了度。知识图谱的内容也需要与时俱进，因此需要 3个指标：选择、发现和相关性。不断的更新迭代，但目前的技术更新起来十分困 4基于知识图谱的推荐系统应用进展难B。 3.3用户偏好获取基于知识图谱的推荐系统具有两个鲜明的特推荐系统用户偏好的获取不仅受到项目本身征：语义丰富、个性化，从而使其在工业领域具有影响还会受到上下文影响。目前关于上下文的定广阔的应用前景。本节就基于知识图谱的推荐系义，还没有一个统一的说法，这里引用王立才等四统的应用进展进行总结分析，表1中列举分析了给出的定义“上下文就是指任何可以用来描述实些典型案例。体情况的信息，其中实体是指用户与应用程序交 1)旅游推荐互相关的客体，也包括用户和应用程序本身”。旅游推荐近年来获得越来越多的关注。旅游用户偏好的获取是为了有针对性地为用户提推荐不仅包括旅游景点的推荐，还涉及周边服供服务，为用户提供量身打造的个性化推荐。一务。传统的推荐系统主要以列表的形式向用户展般用户偏好的获取分为显式偏好获取和隐式偏好示推荐的内容，而在旅游推荐中，为了使用户更获取。显式偏好获取需要用户提供自身的属性信清楚地了解推荐项目的信息，可以选择基于地图息或者偏好信息，其精确性与用户的反馈信息和的方式来展示推荐内容。典型的案例有：文献[13] 准确度有关。隐式偏好获取是指收集和记录用户将本体与传统的推荐算法结合为用户做出推荐历史行为，并采用聚类技术B、神经网络技术B6、首先根据注册信息构建用户画像计算用户兴趣度3.1 数据采集与预处理基于知识图谱的推荐系统的实现首先是数据采集，包括用户信息、交互信息、项目信息、上下文信息等。其中，用户信息主要是用户注册信息、交互信息从日志中获取、上下文信息由用户自主录入或者通过传感器获取、项目信息从各大垂直网站及百科网站中获取。在现有文献中， Gradgyenge 等 [29]利用 SPARQL 语句从 DBpedia 中抽取音乐相关数据；Dodwad 等 [30]从工作门户网站中抽取数据。 3.2 知识图谱的构建知识图谱构建过程主要包括四个阶段：信息抽取、知识融合、知识加工、知识更新。信息抽取阶段旨在从异构数据源中自动抽取信息得到候选知识单元，相关技术有实体抽取、关系抽取、属性抽取。如 Liu 等 [31]利用 K-最近邻算法和条件随机模型，实现了对 Twitter 文本数据中实体的识别。知识融合阶段的目的是消除概念的歧义，剔除冗余和错误概念，从而保证知识的质量，它包括实体链接和知识合并。比如苹果既可以代表水果也可以代表苹果公司，必须增加更多的描述信息来加以区别，用户的点击操作可以采用二进制量化表示。文献[21]利用 Babelfy，对给定的单词返回相关的 wordNet[32]以及相关的维基百科页面。想要得到结构化、网络化的知识体系，还需要经历知识加工的过程。它包括三方面内容：本体构建、知识推理和质量评估。如 Wang 等 [33]利用跨语言知识链接方法来构建中英文本体库，使二者相互确认，从而提高了中文与英文关系的准确度。知识图谱的内容也需要与时俱进，因此需要不断的更新迭代，但目前的技术更新起来十分困难 [34]。 3.3 用户偏好获取推荐系统用户偏好的获取不仅受到项目本身影响还会受到上下文影响。目前关于上下文的定义，还没有一个统一的说法，这里引用王立才等[12] 给出的定义“上下文就是指任何可以用来描述实体情况的信息，其中实体是指用户与应用程序交互相关的客体，也包括用户和应用程序本身”。用户偏好的获取是为了有针对性地为用户提供服务，为用户提供量身打造的个性化推荐。一般用户偏好的获取分为显式偏好获取和隐式偏好获取。显式偏好获取需要用户提供自身的属性信息或者偏好信息，其精确性与用户的反馈信息和准确度有关。隐式偏好获取是指收集和记录用户历史行为，并采用聚类技术[35] 、神经网络技术[36] 、关联规则技术[37] 、贝叶斯网络技术[38]等自动构建用户模型，对用户偏好进行计算。由于用户的兴趣是随着时间不断变化的，偏好也会发生转移，为了获取用户最新的偏好以保证推荐的精确性，需要实时对用户偏好进行更新，主要用到的方法包括动态偏好建模技术、自适应技术等。 3.4 基于知识图谱的推荐该部分是整个基于知识图谱推荐系统的核心。传统的推荐系统中，例如协同过滤、基于内容的推荐等基本算法同样也可以与基于知识图谱的推荐系统结合。在该过程中，主要是把知识图谱作为一个语义丰富、逻辑推理能力强的数据集融入到推荐生成过程中。本文第 2 节已经从基于本体、基于 LOD 以及基于图嵌入的推荐生成 3 个方面对基于知识图谱的推荐进行了考察。其中不仅涉及到传统的推荐算法，还包括图算法、相似性度量[39] 、贝叶斯网络等相关机器学习算法的应用。尤其是，文献[24]中结合最短路径和 K 步马尔科夫链完成推荐任务；文献[18]中结合基于内容的推荐算法为用户进行推荐；文献[40]通过结合贝叶斯网络生成推荐列表。 3.5 推荐效用评价效用评价在整个推荐流程中非常重要。朱郁筱等[41]对推荐系统的评价指标进行了综述，从准确度、基于排序加权、覆盖率以及多样性指标等 4 个方面来对系统进行评价。在基于知识图谱的环境下，推荐系统的多样性受到更多关注。Vargas 等 [42]基于多样性提出了 3 个指标：选择、发现和相关性。 4 基于知识图谱的推荐系统应用进展基于知识图谱的推荐系统具有两个鲜明的特征：语义丰富、个性化，从而使其在工业领域具有广阔的应用前景。本节就基于知识图谱的推荐系统的应用进展进行总结分析，表 1 中列举分析了一些典型案例。 1) 旅游推荐旅游推荐近年来获得越来越多的关注。旅游推荐不仅包括旅游景点的推荐，还涉及周边服务。传统的推荐系统主要以列表的形式向用户展示推荐的内容，而在旅游推荐中，为了使用户更清楚地了解推荐项目的信息，可以选择基于地图的方式来展示推荐内容。典型的案例有：文献[13] 将本体与传统的推荐算法结合为用户做出推荐，首先根据注册信息构建用户画像计算用户兴趣度 ·212· 智能系统学报第 14 卷

<<向上翻页向下翻页>>