正在加载图片...
·212· 智能系统学报 第14卷 3.1数据采集与预处理 关联规则技术B”、贝叶斯网络技术等自动构建 基于知识图谱的推荐系统的实现首先是数据 用户模型,对用户偏好进行计算。由于用户的兴 采集,包括用户信息、交互信息、项目信息、上下 趣是随着时间不断变化的,偏好也会发生转移, 文信息等。其中,用户信息主要是用户注册信 为了获取用户最新的偏好以保证推荐的精确性, 息、交互信息从日志中获取、上下文信息由用户 需要实时对用户偏好进行更新,主要用到的方法 自主录人或者通过传感器获取、项目信息从各大 包括动态偏好建模技术、自适应技术等。 垂直网站及百科网站中获取。在现有文献中, 3.4基于知识图谱的推荐 Gradgyenge等2利用SPARQL语句从DBpedia中 该部分是整个基于知识图谱推荐系统的核 抽取音乐相关数据;Dodwad等o从工作门户网站 心。传统的推荐系统中,例如协同过滤、基于内 中抽取数据。 容的推荐等基本算法同样也可以与基于知识图谱 3.2知识图谱的构建 的推荐系统结合。在该过程中,主要是把知识图 知识图谱构建过程主要包括四个阶段:信息 谱作为一个语义丰富、逻辑推理能力强的数据集 抽取、知识融合、知识加工、知识更新。信息抽取 融入到推荐生成过程中。本文第2节已经从基于 阶段旨在从异构数据源中自动抽取信息得到候选 本体、基于LOD以及基于图嵌入的推荐生成3个 知识单元,相关技术有实体抽取、关系抽取、属性 方面对基于知识图谱的推荐进行了考察。其中不 抽取。如Liu等B利用K-最近邻算法和条件随机 仅涉及到传统的推荐算法,还包括图算法、相似 模型,实现了对Twitter文本数据中实体的识别。 性度量、贝叶斯网络等相关机器学习算法的应 知识融合阶段的目的是消除概念的歧义,剔除冗 用。尤其是,文献[24]中结合最短路径和K步马 余和错误概念,从而保证知识的质量,它包括实 体链接和知识合并。比如苹果既可以代表水果也 尔科夫链完成推荐任务;文献[18]中结合基于内 可以代表苹果公司,必须增加更多的描述信息来 容的推荐算法为用户进行推荐;文献[40]通过结 加以区别,用户的点击操作可以采用二进制量化 合贝叶斯网络生成推荐列表。 表示。文献[21]利用Babelfy,对给定的单词返回 3.5推荐效用评价 相关的wordNet以及相关的维基百科页面。想 效用评价在整个推荐流程中非常重要。朱郁 要得到结构化、网络化的知识体系,还需要经历 筱等对推荐系统的评价指标进行了综述,从准 知识加工的过程。它包括三方面内容:本体构 确度、基于排序加权、覆盖率以及多样性指标等 建、知识推理和质量评估。如Wang等B利用跨 4个方面来对系统进行评价。 语言知识链接方法来构建中英文本体库,使二者 在基于知识图谱的环境下,推荐系统的多样 相互确认,从而提高了中文与英文关系的准确 性受到更多关注。Vargas等基于多样性提出了 度。知识图谱的内容也需要与时俱进,因此需要 3个指标:选择、发现和相关性。 不断的更新迭代,但目前的技术更新起来十分困 4基于知识图谱的推荐系统应用进展 难B。 3.3用户偏好获取 基于知识图谱的推荐系统具有两个鲜明的特 推荐系统用户偏好的获取不仅受到项目本身 征:语义丰富、个性化,从而使其在工业领域具有 影响还会受到上下文影响。目前关于上下文的定 广阔的应用前景。本节就基于知识图谱的推荐系 义,还没有一个统一的说法,这里引用王立才等四 统的应用进展进行总结分析,表1中列举分析了 给出的定义“上下文就是指任何可以用来描述实 些典型案例。 体情况的信息,其中实体是指用户与应用程序交 1)旅游推荐 互相关的客体,也包括用户和应用程序本身”。 旅游推荐近年来获得越来越多的关注。旅游 用户偏好的获取是为了有针对性地为用户提 推荐不仅包括旅游景点的推荐,还涉及周边服 供服务,为用户提供量身打造的个性化推荐。一 务。传统的推荐系统主要以列表的形式向用户展 般用户偏好的获取分为显式偏好获取和隐式偏好 示推荐的内容,而在旅游推荐中,为了使用户更 获取。显式偏好获取需要用户提供自身的属性信 清楚地了解推荐项目的信息,可以选择基于地图 息或者偏好信息,其精确性与用户的反馈信息和 的方式来展示推荐内容。典型的案例有:文献[13] 准确度有关。隐式偏好获取是指收集和记录用户 将本体与传统的推荐算法结合为用户做出推荐 历史行为,并采用聚类技术B、神经网络技术B6、 首先根据注册信息构建用户画像计算用户兴趣度3.1 数据采集与预处理 基于知识图谱的推荐系统的实现首先是数据 采集,包括用户信息、交互信息、项目信息、上下 文信息等。其中,用户信息主要是用户注册信 息、交互信息从日志中获取、上下文信息由用户 自主录入或者通过传感器获取、项目信息从各大 垂直网站及百科网站中获取。在现有文献中, Gradgyenge 等 [29]利用 SPARQL 语句从 DBpedia 中 抽取音乐相关数据;Dodwad 等 [30]从工作门户网站 中抽取数据。 3.2 知识图谱的构建 知识图谱构建过程主要包括四个阶段:信息 抽取、知识融合、知识加工、知识更新。信息抽取 阶段旨在从异构数据源中自动抽取信息得到候选 知识单元,相关技术有实体抽取、关系抽取、属性 抽取。如 Liu 等 [31]利用 K-最近邻算法和条件随机 模型,实现了对 Twitter 文本数据中实体的识别。 知识融合阶段的目的是消除概念的歧义,剔除冗 余和错误概念,从而保证知识的质量,它包括实 体链接和知识合并。比如苹果既可以代表水果也 可以代表苹果公司,必须增加更多的描述信息来 加以区别,用户的点击操作可以采用二进制量化 表示。文献[21]利用 Babelfy,对给定的单词返回 相关的 wordNet[32]以及相关的维基百科页面。想 要得到结构化、网络化的知识体系,还需要经历 知识加工的过程。它包括三方面内容:本体构 建、知识推理和质量评估。如 Wang 等 [33]利用跨 语言知识链接方法来构建中英文本体库,使二者 相互确认,从而提高了中文与英文关系的准确 度。知识图谱的内容也需要与时俱进,因此需要 不断的更新迭代,但目前的技术更新起来十分困 难 [34]。 3.3 用户偏好获取 推荐系统用户偏好的获取不仅受到项目本身 影响还会受到上下文影响。目前关于上下文的定 义,还没有一个统一的说法,这里引用王立才等[12] 给出的定义“上下文就是指任何可以用来描述实 体情况的信息,其中实体是指用户与应用程序交 互相关的客体,也包括用户和应用程序本身”。 用户偏好的获取是为了有针对性地为用户提 供服务,为用户提供量身打造的个性化推荐。一 般用户偏好的获取分为显式偏好获取和隐式偏好 获取。显式偏好获取需要用户提供自身的属性信 息或者偏好信息,其精确性与用户的反馈信息和 准确度有关。隐式偏好获取是指收集和记录用户 历史行为,并采用聚类技术[35] 、神经网络技术[36] 、 关联规则技术[37] 、贝叶斯网络技术[38]等自动构建 用户模型,对用户偏好进行计算。由于用户的兴 趣是随着时间不断变化的,偏好也会发生转移, 为了获取用户最新的偏好以保证推荐的精确性, 需要实时对用户偏好进行更新,主要用到的方法 包括动态偏好建模技术、自适应技术等。 3.4 基于知识图谱的推荐 该部分是整个基于知识图谱推荐系统的核 心。传统的推荐系统中,例如协同过滤、基于内 容的推荐等基本算法同样也可以与基于知识图谱 的推荐系统结合。在该过程中,主要是把知识图 谱作为一个语义丰富、逻辑推理能力强的数据集 融入到推荐生成过程中。本文第 2 节已经从基于 本体、基于 LOD 以及基于图嵌入的推荐生成 3 个 方面对基于知识图谱的推荐进行了考察。其中不 仅涉及到传统的推荐算法,还包括图算法、相似 性度量[39] 、贝叶斯网络等相关机器学习算法的应 用。尤其是,文献[24]中结合最短路径和 K 步马 尔科夫链完成推荐任务;文献[18]中结合基于内 容的推荐算法为用户进行推荐;文献[40]通过结 合贝叶斯网络生成推荐列表。 3.5 推荐效用评价 效用评价在整个推荐流程中非常重要。朱郁 筱等[41]对推荐系统的评价指标进行了综述,从准 确度、基于排序加权、覆盖率以及多样性指标等 4 个方面来对系统进行评价。 在基于知识图谱的环境下,推荐系统的多样 性受到更多关注。Vargas 等 [42]基于多样性提出了 3 个指标:选择、发现和相关性。 4 基于知识图谱的推荐系统应用进展 基于知识图谱的推荐系统具有两个鲜明的特 征:语义丰富、个性化,从而使其在工业领域具有 广阔的应用前景。本节就基于知识图谱的推荐系 统的应用进展进行总结分析,表 1 中列举分析了 一些典型案例。 1) 旅游推荐 旅游推荐近年来获得越来越多的关注。旅游 推荐不仅包括旅游景点的推荐,还涉及周边服 务。传统的推荐系统主要以列表的形式向用户展 示推荐的内容,而在旅游推荐中,为了使用户更 清楚地了解推荐项目的信息,可以选择基于地图 的方式来展示推荐内容。典型的案例有:文献[13] 将本体与传统的推荐算法结合为用户做出推荐, 首先根据注册信息构建用户画像计算用户兴趣度 ·212· 智 能 系 统 学 报 第 14 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有