正在加载图片...
第2期 常亮,等:知识图谱的推荐系统综述 ·209· 对于已给出的基于知识图谱推荐系统整体框 用户访问系统时,利用调查问卷中用户信息进行 架,首先在文献中对该推荐系统进行较为全面的 特征抽取,与旅游本体中人物特征关联进行用户 考察,然后围绕该框架对该推荐系统的关键技术 建模。基于用户兴趣权重及用户特征信息计算用 进行分析。在对基于知识图谱的应用情况进行总 户的兴趣度(S)及置信度(CL),得到一个推荐列 结的基础上,对基于知识图谱的推荐系统面临的 表。然后,基于用户评分、交互行为等,利用基于 重点和难点问题进行讨论。 内容和协同过滤技术对信息进行过滤,通过Pear- 2 基于知识图谱的推荐系统 son回归算法进行相似度排序,进而得出推荐列 表。最终结合GIS定位系统再次过滤,并使用 依据推荐过程中知识图谱表现形式,本文将 ICEfaces框架实时更新推荐列表。为了验证推荐 文献中的基于知识图谱的推荐方法大致分为两大 的准确率,作者将推荐结果与用户反馈进行比 类:基于本体的推荐生成、基于开放链接数据 对,结果表明,90%以上用户认为该系统推荐较 (linked open data,LOD)的推荐生成。此外,鉴于 为准确。 近年来将知识图谱嵌入低维向量空间的方法在推 总体来看,基于本体的推荐生成技术的优点 荐领域扮演的角色越来越重,本节将基于图嵌人 在于:能够细粒度化概念之间的上下文关系,增 的推荐生成单独作为一类来考察。 强数据之间的关联性,可以更加细粒度的分析用 2.1基于本体的推荐生成 户的偏好。缺点在于:本体的构建费时,因为现 本体例作为知识图谱的一种体现形式,强调 阶段主要还是通过手工构建,在某些特定领域需 的是概念之间的层级关系,有逻辑学和语义学的 要专家的参与。基于本体的推荐的范围过窄,因 基础,支持简单的自动推理。基于本体的推荐生 为通用的大规模本体少,大多数本体只针对某个 成的主要思路是:利用本体中细粒度的对概念层 具体应用领域构建。此外在实际应用中不同本体 级关系的描述,通过对概念的细粒度的分类描述 之间映射、扩充与合并处理等操作复杂,现实的 来更加精准的对实体特征进行表示,从而挖掘出 知识体系变化时先前构建的本体必须作相应的演 事实中蕴含的深层次信息。融入现有的基于内容 化保持一致性,导致更新困难。新用户问题,当 的推荐o、基于协同过滤的推荐方法中。最后 一个新用户访问系统时,由于没有他的行为数 结合用户当前的上下文信息生成推荐。 据,所以也无法根据他的历史行为预测其兴趣, Niaraki等l较早地提出基于本体的推荐系 从而无法借此给他做个性化推荐。针对上述问 统。以用户模型和上下文模型为基础构建本体知 题,可以从以下方向进一步研究:应用深度学习 识库,基于本体中概念的层级关系采用多准则决 等相关方法半自动甚至自动地构建本体,加快本 策来扩展以用户为中心的路线规划建模技术,最 体的构建过程。对具体的应用可适当地扩大通用 后通过比较判断过程和一致性指标对相关概念进 的、适用范围更广的本体,丰富本体的语义,增强 行加权,确定用户和上下文模型来满足用户的需 本体间的联系。还可以增加对特征的描述,同时 求。将用户和环境结合起来,基于本体中概念的 对特征描述进行推理,从而得出事实中蕴含的结 层级关系,提供以用户为中心的路线规划,克服 论并将其应用于推荐,以此来及时地更新推荐, 了标准建模不足的缺点,提高了系统推荐路线的 使推荐更具多样化。新用户的问题可以利用用户 准确率。与此类似,Dodwad等也是基于本体的 注册时提供的年龄、性别等数据做进行粒度的个 层次结构对概念进行加权,更加细粒度的分析用 性化。借助用户的社交网络账号登录(需要用户 户的偏好。Saraswathib等则针对求职者在工作 授权),导人用户在社交网站上的好友信息,然后 门户网站的海量数据面前无法快速的筛选工作, 给用户推荐其好友喜欢的物品。此外还可以要求 动态地构建本体,通过重排序和相似度算法为用 用户在登录时对一些物品进行反馈,收集用户对 户推荐职位。 这些物品的兴趣信息,再给用户推荐那些和这些 除了上述基于本体的层次结构以及概念之间 物品相似的物品。 的逻辑关系进行推荐之外,还有研究人员基于传 2.2基于LOD的推荐生成 统的推荐算法结合本体完成推荐任务。 基于LOD的推荐生成技术主要思路是:将链 Moreno等u6完成基于本体和协同过滤的混 接数据库中丰富的语义信息融入到现有的方法 合推荐系统SigTur/E-Destination.。首先,基于人口 中,着重考虑用户偏好、项目之间属性相似度。 特征、旅游景点及路线信息构建旅游本体。在新 通过利用LOD中大量相互关联的数据,更加精细对于已给出的基于知识图谱推荐系统整体框 架,首先在文献中对该推荐系统进行较为全面的 考察,然后围绕该框架对该推荐系统的关键技术 进行分析。在对基于知识图谱的应用情况进行总 结的基础上,对基于知识图谱的推荐系统面临的 重点和难点问题进行讨论。 2 基于知识图谱的推荐系统 依据推荐过程中知识图谱表现形式,本文将 文献中的基于知识图谱的推荐方法大致分为两大 类:基于本体的推荐生成、基于开放链接数据 (linked open data,LOD) 的推荐生成。此外,鉴于 近年来将知识图谱嵌入低维向量空间的方法在推 荐领域扮演的角色越来越重,本节将基于图嵌入 的推荐生成单独作为一类来考察。 2.1 基于本体的推荐生成 本体[9]作为知识图谱的一种体现形式,强调 的是概念之间的层级关系,有逻辑学和语义学的 基础,支持简单的自动推理。基于本体的推荐生 成的主要思路是:利用本体中细粒度的对概念层 级关系的描述,通过对概念的细粒度的分类描述 来更加精准的对实体特征进行表示,从而挖掘出 事实中蕴含的深层次信息。融入现有的基于内容 的推荐[10] 、基于协同过滤的推荐方法[11]中。最后 结合用户当前的上下文信息生成推荐[12]。 Niaraki 等 [13]较早地提出基于本体的推荐系 统。以用户模型和上下文模型为基础构建本体知 识库,基于本体中概念的层级关系采用多准则决 策来扩展以用户为中心的路线规划建模技术,最 后通过比较判断过程和一致性指标对相关概念进 行加权,确定用户和上下文模型来满足用户的需 求。将用户和环境结合起来,基于本体中概念的 层级关系,提供以用户为中心的路线规划,克服 了标准建模不足的缺点,提高了系统推荐路线的 准确率。与此类似,Dodwad 等 [14]也是基于本体的 层次结构对概念进行加权,更加细粒度的分析用 户的偏好。Saraswathib 等 [15]则针对求职者在工作 门户网站的海量数据面前无法快速的筛选工作, 动态地构建本体,通过重排序和相似度算法为用 户推荐职位。 除了上述基于本体的层次结构以及概念之间 的逻辑关系进行推荐之外,还有研究人员基于传 统的推荐算法结合本体完成推荐任务。 Moreno 等 [16]完成基于本体和协同过滤的混 合推荐系统 SigTur/E-Destination。首先,基于人口 特征、旅游景点及路线信息构建旅游本体。在新 用户访问系统时,利用调查问卷中用户信息进行 特征抽取,与旅游本体中人物特征关联进行用户 建模。基于用户兴趣权重及用户特征信息计算用 户的兴趣度 (S) 及置信度 (CL),得到一个推荐列 表。然后,基于用户评分、交互行为等,利用基于 内容和协同过滤技术对信息进行过滤,通过 Pear￾son 回归算法进行相似度排序,进而得出推荐列 表。最终结合 GIS 定位系统再次过滤,并使用 ICEfaces 框架实时更新推荐列表。为了验证推荐 的准确率,作者将推荐结果与用户反馈进行比 对,结果表明,90% 以上用户认为该系统推荐较 为准确。 总体来看,基于本体的推荐生成技术的优点 在于:能够细粒度化概念之间的上下文关系,增 强数据之间的关联性,可以更加细粒度的分析用 户的偏好。缺点在于:本体的构建费时,因为现 阶段主要还是通过手工构建,在某些特定领域需 要专家的参与。基于本体的推荐的范围过窄,因 为通用的大规模本体少,大多数本体只针对某个 具体应用领域构建。此外在实际应用中不同本体 之间映射、扩充与合并处理等操作复杂,现实的 知识体系变化时先前构建的本体必须作相应的演 化保持一致性,导致更新困难。新用户问题,当 一个新用户访问系统时,由于没有他的行为数 据,所以也无法根据他的历史行为预测其兴趣, 从而无法借此给他做个性化推荐。针对上述问 题,可以从以下方向进一步研究:应用深度学习 等相关方法半自动甚至自动地构建本体,加快本 体的构建过程。对具体的应用可适当地扩大通用 的、适用范围更广的本体,丰富本体的语义,增强 本体间的联系。还可以增加对特征的描述,同时 对特征描述进行推理,从而得出事实中蕴含的结 论并将其应用于推荐,以此来及时地更新推荐, 使推荐更具多样化。新用户的问题可以利用用户 注册时提供的年龄、性别等数据做进行粒度的个 性化。借助用户的社交网络账号登录 (需要用户 授权),导入用户在社交网站上的好友信息,然后 给用户推荐其好友喜欢的物品。此外还可以要求 用户在登录时对一些物品进行反馈,收集用户对 这些物品的兴趣信息,再给用户推荐那些和这些 物品相似的物品。 2.2 基于 LOD 的推荐生成 基于 LOD 的推荐生成技术主要思路是:将链 接数据库中丰富的语义信息融入到现有的方法 中,着重考虑用户偏好、项目之间属性相似度。 通过利用 LOD 中大量相互关联的数据,更加精细 第 2 期 常亮,等:知识图谱的推荐系统综述 ·209·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有