接到 WordNet synsets。最后基于声音和音乐知识图谱利用基于

正在加载图片...

第2期常亮，等：知识图谱的推荐系统综述 ·211 接到WordNet synsets。最后基于声音和音乐知识 2.3 基于图嵌入的推荐生成图谱利用基于实体的邻居项目匹配和基于路径的随着Deepwalk2的提出，图嵌入技术开始受邻居项目匹配为用户进行推荐。由于系统通过与到学术界以及工业界的关注。其基本原理是基于外部的知识库关联在很大程度上补充了知识库中随机游走等算法对图中节点进行采样生成节点序的语义信息，使得推荐更加准确、覆盖面更广。列，然后通过神经网络或者是其他机器学习算法 Heitmann等2a提出利用LOD构建一个开放将节点序列以及边映射到底维向量空间。图嵌入的协同过滤推荐系统。传统的推荐算法由于其对作为一种更为广泛的图表示学习方法，已经被应数据的需求门槛比较高，这使得新服务提供商难用到推荐领域，并且取得了较好的效果。以与领域中的现有推荐服务进行竞争。文献[22] Laszleó等26较早将图嵌入技术应用于推荐领中主要利用LOD来解决获取构建推荐系统数据域。将Movielens中电影与用户嵌入到同一个向的问题。实现步骤是：将来自不同来源的用户项量空间，进而计算用户与电影的空间距离，生成目连接的数据集成到通用的词汇表、将数据的表推荐列表。Wang等P做了同样的工作，将医学知示从RDF图转换为用户项目矩阵、在用户项目矩识图谱、疾病-患者二部图、疾病-药物二部图分别阵中应用特定的协同过滤算法。最后通过一个真嵌入低维向量空间，为病患推荐更为安全的药物实的协同过滤音乐推荐系统，利用LOD丰富数据治疗方式。通过加权平均将知识图谱与二部图结语义信息，在只使用原有数据时平均精度为2%，合生成包含更加细粒度属性信息的患者和平均召回率为7%，在加入链接数据库之后平均精药物向量。最终生成对给定患者的药物top-k 度为14%，平均召回率为33%，证明其准确高效性。列表。 Ostuni等2更进一步融合LOD中隐含的语义 Palumbo等21针对基于知识图谱的推荐生成反馈信息，提出基于隐式语义反馈的路径算法提出一种通用的向量化模型entity.2rec。利用一种 (SPrank)。基于路径的特征对数据集进行挖掘，以神经网络模型将知识图谱中的节点依据相连接的捕获项目之间的复杂关系。SPrank的主要思想是属性值训练为向量的模式，通过余弦相似度计算探索语义图中的路径，以便找到与用户感兴趣的用户项目相关性，进而利用机器学习排序函数进项目相关的项目。从这些路径的分析中，提取基行推荐列表的生成。首先利用SPARQL语句将于路径的特征，并利用随机森林与渐变增强回归知识图谱分解为属性子图，针对每个属性子图设树相结合的学习算法来生成推荐列表。置目标函数： Ristoski等24提出一种基于LOD的混合多策 max ∑(-logZ.+∑x,m,)x,(e) 略推荐系统。将基础推荐结果与通用的推荐结果 n,EN(e) 相结合形成最终的推荐结果。基础推荐利用生成特定属性的用户和项目的特征向量，其中： LOD中丰富的数据信息结合基于协同过滤和基 Z.=∑exp(,(e)-x,) 于内容的推荐，通用推荐是针对全球流行度得分进行推荐，对于所有的用户都是一样的。对于基然后通过：础推荐使用的是基于内容、项目的协同过滤以及 s(p(u),x(i)),p feedback 利用从DBpedia中获取的丰富的数据信息进行基 Pp(u,i) 1 sx,@,们其他于内容的推荐，通用推荐使用不同的推荐器进行 R.(u. 组合。然后利用K.M.Ting等2提出的堆叠模型计算用户项目之间的相关性。最后分别通过将基础与通用推荐器结合起来。最后通过计算F- 机器学习算法Adrank和LambdaMart生成推荐 Score的值来衡量推荐的准确度，结果表明，本策列表。略在一定程度上提高了推荐的准确率。 3基于知识图谱的推荐系统关键技术总体来看，基于LOD的推荐生成技术优点在于：数据关联表达很强、逻辑性强并具备一定的基于知识图谱的推荐系统综合了知识图谱和推理能力，可以自动发现一些隐含的语义信息，传统推荐系统的特点，成为了一个新的研究主能够提高推荐准确度。但是，这种方式也存在缺题，目前正处于初始发展阶段。在第2章考察相点：由于推荐的过程依赖于外部知识库，因此外关研究工作的基础上，本节主要对第1章中提出部知识库的完备与否对推荐结果的影响巨大，推的基于知识图谱的框架中的关键技术和研究现状荐多样性问题以及计算量大等问题有待解决。进行进一步的分析。接到 WordNet synsets。最后基于声音和音乐知识图谱利用基于实体的邻居项目匹配和基于路径的邻居项目匹配为用户进行推荐。由于系统通过与外部的知识库关联在很大程度上补充了知识库中的语义信息，使得推荐更加准确、覆盖面更广。 Heitmann 等 [22]提出利用 LOD 构建一个开放的协同过滤推荐系统。传统的推荐算法由于其对数据的需求门槛比较高，这使得新服务提供商难以与领域中的现有推荐服务进行竞争。文献[22] 中主要利用 LOD 来解决获取构建推荐系统数据的问题。实现步骤是：将来自不同来源的用户项目连接的数据集成到通用的词汇表、将数据的表示从 RDF 图转换为用户项目矩阵、在用户项目矩阵中应用特定的协同过滤算法。最后通过一个真实的协同过滤音乐推荐系统，利用 LOD 丰富数据语义信息，在只使用原有数据时平均精度为 2%，平均召回率为 7%，在加入链接数据库之后平均精度为 14%，平均召回率为 33%，证明其准确高效性。 Ostuni 等 [23]更进一步融合 LOD 中隐含的语义反馈信息，提出基于隐式语义反馈的路径算法 (SPrank)。基于路径的特征对数据集进行挖掘，以捕获项目之间的复杂关系。SPrank 的主要思想是探索语义图中的路径，以便找到与用户感兴趣的项目相关的项目。从这些路径的分析中，提取基于路径的特征，并利用随机森林与渐变增强回归树相结合的学习算法来生成推荐列表。 Ristoski 等 [24]提出一种基于 LOD 的混合多策略推荐系统。将基础推荐结果与通用的推荐结果相结合形成最终的推荐结果。基础推荐利用 LOD 中丰富的数据信息结合基于协同过滤和基于内容的推荐，通用推荐是针对全球流行度得分进行推荐，对于所有的用户都是一样的。对于基础推荐使用的是基于内容、项目的协同过滤以及利用从 DBpedia 中获取的丰富的数据信息进行基于内容的推荐，通用推荐使用不同的推荐器进行组合。然后利用 K.M.Ting 等 [25]提出的堆叠模型将基础与通用推荐器结合起来。最后通过计算 FScore 的值来衡量推荐的准确度，结果表明，本策略在一定程度上提高了推荐的准确率。总体来看，基于 LOD 的推荐生成技术优点在于：数据关联表达很强、逻辑性强并具备一定的推理能力，可以自动发现一些隐含的语义信息，能够提高推荐准确度。但是，这种方式也存在缺点：由于推荐的过程依赖于外部知识库，因此外部知识库的完备与否对推荐结果的影响巨大，推荐多样性问题以及计算量大等问题有待解决。 2.3 基于图嵌入的推荐生成随着 Deepwalk[25]的提出，图嵌入技术开始受到学术界以及工业界的关注。其基本原理是基于随机游走等算法对图中节点进行采样生成节点序列，然后通过神经网络或者是其他机器学习算法将节点序列以及边映射到底维向量空间。图嵌入作为一种更为广泛的图表示学习方法，已经被应用到推荐领域，并且取得了较好的效果。 László等 [26]较早将图嵌入技术应用于推荐领域。将 Movielens 中电影与用户嵌入到同一个向量空间，进而计算用户与电影的空间距离，生成推荐列表。Wang 等 [27]做了同样的工作，将医学知识图谱、疾病-患者二部图、疾病-药物二部图分别嵌入低维向量空间，为病患推荐更为安全的药物治疗方式。通过加权平均将知识图谱与二部图结合生成包含更加细粒度属性信息的患者和药物向量。最终生成对给定患者的药物 top-k 列表。 Palumbo 等 [28]针对基于知识图谱的推荐生成提出一种通用的向量化模型 entity2rec。利用一种神经网络模型将知识图谱中的节点依据相连接的属性值训练为向量的模式，通过余弦相似度计算用户项目相关性，进而利用机器学习排序函数进行推荐列表的生成。首先利用 SPARQL 语句将知识图谱分解为属性子图，针对每个属性子图设置目标函数： max xp ∑ e∈Kp (−logZe + ∑ ni∈N(e) xp(ni)· xp(e)) 生成特定属性的用户和项目的特征向量，其中： Ze = ∑ v∈Kp exp(xp(e)· xp(v)) 然后通过： ρp(u,i) =    s(xp(u), xp(i)), p = feedback 1 |R+(u)| ∑ i ′∈R+(u) s(xp(i), xp(i ′ )), 其他计算用户项目之间的相关性。最后分别通过机器学习算法 Adrank 和 LambdaMart 生成推荐列表。 3 基于知识图谱的推荐系统关键技术基于知识图谱的推荐系统综合了知识图谱和传统推荐系统的特点，成为了一个新的研究主题，目前正处于初始发展阶段。在第 2 章考察相关研究工作的基础上，本节主要对第 1 章中提出的基于知识图谱的框架中的关键技术和研究现状进行进一步的分析。第 2 期常亮，等：知识图谱的推荐系统综述 ·211·

<<向上翻页向下翻页>>