正在加载图片...
·230· 智能系统学报 第16卷 第2类为远途旅行兴趣点推荐(remote POI re- 似性、兴趣点和兴趣点之间的相似性,进而使用 commendation)”。文献[l3]针对位置的情感属 内积作为交互函数进行推荐也会造成一定的排名 性,提出了一种兴趣点挖掘方法,首先使用Senti- 误差。解决该问题的方法之一是使用大量的潜在 ment-based POI Mining(基于情感的兴趣点挖 因子,然而这可能对模型的泛化能力产生不利影 掘)算法挖掘具有明显情感属性的兴趣点,然后 响,特别是在稀疏的数据集上容易产生数据过拟 使用Sentiment-based POI Recommendation(基于情 合问题。深度学习在图形图像处理、自然语言 感的兴趣点推荐)算法向用户推荐兴趣点。文献[14 处理]等领域取得突破,为推荐系统的研究带来 通过合并兴趣点可用性(兴趣点可能只在某个时 了新的机遇。但据我们所知,很多研究都是将深 间窗口内可用)的约束和不确定旅行时间(两个 度学习用于建模上下文信息,例如评论信息、 兴趣点之间的旅行时间不确定)的约束来缩减搜 类别信息等,并使用内积作为用户和兴趣点的交 索空间,为用户提供个性化的旅行推荐。远途旅 互函数。神经网络已经被证明有拟合任何连续函 行兴趣点推荐也会受地理因素和个人偏好的影 数的能力2,受文献[25]的启发,本文利用深度 响,但更倾向于考虑大众偏好。 神经网络从用户签到数据中学习用户和项目的交 第3类为日常兴趣点推荐(general POI recom- 互函数。 mendation),。文献[l6)通过利用用户和兴趣点 问题定义和解决方案 之间的位置相关性、社会相关性和类别相关性进 行兴趣点推荐。文献「3]指出地理位置上的朋 2.1问题定义 友、社交网络中的朋友以及在同一地点签到过的 定义1兴趣点集合。兴趣点是与地理位置 朋友对兴趣点的选择都具有影响。文献[1)提出 相关的地点,一个兴趣点集合用V={w,2,…,} 将用户-项目交互数据构建成二部图,使用图神 表示,V中的每个对象:由一个二元组(几,组成 经网络学习用户和项目的嵌入向量。在用户和项 其中yu表示兴趣点v,的位置信息,即va=(lat,lon), 目的嵌入向量中以嵌入传播的方式显式注入了协 lat:和lon,分别代表兴趣点的经度和纬度,yx是y 作信号。STAR-GCN8模型学习用户和项目的低 中的文本信息集合,k=[a,a2,…,a,其中 维嵌入向量再输入到网络中,为了预测冷启动问 a(i∈1,2,…,0)是文本信息中的一个关键字。 题中的节点嵌入向量,STAR-GCN屏蔽了部分用 定义2签到矩阵。签到矩阵由用户对兴趣 户和项目的嵌入向量,然后通过图编码一解码器 点的签到数据构成,如果用户数为m,兴趣点数 重构这些被屏蔽的嵌入向量,有效缓解了冷启动 为n,则签到矩阵为Rx”,如果用户i访问过兴趣 问题。文献[15]结合位置因素和时间因素构建了 点j,签到矩阵对应位置r(“∈Rm)为1,否则 用户的兴趣动态变化模型,以获得更加准确的兴 置0。签到矩阵中的每个元素都反映了用户和兴 趣点推荐效果。矩阵分解方法在兴趣点推荐中也 趣点之间的交互。 得到了广泛的应用,例如文献[19]整合了用户的 22解决方案 社交关系和位置信息到概率矩阵分解(probabilist-. 本文提出的模型主要分为以下3个阶段: ic matrix factorization)中。文献[2o]提出了基于加 1)兴趣点聚类。采用K-means算法,根据兴 权矩阵分解模型的兴趣点推荐方法。由于用户签 趣点的位置信息,对兴趣点进行聚类,使得位置 到行为存在空间聚合现象,该方法从二维核密度 相近的兴趣点被聚为一类。每类兴趣点有一个相 估计的角度,描述了空间聚合的影响并将其整合 应的类标签,用于兴趣点与用户的属性之间进行 到矩阵分解模型中。但需要指出的是,上述研 显式关联关系分析。 究B,152都使用潜在特征向量代表用户和兴趣点, 2)用户-兴趣点之间的耦合关系挖掘。通过 用户在兴趣点上的交互被建模为各自对应的潜在 卷积神经网络模型学习用户与兴趣点在属性上的 向量的内积。然而,使用简单的内积作为用户和 显式关联关系;使用另外一个神经网络模型,根 兴趣点的交互函数,并不能有效捕捉用户交互数 据用户对兴趣点的签到数据,学习用户与兴趣点 据的复杂结构(因为内积只是线性地结合了多个 之间的隐式关联关系;最后,将用户和兴趣点的 潜在特征的乘法),从而导致推荐效果不够理想。 显式和隐式关联关系集成到一起,表征用户一兴 矩阵分解将用户和兴趣点映射到同一潜在特征空 趣点之间的耦合关系。 间中,如果用户和兴趣点潜在向量的维数过小, 3)将2)中学习到的用户-兴趣点耦合关系输 无法在潜在特征空间中体现用户和用户之间的相 入到一个全连接网络中,进行兴趣点推荐。第 2 类为远途旅行兴趣点推荐 (remote POI re￾commendation)[7]。文献 [13] 针对位置的情感属 性,提出了一种兴趣点挖掘方法,首先使用 Senti￾ment-based POI Mining(基于情感的兴趣点挖 掘) 算法挖掘具有明显情感属性的兴趣点,然后 使用 Sentiment-based POI Recommendation(基于情 感的兴趣点推荐) 算法向用户推荐兴趣点。文献 [14] 通过合并兴趣点可用性 (兴趣点可能只在某个时 间窗口内可用) 的约束和不确定旅行时间 (两个 兴趣点之间的旅行时间不确定) 的约束来缩减搜 索空间,为用户提供个性化的旅行推荐。远途旅 行兴趣点推荐也会受地理因素和个人偏好的影 响,但更倾向于考虑大众偏好。 第 3 类为日常兴趣点推荐 (general POI recom￾mendation)[1,15]。文献 [16] 通过利用用户和兴趣点 之间的位置相关性、社会相关性和类别相关性进 行兴趣点推荐。文献 [3] 指出地理位置上的朋 友、社交网络中的朋友以及在同一地点签到过的 朋友对兴趣点的选择都具有影响。文献 [17] 提出 将用户−项目交互数据构建成二部图,使用图神 经网络学习用户和项目的嵌入向量。在用户和项 目的嵌入向量中以嵌入传播的方式显式注入了协 作信号。STAR-GCN[18] 模型学习用户和项目的低 维嵌入向量再输入到网络中,为了预测冷启动问 题中的节点嵌入向量,STAR-GCN 屏蔽了部分用 户和项目的嵌入向量,然后通过图编码−解码器 重构这些被屏蔽的嵌入向量,有效缓解了冷启动 问题。文献 [15] 结合位置因素和时间因素构建了 用户的兴趣动态变化模型,以获得更加准确的兴 趣点推荐效果。矩阵分解方法在兴趣点推荐中也 得到了广泛的应用,例如文献 [19] 整合了用户的 社交关系和位置信息到概率矩阵分解 (probabilist￾ic matrix factorization) 中。文献 [20] 提出了基于加 权矩阵分解模型的兴趣点推荐方法。由于用户签 到行为存在空间聚合现象,该方法从二维核密度 估计的角度,描述了空间聚合的影响并将其整合 到矩阵分解模型中。但需要指出的是,上述研 究 [3,15,21] 都使用潜在特征向量代表用户和兴趣点, 用户在兴趣点上的交互被建模为各自对应的潜在 向量的内积。然而,使用简单的内积作为用户和 兴趣点的交互函数,并不能有效捕捉用户交互数 据的复杂结构 (因为内积只是线性地结合了多个 潜在特征的乘法),从而导致推荐效果不够理想。 矩阵分解将用户和兴趣点映射到同一潜在特征空 间中,如果用户和兴趣点潜在向量的维数过小, 无法在潜在特征空间中体现用户和用户之间的相 似性、兴趣点和兴趣点之间的相似性,进而使用 内积作为交互函数进行推荐也会造成一定的排名 误差。解决该问题的方法之一是使用大量的潜在 因子,然而这可能对模型的泛化能力产生不利影 响,特别是在稀疏的数据集上容易产生数据过拟 合问题。深度学习在图形图像处理[22] 、自然语言 处理[23] 等领域取得突破,为推荐系统的研究带来 了新的机遇。但据我们所知,很多研究都是将深 度学习用于建模上下文信息[21] ,例如评论信息、 类别信息等,并使用内积作为用户和兴趣点的交 互函数。神经网络已经被证明有拟合任何连续函 数的能力[24] ,受文献 [25] 的启发,本文利用深度 神经网络从用户签到数据中学习用户和项目的交 互函数。 2 问题定义和解决方案 2.1 问题定义 V = {v1, v2,··· , vn} vi vi.λ vi vi.λ = (lati ,loni) lati loni vi.K vi vi.K = [a1,a2,··· ,ao] ai(i ∈ 1,2,··· ,o) 定义 1 兴趣点集合。兴趣点是与地理位置 相关的地点,一个兴趣点集合用 表示,V 中的每个对象 由一个二元组 (λ, K) 组成, 其中 表示兴趣点 的位置信息,即 , 和 分别代表兴趣点的经度和纬度, 是 中的文本信息集合, ,其中 是文本信息中的一个关键字。 定义 2 签到矩阵。签到矩阵由用户对兴趣 点的签到数据构成,如果用户数为 m,兴趣点数 为 n,则签到矩阵为 R m×n,如果用户 i 访问过兴趣 点 j,签到矩阵对应位置 rij(rij∈R m×n) 为 1,否则, 置 0。签到矩阵中的每个元素都反映了用户和兴 趣点之间的交互。 2.2 解决方案 本文提出的模型主要分为以下 3 个阶段: 1) 兴趣点聚类。采用 K-means 算法,根据兴 趣点的位置信息,对兴趣点进行聚类,使得位置 相近的兴趣点被聚为一类。每类兴趣点有一个相 应的类标签,用于兴趣点与用户的属性之间进行 显式关联关系分析。 2) 用户−兴趣点之间的耦合关系挖掘。通过 卷积神经网络模型学习用户与兴趣点在属性上的 显式关联关系;使用另外一个神经网络模型,根 据用户对兴趣点的签到数据,学习用户与兴趣点 之间的隐式关联关系;最后,将用户和兴趣点的 显式和隐式关联关系集成到一起,表征用户−兴 趣点之间的耦合关系。 3) 将 2) 中学习到的用户−兴趣点耦合关系输 入到一个全连接网络中,进行兴趣点推荐。 ·230· 智 能 系 统 学 报 第 16 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有