正在加载图片...
第3期 柴瑞敏,等:基于时空循环神经网络的下一个兴趣点推荐方法 ·409· 矩阵,分别表示用户和兴趣点的潜在因子。然 同之处体现在:1)模型只使用用户最后的会话作 而,矩阵分解方法不适用于用户签到序列信息的 为RNN的输,具有更快的推荐速度;2)模型能够 建模。 根据用户的查询条件以及用户的偏好变化情况进 序列信息和时空信息是下一个兴趣点推荐的 行自适应调整,为相同用户推荐变化的个性化的 最基本要素。为了提升下一个兴趣点的推荐效 兴趣点推荐列表。 果,一些模型,如基于MC模型的方法、基于嵌 入的方法22]和基于神经网络RNN的方法,通过 2相关定义 整合序列信息和时空信息用于下一个兴趣点推 令U={山,2,…,4u}表示所有用户组成的集 荐。文献[1]提出了FPMC模型,该模型结合矩 合,P={P1,P2,…,P}和G={88,…,8n}分别表 阵分解和马尔科夫链对用户偏好和序列信息建 示兴趣点的集合及其对应兴趣点的地理坐标的集 模。文献[21]是FPMC模型的扩展,通过结合用 合,其中U和P分别表示用户数量和兴趣点数 户的地理位置约束为用户推荐下一个兴趣点。文 量。本文中用户和兴趣点的标识都用连续的整数 献[24]提出了POI2vec,该模型应用二叉树结构 编码,编码值从1开始。 对附近的兴趣点进行聚类,进而为用户推荐下一 定义1兴趣点(PO)。兴趣点是具有唯一标 个兴趣点。文献[17]提出了PRME-G,该模型利 识(编码)的地点,它包含经纬度信息。 用嵌人的方法,通过度量嵌入的方法整合兴趣点 定义2历史签到序列。某一用户“的历史 的序列信息和地理位置信息进行下一个兴趣点推 签到序列表示为H={,哈…,P,其中P%表示 荐。文献[22]提出了一种嵌入学习方法(GE)用 用户u在时刻访问过兴趣点P。 于兴趣点推荐,该方法利用二部图对POI推荐上 定义3下一个兴趣点推荐。给定用户的历 下文中的一对上下文进行建模,并通过对4对嵌 史签到记录,用户最后的签到位置信息以 入模型(POI-POI、POI-Time、POI-Regin和POI- 及查询条件Q=(△d,+),其中△d表示用户访问下 Word)进行统一优化。 一个兴趣点的距离间隔。下一个兴趣点推荐目标 然而,以上模型缺乏对用户连续签到的两个 是为用户推荐其在,时刻最有可能访问的TOP-K 兴趣点之间的转移时空信息的考虑,并且时间信 个兴趣点。 息和空间信息之间复杂的交互也被忽略。最近, 序列信息和时空信息也被广泛地整合到RNN网 3基于时空循环神经网络的兴趣点 络中。文献[25]提出了Distance2Pre模型,利用 推荐模型 GRU模型首次整合用户不同地理距离偏好进行 下一个兴趣点预测,提出线性和非线性方式整合 3.1模型的输入信息 用户距离偏好分数的2种结构模型。文献[4幻 图1中P,(Q)表示用户在兴趣点P,发出的查 通过对RNN改进,提出整合时空信息的RNN模 询。S()的取值为0或1,用于判断用户签到兴趣 型(ST-RNN),然而它使用固定窗口的时空转化信 点是否属于同一个会话。S()的值根据用户2个 息,缺乏对相邻的兴趣点之间的转移信息进行建 相邻签到兴趣点之间的时间差得到,如果用户在 模。文献[26]提出了改进的LSTM模型,该模型 t时刻签到与1-时刻签到的差大于π,即S(t)=0, 在LSTM模型中加入时间门和距离门,通过对相 表示用户在4和t时刻的签到兴趣点不属于同 邻签到地点之间的时间间隔和距离间隔进行建模 一个会话。 来提取用户长期和短期兴趣偏好。 用户的偏好是随时间变化的,同时用户所处 以上模型都是将用户的历史签到记录作为 地点也有可能发生变化,因此利用用户整个历史 RNN的输入,本文使用用户最后一次的会话信息 签到记录进行下一个兴趣点推荐并不一定合适。 作为RNN的输入。并且,上述模型都忽略了用户 在下一个兴趣点推荐中,用户最近的签到地点通 历史签到兴趣点与最终推荐的兴趣点的时间间隔 常对于下一个兴趣点的推荐具有较大影响,因此 信息。与本文工作最为相似是Distance.2Pre模 本文仅使用用户最后一次会话信息作为RNN的 型,该模型通过对用户的不同距离偏好进行建 输入,用户的签到会话表示为相邻的签到兴趣点 模,但其忽略了用户偏好与时间之间的关联,这 之间的最大间隔不超过π,的一段连续签到序 就意味着随着时间的改变,无论是之后的1个小 列。从图1可以看出用户的历史签到记录被分成 时还是2天内,Distance2Pre将始终为用户预测相 了多个会话,session1和session2是已完成会话, 同的推荐列表。本文提出的模型与上述模型的不 session,是用户最后一次会话。图1中用户历史矩阵,分别表示用户和兴趣点的潜在因子。然 而,矩阵分解方法不适用于用户签到序列信息的 建模。 序列信息和时空信息是下一个兴趣点推荐的 最基本要素。为了提升下一个兴趣点的推荐效 果,一些模型,如基于 MC 模型的方法[21] 、基于嵌 入的方法[22-23] 和基于神经网络 RNN 的方法,通过 整合序列信息和时空信息用于下一个兴趣点推 荐。文献 [1] 提出了 FPMC 模型,该模型结合矩 阵分解和马尔科夫链对用户偏好和序列信息建 模。文献 [21] 是 FPMC 模型的扩展,通过结合用 户的地理位置约束为用户推荐下一个兴趣点。文 献 [24] 提出了 POI2vec,该模型应用二叉树结构 对附近的兴趣点进行聚类,进而为用户推荐下一 个兴趣点。文献 [17] 提出了 PRME-G,该模型利 用嵌入的方法,通过度量嵌入的方法整合兴趣点 的序列信息和地理位置信息进行下一个兴趣点推 荐。文献 [22] 提出了一种嵌入学习方法 (GE) 用 于兴趣点推荐,该方法利用二部图对 POI 推荐上 下文中的一对上下文进行建模,并通过对 4 对嵌 入模型 (POI-POI、POI-Time、POI-Regin 和 POI￾Word) 进行统一优化。 然而,以上模型缺乏对用户连续签到的两个 兴趣点之间的转移时空信息的考虑,并且时间信 息和空间信息之间复杂的交互也被忽略。最近, 序列信息和时空信息也被广泛地整合到 RNN 网 络中。文献 [25] 提出了 Distance2Pre 模型,利用 GRU 模型首次整合用户不同地理距离偏好进行 下一个兴趣点预测,提出线性和非线性方式整合 用户距离偏好分数的 2 种结构模型。文献 [4] 通过对 RNN 改进,提出整合时空信息的 RNN 模 型 (ST-RNN),然而它使用固定窗口的时空转化信 息,缺乏对相邻的兴趣点之间的转移信息进行建 模。文献 [26] 提出了改进的 LSTM 模型,该模型 在 LSTM 模型中加入时间门和距离门,通过对相 邻签到地点之间的时间间隔和距离间隔进行建模 来提取用户长期和短期兴趣偏好。 以上模型都是将用户的历史签到记录作为 RNN 的输入,本文使用用户最后一次的会话信息 作为 RNN 的输入。并且,上述模型都忽略了用户 历史签到兴趣点与最终推荐的兴趣点的时间间隔 信息。与本文工作最为相似是 Distance2Pre 模 型,该模型通过对用户的不同距离偏好进行建 模,但其忽略了用户偏好与时间之间的关联,这 就意味着随着时间的改变,无论是之后的 1 个小 时还是 2 天内,Distance2Pre 将始终为用户预测相 同的推荐列表。本文提出的模型与上述模型的不 同之处体现在:1) 模型只使用用户最后的会话作 为 RNN 的输,具有更快的推荐速度;2) 模型能够 根据用户的查询条件以及用户的偏好变化情况进 行自适应调整,为相同用户推荐变化的个性化的 兴趣点推荐列表。 2 相关定义 U = {u1,u2,··· ,u|U|} P = {p1, p2,··· , p|P|} G = {gp1 ,gp2 ,··· ,g|P|} |U| |P| 令 表示所有用户组成的集 合, 和 分别表 示兴趣点的集合及其对应兴趣点的地理坐标的集 合,其中 和 分别表示用户数量和兴趣点数 量。本文中用户和兴趣点的标识都用连续的整数 编码,编码值从 1 开始。 定义 1 兴趣点 (POI)。兴趣点是具有唯一标 识 (编码) 的地点,它包含经纬度信息。 u H u ti = {p u t1 , p u t2 ,··· , p u ti } p u ti u ti p 定义 2 历史签到序列。某一用户 的历史 签到序列表示为 ,其中 表示 用户 在 时刻访问过兴趣点 。 H u ti p u ti Q = (∆d,ti+1) ∆d ti+1 定义 3 下一个兴趣点推荐。给定用户的历 史签到记录 ,用户最后的签到位置信息 以 及查询条件 ,其中 表示用户访问下 一个兴趣点的距离间隔。下一个兴趣点推荐目标 是为用户推荐其在 时刻最有可能访问的 TOP-K 个兴趣点。 3 基于时空循环神经网络的兴趣点 推荐模型 3.1 模型的输入信息 p7(Q) p7 S (t) S (t) ti ti−1 πs ti ti−1 图 1 中 表示用户在兴趣点 发出的查 询。 的取值为 0 或 1,用于判断用户签到兴趣 点是否属于同一个会话。 的值根据用户 2 个 相邻签到兴趣点之间的时间差得到,如果用户在 时刻签到与 时刻签到的差大于 ,即 S(t)=0, 表示用户在 和 时刻的签到兴趣点不属于同 一个会话。 πs 用户的偏好是随时间变化的,同时用户所处 地点也有可能发生变化,因此利用用户整个历史 签到记录进行下一个兴趣点推荐并不一定合适。 在下一个兴趣点推荐中,用户最近的签到地点通 常对于下一个兴趣点的推荐具有较大影响,因此 本文仅使用用户最后一次会话信息作为 RNN 的 输入,用户的签到会话表示为相邻的签到兴趣点 之间的最大间隔不超过 的一段连续签到序 列。从图 1 可以看出用户的历史签到记录被分成 了多个会话,session1 和 session2 是已完成会话, session3 是用户最后一次会话。图 1 中用户历史 第 3 期 柴瑞敏,等:基于时空循环神经网络的下一个兴趣点推荐方法 ·409·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有