正在加载图片...
·408· 智能系统学报 第16卷 Gowalla、Yelp等,人们可以轻松地通过签到的形 要用户提供其将要访问下一个兴趣点的距离间 式分享他们的位置和记录生活。同时,用户大量 隔。这有两方面的好处:首先根据用户的距离间 的签到信息也为探索人们的行为规律提供了机 隔,能够给用户提供更灵活的推荐,如果当前的 遇。下一个兴趣点推荐已经成为基于位置的社交 推荐列表用户不满意,用户可以有更多的灵活性 网络的重要任务。 去调整不同的距离间隔而得到不同的推荐列表, 然而,与传统的推荐系统(如音乐、视频和图 使用户能够与模型进行交互而不是只能得到固定 书推荐等)不同,时空属性对于兴趣点推荐起着 推荐列表;其次,根据用户提供的距离间隔,能够 很强的约束性:并且,在兴趣点的签到信息中,用 分析出用户此时表现的偏好模式(即近距离偏好 户并没有明确给出对兴趣点的喜爱或偏好。用户 或者远距离偏好),进而根据用户的偏好给出个性 的隐式反馈信息以及地点签到信息存在稀疏性问 化的推荐列表。 题,因此下一个兴趣点的推荐极具挑战性。为了 时间信息在兴趣点推荐中也具有较大作用。 提高兴趣点的推荐效果,一些研究将序列信 用户偏好会随时间发生变化,用户在不同的时间 息)、时空信息B、社交关系以及签到兴趣点 间隔内会表现出不同的偏好。当用户要访问的下 的上下文信息整合到模型中。本文主要利用 一个兴趣点的时间点与当前用户时间点的时间间 签到信息中的序列信息、时间信息和空间信息进 隔较短时,模型应倾向于推荐用户较近的一些地 行下一个兴趣点推荐。 点。同时,利用相邻时间间隔信息也能提供一些 序列信息在下一个兴趣点推荐中扮演着重要 隐含的有价值信息。当用户从当前景点紧接着去 角色。一些研究通过整合用户历史签到序列信息 附近的下一个景点时,不同的用户在这两个兴趣 提升模型的效果,FPMC模型山通过结合矩阵分 点通常有相似的访问时间间隔。因此利用用户在 解和马尔科夫链捕获用户连续签到兴趣点之间的 相邻兴趣点之间的转移时间间隔有利于进行兴趣 序列影响。最近,一些研究采用RNN模型1用 点推荐。 于序列信息分析,基于循环神经网络(RNN)的方 由于RNN模型在序列建模中具有很好效果, 法能够更有效地捕捉序列数据之间的关系,因此 本文采用RNN模型对序列信息建模,通过对RNN 在兴趣点推荐中得到了广泛应用,并成为当前主 进行改进使其能够满足对用户变化的时空偏好信 流的推荐模型。然而,RNN存在梯度爆炸和梯度 息进行下一个兴趣点推荐。现有模型通常将用户 消失的问题,不能学习到较长序列内远距离的依 的整个签到序列作为RNN的输入用于下一个兴 赖关系。为了解决这个问题,长短时记忆(LSTM两 趣点推荐。而实际上,使用用户的整个签到记录 和门控循环单元(GRU)2种RNN变体被提出, 并不一定适用于实际的应用场景,随着用户签到 使得循环神经网络能够学习到长序列内远距离的 记录数量快速地增加,计算开销也随之增加。因 依赖问题。 此,本文仅根据最后一次会话信息用于下一个兴 空间信息是基于位置服务的基本属性,对 趣点推荐。为了对用户签到序列中用户变化的复 兴趣点的推荐同样起着重要作用。一些研究表 杂时空偏好进行建模,本文分别建立时间转移矩 明11,人们更倾向于访问距离用户当前位置较 阵和空间转移矩阵。时空转移矩阵由用户相邻签 近的地点。这些模型通过将距离作为权重系数或 到兴趣点之间的时空间隔信息确定;为了进一步 者根据兴趣点之间的距离进行聚类进而推荐位置 考虑用户的时间偏好,用户会话中的每个兴趣点 较近的兴趣点,限制了模型给用户推荐远距离的 与推荐兴趣点的时间间隔信息也被整合到模型 兴趣点。通过对实验数据集分析发现,在本文使 中。本文通过同时考虑用户的两类时间信息(包 用的Foursquare和CA数据集中,分别有24%和 括相邻兴趣点的时间间隔和会话中访问过的兴趣 42%的相邻签到兴趣点之间的距离间隔大于10km, 点与下一个兴趣点的时间间隔)、空间信息、签到 这说明用户多数情况下偏好访问距离较近的兴趣 序列信息和用户偏好给出个性化的下一个兴趣点 点,但也有较大比例用户依然偏好访问距离较远 推荐。 的兴趣点。在现有的下一个兴趣点推荐模型中, 1相关工作 大多数模型倾向于推荐较近的地点限制了模型的 表现,使得模型并不会自适应用户需求和偏好的 传统兴趣点推荐通常采用协同过滤算法。矩 变化而进行推荐,这也意味着模型推荐的兴趣点 阵分解920是协同过滤最常用的方法,其目标是 列表是固定不变的。为了解决上述问题,模型需 将“用户一兴趣点”隐式评分矩阵分解为2个低维Gowalla、Yelp 等,人们可以轻松地通过签到的形 式分享他们的位置和记录生活。同时,用户大量 的签到信息也为探索人们的行为规律提供了机 遇。下一个兴趣点推荐已经成为基于位置的社交 网络的重要任务。 然而,与传统的推荐系统 (如音乐、视频和图 书推荐等) 不同,时空属性对于兴趣点推荐起着 很强的约束性;并且,在兴趣点的签到信息中,用 户并没有明确给出对兴趣点的喜爱或偏好。用户 的隐式反馈信息以及地点签到信息存在稀疏性问 题,因此下一个兴趣点的推荐极具挑战性。为了 提高兴趣点的推荐效果,一些研究将序列信 息 [1-2] 、时空信息[3-5] 、社交关系[6-8] 以及签到兴趣点 的上下文信息[9-12] 整合到模型中。本文主要利用 签到信息中的序列信息、时间信息和空间信息进 行下一个兴趣点推荐。 序列信息在下一个兴趣点推荐中扮演着重要 角色。一些研究通过整合用户历史签到序列信息 提升模型的效果,FPMC 模型[1] 通过结合矩阵分 解和马尔科夫链捕获用户连续签到兴趣点之间的 序列影响。最近,一些研究采用 RNN 模型[13] 用 于序列信息分析,基于循环神经网络 (RNN) 的方 法能够更有效地捕捉序列数据之间的关系,因此 在兴趣点推荐中得到了广泛应用,并成为当前主 流的推荐模型。然而,RNN 存在梯度爆炸和梯度 消失的问题,不能学习到较长序列内远距离的依 赖关系。为了解决这个问题,长短时记忆 (LSTM)[14] 和门控循环单元 (GRU)[15] 2 种 RNN 变体被提出, 使得循环神经网络能够学习到长序列内远距离的 依赖问题。 空间信息是基于位置服务的基本属性[16] ,对 兴趣点的推荐同样起着重要作用。一些研究表 明 [17-18] ,人们更倾向于访问距离用户当前位置较 近的地点。这些模型通过将距离作为权重系数或 者根据兴趣点之间的距离进行聚类进而推荐位置 较近的兴趣点,限制了模型给用户推荐远距离的 兴趣点。通过对实验数据集分析发现,在本文使 用的 Foursquare 和 CA 数据集中,分别有 24% 和 42% 的相邻签到兴趣点之间的距离间隔大于 10 km, 这说明用户多数情况下偏好访问距离较近的兴趣 点,但也有较大比例用户依然偏好访问距离较远 的兴趣点。在现有的下一个兴趣点推荐模型中, 大多数模型倾向于推荐较近的地点限制了模型的 表现,使得模型并不会自适应用户需求和偏好的 变化而进行推荐,这也意味着模型推荐的兴趣点 列表是固定不变的。为了解决上述问题,模型需 要用户提供其将要访问下一个兴趣点的距离间 隔。这有两方面的好处:首先根据用户的距离间 隔,能够给用户提供更灵活的推荐,如果当前的 推荐列表用户不满意,用户可以有更多的灵活性 去调整不同的距离间隔而得到不同的推荐列表, 使用户能够与模型进行交互而不是只能得到固定 推荐列表;其次,根据用户提供的距离间隔,能够 分析出用户此时表现的偏好模式 (即近距离偏好 或者远距离偏好),进而根据用户的偏好给出个性 化的推荐列表。 时间信息在兴趣点推荐中也具有较大作用。 用户偏好会随时间发生变化,用户在不同的时间 间隔内会表现出不同的偏好。当用户要访问的下 一个兴趣点的时间点与当前用户时间点的时间间 隔较短时,模型应倾向于推荐用户较近的一些地 点。同时,利用相邻时间间隔信息也能提供一些 隐含的有价值信息。当用户从当前景点紧接着去 附近的下一个景点时,不同的用户在这两个兴趣 点通常有相似的访问时间间隔。因此利用用户在 相邻兴趣点之间的转移时间间隔有利于进行兴趣 点推荐。 由于 RNN 模型在序列建模中具有很好效果, 本文采用 RNN 模型对序列信息建模,通过对 RNN 进行改进使其能够满足对用户变化的时空偏好信 息进行下一个兴趣点推荐。现有模型通常将用户 的整个签到序列作为 RNN 的输入用于下一个兴 趣点推荐。而实际上,使用用户的整个签到记录 并不一定适用于实际的应用场景,随着用户签到 记录数量快速地增加,计算开销也随之增加。因 此,本文仅根据最后一次会话信息用于下一个兴 趣点推荐。为了对用户签到序列中用户变化的复 杂时空偏好进行建模,本文分别建立时间转移矩 阵和空间转移矩阵。时空转移矩阵由用户相邻签 到兴趣点之间的时空间隔信息确定;为了进一步 考虑用户的时间偏好,用户会话中的每个兴趣点 与推荐兴趣点的时间间隔信息也被整合到模型 中。本文通过同时考虑用户的两类时间信息 (包 括相邻兴趣点的时间间隔和会话中访问过的兴趣 点与下一个兴趣点的时间间隔)、空间信息、签到 序列信息和用户偏好给出个性化的下一个兴趣点 推荐。 1 相关工作 传统兴趣点推荐通常采用协同过滤算法。矩 阵分解[19-20] 是协同过滤最常用的方法,其目标是 将“用户−兴趣点”隐式评分矩阵分解为 2 个低维 ·408· 智 能 系 统 学 报 第 16 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有