Gowalla、Yelp 等，人们可以轻松地通过签到的形式分享他们的位置

正在加载图片...

·408· 智能系统学报第16卷 Gowalla、Yelp等，人们可以轻松地通过签到的形要用户提供其将要访问下一个兴趣点的距离间式分享他们的位置和记录生活。同时，用户大量隔。这有两方面的好处：首先根据用户的距离间的签到信息也为探索人们的行为规律提供了机隔，能够给用户提供更灵活的推荐，如果当前的遇。下一个兴趣点推荐已经成为基于位置的社交推荐列表用户不满意，用户可以有更多的灵活性网络的重要任务。去调整不同的距离间隔而得到不同的推荐列表，然而，与传统的推荐系统（如音乐、视频和图使用户能够与模型进行交互而不是只能得到固定书推荐等)不同，时空属性对于兴趣点推荐起着推荐列表；其次，根据用户提供的距离间隔，能够很强的约束性：并且，在兴趣点的签到信息中，用分析出用户此时表现的偏好模式（即近距离偏好户并没有明确给出对兴趣点的喜爱或偏好。用户或者远距离偏好)，进而根据用户的偏好给出个性的隐式反馈信息以及地点签到信息存在稀疏性问化的推荐列表。题，因此下一个兴趣点的推荐极具挑战性。为了时间信息在兴趣点推荐中也具有较大作用。提高兴趣点的推荐效果，一些研究将序列信用户偏好会随时间发生变化，用户在不同的时间息)、时空信息B、社交关系以及签到兴趣点间隔内会表现出不同的偏好。当用户要访问的下的上下文信息整合到模型中。本文主要利用一个兴趣点的时间点与当前用户时间点的时间间签到信息中的序列信息、时间信息和空间信息进隔较短时，模型应倾向于推荐用户较近的一些地行下一个兴趣点推荐。点。同时，利用相邻时间间隔信息也能提供一些序列信息在下一个兴趣点推荐中扮演着重要隐含的有价值信息。当用户从当前景点紧接着去角色。一些研究通过整合用户历史签到序列信息附近的下一个景点时，不同的用户在这两个兴趣提升模型的效果，FPMC模型山通过结合矩阵分点通常有相似的访问时间间隔。因此利用用户在解和马尔科夫链捕获用户连续签到兴趣点之间的相邻兴趣点之间的转移时间间隔有利于进行兴趣序列影响。最近，一些研究采用RNN模型1用点推荐。于序列信息分析，基于循环神经网络(RNN)的方由于RNN模型在序列建模中具有很好效果，法能够更有效地捕捉序列数据之间的关系，因此本文采用RNN模型对序列信息建模，通过对RNN 在兴趣点推荐中得到了广泛应用，并成为当前主进行改进使其能够满足对用户变化的时空偏好信流的推荐模型。然而，RNN存在梯度爆炸和梯度息进行下一个兴趣点推荐。现有模型通常将用户消失的问题，不能学习到较长序列内远距离的依的整个签到序列作为RNN的输入用于下一个兴赖关系。为了解决这个问题，长短时记忆(LSTM两趣点推荐。而实际上，使用用户的整个签到记录和门控循环单元(GRU)2种RNN变体被提出，并不一定适用于实际的应用场景，随着用户签到使得循环神经网络能够学习到长序列内远距离的记录数量快速地增加，计算开销也随之增加。因依赖问题。此，本文仅根据最后一次会话信息用于下一个兴空间信息是基于位置服务的基本属性，对趣点推荐。为了对用户签到序列中用户变化的复兴趣点的推荐同样起着重要作用。一些研究表杂时空偏好进行建模，本文分别建立时间转移矩明11，人们更倾向于访问距离用户当前位置较阵和空间转移矩阵。时空转移矩阵由用户相邻签近的地点。这些模型通过将距离作为权重系数或到兴趣点之间的时空间隔信息确定；为了进一步者根据兴趣点之间的距离进行聚类进而推荐位置考虑用户的时间偏好，用户会话中的每个兴趣点较近的兴趣点，限制了模型给用户推荐远距离的与推荐兴趣点的时间间隔信息也被整合到模型兴趣点。通过对实验数据集分析发现，在本文使中。本文通过同时考虑用户的两类时间信息（包用的Foursquare和CA数据集中，分别有24%和括相邻兴趣点的时间间隔和会话中访问过的兴趣 42%的相邻签到兴趣点之间的距离间隔大于10km, 点与下一个兴趣点的时间间隔)、空间信息、签到这说明用户多数情况下偏好访问距离较近的兴趣序列信息和用户偏好给出个性化的下一个兴趣点点，但也有较大比例用户依然偏好访问距离较远推荐。的兴趣点。在现有的下一个兴趣点推荐模型中， 1相关工作大多数模型倾向于推荐较近的地点限制了模型的表现，使得模型并不会自适应用户需求和偏好的传统兴趣点推荐通常采用协同过滤算法。矩变化而进行推荐，这也意味着模型推荐的兴趣点阵分解920是协同过滤最常用的方法，其目标是列表是固定不变的。为了解决上述问题，模型需将“用户一兴趣点”隐式评分矩阵分解为2个低维Gowalla、Yelp 等，人们可以轻松地通过签到的形式分享他们的位置和记录生活。同时，用户大量的签到信息也为探索人们的行为规律提供了机遇。下一个兴趣点推荐已经成为基于位置的社交网络的重要任务。然而，与传统的推荐系统 (如音乐、视频和图书推荐等) 不同，时空属性对于兴趣点推荐起着很强的约束性；并且，在兴趣点的签到信息中，用户并没有明确给出对兴趣点的喜爱或偏好。用户的隐式反馈信息以及地点签到信息存在稀疏性问题，因此下一个兴趣点的推荐极具挑战性。为了提高兴趣点的推荐效果，一些研究将序列信息 [1-2] 、时空信息[3-5] 、社交关系[6-8] 以及签到兴趣点的上下文信息[9-12] 整合到模型中。本文主要利用签到信息中的序列信息、时间信息和空间信息进行下一个兴趣点推荐。序列信息在下一个兴趣点推荐中扮演着重要角色。一些研究通过整合用户历史签到序列信息提升模型的效果，FPMC 模型[1] 通过结合矩阵分解和马尔科夫链捕获用户连续签到兴趣点之间的序列影响。最近，一些研究采用 RNN 模型[13] 用于序列信息分析，基于循环神经网络 (RNN) 的方法能够更有效地捕捉序列数据之间的关系，因此在兴趣点推荐中得到了广泛应用，并成为当前主流的推荐模型。然而，RNN 存在梯度爆炸和梯度消失的问题，不能学习到较长序列内远距离的依赖关系。为了解决这个问题，长短时记忆 (LSTM)[14] 和门控循环单元 (GRU)[15] 2 种 RNN 变体被提出，使得循环神经网络能够学习到长序列内远距离的依赖问题。空间信息是基于位置服务的基本属性[16] ，对兴趣点的推荐同样起着重要作用。一些研究表明 [17-18] ，人们更倾向于访问距离用户当前位置较近的地点。这些模型通过将距离作为权重系数或者根据兴趣点之间的距离进行聚类进而推荐位置较近的兴趣点，限制了模型给用户推荐远距离的兴趣点。通过对实验数据集分析发现，在本文使用的 Foursquare 和 CA 数据集中,分别有 24% 和 42% 的相邻签到兴趣点之间的距离间隔大于 10 km，这说明用户多数情况下偏好访问距离较近的兴趣点，但也有较大比例用户依然偏好访问距离较远的兴趣点。在现有的下一个兴趣点推荐模型中，大多数模型倾向于推荐较近的地点限制了模型的表现，使得模型并不会自适应用户需求和偏好的变化而进行推荐，这也意味着模型推荐的兴趣点列表是固定不变的。为了解决上述问题，模型需要用户提供其将要访问下一个兴趣点的距离间隔。这有两方面的好处：首先根据用户的距离间隔，能够给用户提供更灵活的推荐，如果当前的推荐列表用户不满意，用户可以有更多的灵活性去调整不同的距离间隔而得到不同的推荐列表，使用户能够与模型进行交互而不是只能得到固定推荐列表；其次，根据用户提供的距离间隔，能够分析出用户此时表现的偏好模式 (即近距离偏好或者远距离偏好)，进而根据用户的偏好给出个性化的推荐列表。时间信息在兴趣点推荐中也具有较大作用。用户偏好会随时间发生变化，用户在不同的时间间隔内会表现出不同的偏好。当用户要访问的下一个兴趣点的时间点与当前用户时间点的时间间隔较短时，模型应倾向于推荐用户较近的一些地点。同时，利用相邻时间间隔信息也能提供一些隐含的有价值信息。当用户从当前景点紧接着去附近的下一个景点时，不同的用户在这两个兴趣点通常有相似的访问时间间隔。因此利用用户在相邻兴趣点之间的转移时间间隔有利于进行兴趣点推荐。由于 RNN 模型在序列建模中具有很好效果，本文采用 RNN 模型对序列信息建模，通过对 RNN 进行改进使其能够满足对用户变化的时空偏好信息进行下一个兴趣点推荐。现有模型通常将用户的整个签到序列作为 RNN 的输入用于下一个兴趣点推荐。而实际上，使用用户的整个签到记录并不一定适用于实际的应用场景，随着用户签到记录数量快速地增加，计算开销也随之增加。因此，本文仅根据最后一次会话信息用于下一个兴趣点推荐。为了对用户签到序列中用户变化的复杂时空偏好进行建模，本文分别建立时间转移矩阵和空间转移矩阵。时空转移矩阵由用户相邻签到兴趣点之间的时空间隔信息确定；为了进一步考虑用户的时间偏好，用户会话中的每个兴趣点与推荐兴趣点的时间间隔信息也被整合到模型中。本文通过同时考虑用户的两类时间信息 (包括相邻兴趣点的时间间隔和会话中访问过的兴趣点与下一个兴趣点的时间间隔)、空间信息、签到序列信息和用户偏好给出个性化的下一个兴趣点推荐。 1 相关工作传统兴趣点推荐通常采用协同过滤算法。矩阵分解[19-20] 是协同过滤最常用的方法，其目标是将“用户−兴趣点”隐式评分矩阵分解为 2 个低维 ·408· 智能系统学报第 16 卷

<<向上翻页向下翻页>>

点击下载：【机器学习】基于时空循环神经网络的下一个兴趣点推荐方法