正在加载图片...
·86· 智能系统学报 第14卷 估计用户的旅行行为频率,然后基于朴素贝叶斯 将该照片的拍摄者认定为本地居民,否则认为是 模型生成一个符合用户旅行习惯的路线。2)在路 游客拍摄的照片。最后利用DBSCAN算法从照 线生成的过程中考虑了用户冷启动问题,利用所 片数据中识别出地标建筑,并按照流行度进行排 有用户的隐含因子向量的平均值作为未挖掘出用 序。实验数据表明,该方法能够给用户推荐一个 户旅行习惯的用户的隐含因子向量;此外,该方 包括合适景点且路线长度适中的旅游路线,但这 法还融合了用户旅行习惯中的最大可能出行距 种方法存在一定的缺点,主要体现在计算兴趣点 离,能够更好地限制生成路线的长度来满足用户 流行度时并没有考虑游客的经验和知识。 的历史出行习惯。实验结果表明,这2种方法在 wei等提出了基于集体知识的路线推理框 召回率和准确率上均有更好的表现,但这两种方 架。首先给定一个位置序列和时间跨度,通过以 法在处理用户旅行习惯时,并没有考虑用户旅 相互加强的方式聚合用户照片数据,得到流行的 行习惯的序列性,也没有考虑用户旅行时的动 路线信息,之后路线算法根据用户指定的查询来 态性,在生成路线结果的合理性上存在一定的 构造top-k路线。算法可以在0.5s内找到前3个 偏差。 路线,与其相应的地理实况相比,距离误差小于 32.2利用带地理标签的照片进行求解 300m。 目前,社交网站中存在大量带地理标签的照 Tai等B使用关联规则挖掘和序列模式挖掘 片数据,从这些照片数据中分析历史用户位置在 从用户带地理标签的照片中提取用户对热门景点 地理空间中的分布特征和用户位置随时间的变化 的访问序列,从而进一步得到流行路线信息,之 特征可以挖掘出用户的行进路线,这些路线可以 后基于用户的历史访问信息,从这些路线中挑选 加入到用于路线推荐的知识库中,通过这些挖掘 出最适合该用户的路线推荐给用户:Lu等B使用 出的路线帮助新用户进行旅游路线规划.可以提 从Panoramio中收集的大量带地理标签的照片, 高路线规划的准确度和个性化程度。 提出一个旅行路线生成算法,该方法考虑到在每 利用带地理标签的用户照片进行旅游路线规 个位置花费的时间、总旅行时间和用户偏好。 上述工作并没有将用户行为习惯、兴趣偏好 划的工作是当前旅游路线规划问题研究领域中的 和路线的流行度进行结合,路线规划结果的个性 一大热点。其中一类工作的重点是从地理标签照 化程度不高。此外,在对用户进行路线规划时并 片中挖掘出隐含信息,进而得到用户的旅行习 没有过多地考虑上下文信息,如天气、访问时间、 惯、移动模式或兴趣偏好等信息为用户进行路线 季节等,而这些因素往往影响了旅行者的访问习 规划。而另一类将重点放在从照片中挖掘序列特 惯,进而使得推荐结果的准确性大大降低。文 性,之后利用挖掘到的序列特性结合概率模型, 献[35-36]基于以上不足出发,在利用用户照片数 得到从一个景点最有可能去往的下一个景点信 据的同时加入更多的上下文信息来提高路线推荐 息,最终生成路线规划结果,这类工作的推荐结 结果的准确性。例如,Arain等Bm利用带地理标签 果更倾向于路线的流行程度。 的照片提取旅游景点语义信息的同时挖掘用户喜 Sun等B将重点放在挖掘旅游路线中的道路 好信息,在进行推荐时考虑到用户的当前上下文 片段信息上,而不是挖掘用户相关信息,通过计 信息,包括时空上下文信息、社交上下文信息和 算得到道路片段的流行度进行两个景点间的道路 天气上下文信息。Huang基于游客对景点进行 推荐。首先利用空间聚类对照片进行分类,而在 访问时在上下文存在相似性的原理出发,提出一 噪音数据的处理上,提出一种熵过滤方法从照片 种基于启发式的上下文相似度的计算方法,能够 数据中去除掉与旅行无关的照片,具体实现如式 准确刻画用户间的上下文相似性,从而在对用户 (1)、式(2): 进行路线推荐的过程中加入上下文信息,给用户 Mon(ar) 提供更加准确的推荐;这种方法不但能够用于照 E(w=- P(u)log P(u) (1) 片数据,同样可以在用户GPS轨迹、签到信息等 D.(u) 数据中使用,提供具有上下文感知的推荐结果。 P(W)= (2) 3.2.3利用用户签到数据进行求解 ΣD.m 随着基于位置的服务的兴起,Facebook等社 式中:D()是在目标区域用户u在第i个月的拍 交网络提供了用户“签到”的服务,用户通过该服 照天数;Mon(u)是用户u在目标区域拍照的月 务可以将自己当前的访问地点与时间信息展现在 数,作者使用一个阈值E(),当超过这个值时,就 自己的主页上。基于签到数据进行路线规划是近估计用户的旅行行为频率,然后基于朴素贝叶斯 模型生成一个符合用户旅行习惯的路线。2) 在路 线生成的过程中考虑了用户冷启动问题,利用所 有用户的隐含因子向量的平均值作为未挖掘出用 户旅行习惯的用户的隐含因子向量;此外,该方 法还融合了用户旅行习惯中的最大可能出行距 离,能够更好地限制生成路线的长度来满足用户 的历史出行习惯。实验结果表明,这 2 种方法在 召回率和准确率上均有更好的表现,但这两种方 法在处理用户旅行习惯时,并没有考虑用户旅 行习惯的序列性,也没有考虑用户旅行时的动 态性,在生成路线结果的合理性上存在一定的 偏差。 3.2.2 利用带地理标签的照片进行求解 目前,社交网站中存在大量带地理标签的照 片数据,从这些照片数据中分析历史用户位置在 地理空间中的分布特征和用户位置随时间的变化 特征可以挖掘出用户的行进路线,这些路线可以 加入到用于路线推荐的知识库中,通过这些挖掘 出的路线帮助新用户进行旅游路线规划,可以提 高路线规划的准确度和个性化程度。 利用带地理标签的用户照片进行旅游路线规 划的工作是当前旅游路线规划问题研究领域中的 一大热点。其中一类工作的重点是从地理标签照 片中挖掘出隐含信息,进而得到用户的旅行习 惯、移动模式或兴趣偏好等信息为用户进行路线 规划。而另一类将重点放在从照片中挖掘序列特 性,之后利用挖掘到的序列特性结合概率模型, 得到从一个景点最有可能去往的下一个景点信 息,最终生成路线规划结果,这类工作的推荐结 果更倾向于路线的流行程度。 Sun 等 [31]将重点放在挖掘旅游路线中的道路 片段信息上,而不是挖掘用户相关信息,通过计 算得到道路片段的流行度进行两个景点间的道路 推荐。首先利用空间聚类对照片进行分类,而在 噪音数据的处理上,提出一种熵过滤方法从照片 数据中去除掉与旅行无关的照片,具体实现如式 (1)、式 (2): E(u) = − Mon( ∑u) i Pi(u)logPi(u) (1) Pi(u) = Di(u) Mon( ∑u) i Di(u) (2) 式中:Di (u) 是在目标区域用户 u 在第 i 个月的拍 照天数;Mon(u) 是用户 u 在目标区域拍照的月 数,作者使用一个阈值 E(u),当超过这个值时,就 将该照片的拍摄者认定为本地居民,否则认为是 游客拍摄的照片。最后利用 DBSCAN 算法从照 片数据中识别出地标建筑,并按照流行度进行排 序。实验数据表明,该方法能够给用户推荐一个 包括合适景点且路线长度适中的旅游路线,但这 种方法存在一定的缺点,主要体现在计算兴趣点 流行度时并没有考虑游客的经验和知识。 Wei 等 [32]提出了基于集体知识的路线推理框 架。首先给定一个位置序列和时间跨度,通过以 相互加强的方式聚合用户照片数据,得到流行的 路线信息,之后路线算法根据用户指定的查询来 构造 top-k 路线。算法可以在 0.5 s 内找到前 3 个 路线,与其相应的地理实况相比,距离误差小于 300 m。 Tai 等 [33]使用关联规则挖掘和序列模式挖掘 从用户带地理标签的照片中提取用户对热门景点 的访问序列,从而进一步得到流行路线信息,之 后基于用户的历史访问信息,从这些路线中挑选 出最适合该用户的路线推荐给用户;Lu 等 [34]使用 从 Panoramio 中收集的大量带地理标签的照片, 提出一个旅行路线生成算法,该方法考虑到在每 个位置花费的时间、总旅行时间和用户偏好。 上述工作并没有将用户行为习惯、兴趣偏好 和路线的流行度进行结合,路线规划结果的个性 化程度不高。此外,在对用户进行路线规划时并 没有过多地考虑上下文信息,如天气、访问时间、 季节等,而这些因素往往影响了旅行者的访问习 惯,进而使得推荐结果的准确性大大降低。文 献[35-36]基于以上不足出发,在利用用户照片数 据的同时加入更多的上下文信息来提高路线推荐 结果的准确性。例如,Arain 等 [37]利用带地理标签 的照片提取旅游景点语义信息的同时挖掘用户喜 好信息,在进行推荐时考虑到用户的当前上下文 信息,包括时空上下文信息、社交上下文信息和 天气上下文信息。Huang[38]基于游客对景点进行 访问时在上下文存在相似性的原理出发,提出一 种基于启发式的上下文相似度的计算方法,能够 准确刻画用户间的上下文相似性,从而在对用户 进行路线推荐的过程中加入上下文信息,给用户 提供更加准确的推荐;这种方法不但能够用于照 片数据,同样可以在用户 GPS 轨迹、签到信息等 数据中使用,提供具有上下文感知的推荐结果。 3.2.3 利用用户签到数据进行求解 随着基于位置的服务的兴起,Facebook 等社 交网络提供了用户“签到”的服务,用户通过该服 务可以将自己当前的访问地点与时间信息展现在 自己的主页上。基于签到数据进行路线规划是近 ·86· 智 能 系 统 学 报 第 14 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有