正在加载图片...
·88 智能系统学报 第14卷 如:一个用户在一个景点花费的时间过长时,去 更贴近于现实生活,符合用户行为习惯。然而,在 往下一个景点的概率可能会发生相应的改变。 处理用户数据上也会花费一定的时间,并且当前 现阶段越来越多的工作基于这些用户生成内 存在的主要问题是,推荐的结果主要停留在热门 容出发,从中挖掘用户的历史行为习惯和出行轨 的景点和路线上,在推荐时并没有过多地考虑到 迹、旅行路线等信息,其中一些具有代表性的工 用户的偏好和用户所处地点和时间的上下文信 作如表2所示,这些工作的优点是可以避免传统 息(如天气、访问季节等),推荐结果的个性化程度 基于建模方法的复杂度问题,在路线规划结果上 和准确性方面有很大的提升空间。 表2基于UGC进行旅游路线规划工作对比 Table 2 Comparison of UGC based tourism route-planning 应用主要数据类型 挖掘的知识内容 应用方法 代表文献 用户照片、签到信息 签到位置分布特征、景点信息 启发式算法 [44 用户评论、旅游游记 热门景点、景点属性、用户位置轨迹 自然语言处理、序列模式挖掘算法 [43] 景点信息、旅游游记 用户偏好特征、用户位置轨迹 监督学习、分类算法、马尔可夫模型 [45] 用户照片 景点信息、位置分布、社会关联性 关联规则挖掘、马尔可夫链模型 [35-36] 用户签到信息 签到频率、社会关系、位置移动模式 相似性计算、协同过滤 [46] 用户GPS轨迹 位置轨迹关联性、位置地理分布 序列挖掘、基于模型推荐 [47 3.3旅游路线规划问题的重点和难点 有的多数工作只考虑到以固定的起点和终点进行 在进行旅游路线规划问题求解时,除了要对 规划,用户被限制在一组预定义的地点中,这与 用户建立详细的用户画像以及挖掘用户的行为习 现实的场景相差较大,显然使用固定集合中预定 惯和相关偏好之外,还需要考虑用户的上下文信 义的位置(例如POI和酒店)计算的旅行成本不能 息和相关旅游信息,以便进一步提高推荐结果的 支持动态的使用场景,因此应该对研究的问题进 准确性。基于这种认识,在对3.1节、3.2节中相 一步泛化,其中旅程的开始、结束位置可以是目 关工作进行考察的基础上,设计了图1所示的旅 的地城市中的任意位置,在运行时才被确定。此外, 游路线规划系统整体架构。 在建模的过程中加入更多的用户约束和用户上下 文信息,如天气、位置和季节信息等,能够在贴近 用户约束 用户交互 用户需求的同时极大地提高路线推荐的准确性; 智能设备感知信息 在进行精准建模时还可以参照一些其他领域的研 上:《位置、方向、速度等 用户偏好 历史轨迹 用驴上下文 究工作,利用其中的一些优化算法,捕获旅游路 同伴意见 人物类型 行为偏好 线规划问题中密切相关的约束,如建模参数等。 同伴人口统计信息 显式信息 隐式信息 3.3.2数据预处理 获取 同伴社交网络信息 获取。 建立用户画像 在利用用户生成内容进行旅游路线规划时, .社会上下文. 数据的来源主要集中在相关网站和用户的个人分 于基准建模寻找最优路线 系列启发式和元启发 享,得到的初始数据存在很多噪音信息或者数据 旅游业信息包括美食 式算法等) 缺失的现象,而数据的数量和准确性直接关系到 住宿、景点等信息) 基于用户生成内容生成可行 所生成推荐路线的质量,因此如何对获取到的数 解(包括利用用户历史GPS 轨迹、用户照片 三方服务信息(如景 签到信息等 数据 据进行精确的预处理是此类工作的一个研究重 点开放时 交通时间 表芋 旅游路线规划方法 点。噪音数据处理的结果会直接影响最终的推荐 结果,例如,对常住居民拍摄的照片和游客拍摄 旅游领域知识(如推理 规则、领域本体知识等) 罪秀美熊路黌但括 2D/3D地图泉示 的照片进行区分,能够更加准确地挖掘出游客历 虚拟现实、增强现实的形式等) 史旅行习惯B乳,在使用用户历史GPS轨迹挖掘轨 图1旅游路线规划系统整体架构 迹信息进行路线规划时,由于受GPS精度和信号 Fig.1 Tourism route-planning system framework 干扰等因素影响,导致原始GPS数据中可能存在 3.3.1贴近现实进行精准建模 些异常点,而这些异常点属于噪音数据,会影 在对旅游路线规划问题进行建模求解时,现 响后续用户轨迹挖掘时的精度和准确性,可以基如:一个用户在一个景点花费的时间过长时,去 往下一个景点的概率可能会发生相应的改变。 现阶段越来越多的工作基于这些用户生成内 容出发,从中挖掘用户的历史行为习惯和出行轨 迹、旅行路线等信息,其中一些具有代表性的工 作如表 2 所示,这些工作的优点是可以避免传统 基于建模方法的复杂度问题,在路线规划结果上 更贴近于现实生活,符合用户行为习惯。然而,在 处理用户数据上也会花费一定的时间,并且当前 存在的主要问题是,推荐的结果主要停留在热门 的景点和路线上,在推荐时并没有过多地考虑到 用户的偏好和用户所处地点和时间的上下文信 息 (如天气、访问季节等),推荐结果的个性化程度 和准确性方面有很大的提升空间。 3.3 旅游路线规划问题的重点和难点 在进行旅游路线规划问题求解时,除了要对 用户建立详细的用户画像以及挖掘用户的行为习 惯和相关偏好之外,还需要考虑用户的上下文信 息和相关旅游信息,以便进一步提高推荐结果的 准确性。基于这种认识,在对 3.1 节、3.2 节中相 关工作进行考察的基础上,设计了图 1 所示的旅 游路线规划系统整体架构。 3.3.1 贴近现实进行精准建模 在对旅游路线规划问题进行建模求解时,现 有的多数工作只考虑到以固定的起点和终点进行 规划,用户被限制在一组预定义的地点中,这与 现实的场景相差较大,显然使用固定集合中预定 义的位置 (例如 POI 和酒店) 计算的旅行成本不能 支持动态的使用场景,因此应该对研究的问题进 一步泛化,其中旅程的开始、结束位置可以是目 的地城市中的任意位置,在运行时才被确定。此外, 在建模的过程中加入更多的用户约束和用户上下 文信息,如天气、位置和季节信息等,能够在贴近 用户需求的同时极大地提高路线推荐的准确性; 在进行精准建模时还可以参照一些其他领域的研 究工作,利用其中的一些优化算法,捕获旅游路 线规划问题中密切相关的约束,如建模参数等。 3.3.2 数据预处理 在利用用户生成内容进行旅游路线规划时, 数据的来源主要集中在相关网站和用户的个人分 享,得到的初始数据存在很多噪音信息或者数据 缺失的现象,而数据的数量和准确性直接关系到 所生成推荐路线的质量,因此如何对获取到的数 据进行精确的预处理是此类工作的一个研究重 点。噪音数据处理的结果会直接影响最终的推荐 结果,例如,对常住居民拍摄的照片和游客拍摄 的照片进行区分,能够更加准确地挖掘出游客历 史旅行习惯[33] ;在使用用户历史 GPS 轨迹挖掘轨 迹信息进行路线规划时,由于受 GPS 精度和信号 干扰等因素影响,导致原始 GPS 数据中可能存在 一些异常点,而这些异常点属于噪音数据,会影 响后续用户轨迹挖掘时的精度和准确性,可以基 表 2 基于 UGC 进行旅游路线规划工作对比 Table 2 Comparison of UGC based tourism route-planning 应用主要数据类型 挖掘的知识内容 应用方法 代表文献 用户照片、签到信息 签到位置分布特征、景点信息 启发式算法 [44] 用户评论、旅游游记 热门景点、景点属性、用户位置轨迹 自然语言处理、序列模式挖掘算法 [43] 景点信息、旅游游记 用户偏好特征、用户位置轨迹 监督学习、分类算法、马尔可夫模型 [45] 用户照片 景点信息、位置分布、社会关联性 关联规则挖掘、马尔可夫链模型 [35−36] 用户签到信息 签到频率、社会关系、位置移动模式 相似性计算、协同过滤 [46] 用户 GPS 轨迹 位置轨迹关联性、位置地理分布 序列挖掘、基于模型推荐 [47] 用户约束 用户偏好 人物类型 显式信息 获取 隐式信息 获取 用户交互 历史轨迹 行为偏好 建立用户画像 用户上下文 同伴意见 同伴人口统计信息 同伴社交网络信息 社会上下文 旅游路线规划方法 上下文信息 第三方实时天气、 交通信息 智能设备感知信息 (位置、方向、速度等) 旅游业信息 (包括美食、 住宿、景点等信息) 第三方服务信息 (如景 点开放时间、交通时间 表等) 旅游信息 旅游领域知识 (如推理 规则、领域本体知识等) 基于基准建模寻找最优路线 (包括一系列启发式和元启发 式算法等) 基于用户生成内容生成可行 解 (包括利用用户历史 GPS 轨迹、用户照片、签到信息等 数据) 展示个性化的路线规划结果 (包括 排名列表展示,2D/3D 地图显示、 虚拟现实、增强现实的形式等) 图 1 旅游路线规划系统整体架构 Fig. 1 Tourism route-planning system framework ·88· 智 能 系 统 学 报 第 14 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有