正在加载图片...
第2期 陈万志,等:基于用户移动轨迹的个性化健康建议推荐方法 ·265· 活模式[1,融合群体数据来发现热点地区和经典 的交通工具判别主要依据轨迹序列中时间序列与位 线路)],甚至挖掘人和人之间的相关性[8及个体 移距离计算得到的平均速度来实现,但在交通工具 在地域之间的活动模式[0)等等都具有十分重要 的速度不均衡,特别是城市交通状况的影响导致这 的现实意义。特别是在云计算和大数据分析背景 种判断方法的识别精度小于50%。另外用户在两 下,以海量用户轨迹数据分布式云存储为基础,对用 次轨迹采集点的区间如变换交通方式,则使得同一 户移动轨迹数据进行深度的分析和挖掘,完成“数 段移动轨迹可能会由多种交通方式所构成,若不能 据-信息-知识-智能”的计算过程,实现更深层次、 每个位移区间的交通方式原子化,必然导致判断结 更人性化、更有效的为用户提供基于位置的增值延 果也会包含不可避免的错误。 伸性服务[2] 文献[4-6]针对上述问题提出的解决方法是:采 现代社会人类复杂的社会交际和迁移活动使得 用一种有效的路线分割方法,其主要的思想是利用 人与社会、人与自然环境的关联复杂性突显,自然和 步行路段来分割轨迹:通过发现一些受交通状况影 社会环境均可影响人体健康,因此关注用户的身体 响不大的特征,如方向改变率等,并结合监督学习的 和心理健康是同等重要的。通过用户移动行为轨迹 方法来训练一个分类模型:采用一种后处理方法,从 及周边区域特征等组成的用户社会行为相关信息, 大量的线路中挖掘出一个隐含的地图,并分析了不 研究如何在用户移动轨迹数据与健康体征信息密切 同路段上各种交通工具的使用概率和交通工具之间 关联的海量空间数据分布式云存储和计算架构的基 的转移概率。因此,巧妙地利用了自然常识、地理限 础上实现为用户提供个性化的心理健康建议推荐信 制和地图信息来修正错误的判别。 息服务是大数据分析领域性应用中心理疾病防治与 用户历史轨迹中出现的频繁模式反映了个人的 个性化健康指导方面的主要难点问题。 生活习惯和行为规律,若能够从轨迹中推理挖掘出 GPS采集的数据是用户移动行为轨迹数据的主 这些知识,服务提供商将会为用户提供更深入、更个 要来源,其中采样精度与采样频率对后续的分析有 性化的位置服务[)。而要从轨迹中挖掘这些频繁 较大影响,存在干扰因素的数据直接用于用户数据 模式首先要解决的问题是如何对个人的历史轨迹进 挖掘时往往得到的不是预期的效果。对于采样误差 行建模。可以通过算法检测出该用户停留过的有效 的问题而言,一般地,民用GPS定位精度在米级,在 位置,一个用户的历史轨迹就可以基于这些位置表 某些道路稠密的地段的误差将使用户的当前位置映 达为一个停留位置序列,这样既可以挖掘出用户行 射到错误的道路上导致影响用户的定位与导航功 为的重点,同时也大大减轻了数据处理量。更进一 能,比较成熟的地图匹配(map matching)的方法是 步讲,由于用户多次访问同一地点所产生的停留点 将带有位置偏差的GPS轨迹映射到正确的道路上, 由于GPS数据偏差原因可能不一定是完全一致的, 从而实现导航质量的提高,但是如何实现采样误差 因此直接对停留点进行对比并是不可行的,这就需 GPS数据的用户社会行为分析与挖掘尚无相关的研 要对从轨迹中提取出来的停留点进行聚类分析。将 究和方法。而对于采样频率低的问题而言,直接简 相近的停留点分配到同一个聚类中,此后再用各个 单的提高采样率方法来处理由于实时获取GPS设 停留点所归属的聚类来替换该停留点,进而将停留 备位置信息的通信和存储代价限制而无法实施。文 点序列进一步转化为相应的聚类序列,最终使得用 献[2]针对这种低采样率的GPS轨迹提出了一种基 户在不同时间段的历史轨迹可以进行对比。在用户 于全局信息的匹配方法,通过分析“存疑点”周围 历史轨迹的模型基础上,可采用FP-growth、Closet-+ “确定点”的位置信息与关系信息,从而确定“存疑 等算法来挖掘其中的频繁项集,并且这些频繁模式 点”可能出现的大致位置,这种处理方案可以实现 是可以相互组合和连接的,从而可进一步挖掘出一 各采样点关联的过渡性轨迹平滑和底图匹配,但如 些表征了用户生活、行为规律的顺序模型。 何在用户移动速度不稳或POI(point of interest)信 综上所述,现有基于位置的服务一般都是直接 息点稠密等情况下有效地动态描述用户移动轨迹, 通过用户提供的位置数据进行处理,缺乏对这些数 进而挖掘其所处驻点区域的社会行为特性还无法得 据的进一步分析和挖掘,忽略了这些位置数据中蕴 到解决。 含的信息和知识。因此,研究以云存储和计算技术 采集用户移动轨迹时用户的交通出行方式可能 为基础,通过位置信息与地图POI兴趣点数据的融 是不同的,因此,若能够从用户的移动轨迹信息中挖 合实现对用户轨迹数据更深人的分析和挖掘得到更 掘出轨迹采集时用户的出行模式,则对用户的分类 丰富的知识,最终达到更智能的为用户推送个性化 和信息推荐是有辅助意义的。当前基于GPS轨迹 健康建议信息服务的目的。活模式[1⁃6] ,融合群体数据来发现热点地区和经典 线路[7] ,甚至挖掘人和人之间的相关性[8⁃9] 及个体 在地域之间的活动模式[10⁃11] 等等都具有十分重要 的现实意义。 特别是在云计算和大数据分析背景 下,以海量用户轨迹数据分布式云存储为基础,对用 户移动轨迹数据进行深度的分析和挖掘,完成“数 据-信息-知识-智能”的计算过程,实现更深层次、 更人性化、更有效的为用户提供基于位置的增值延 伸性服务[12] 。 现代社会人类复杂的社会交际和迁移活动使得 人与社会、人与自然环境的关联复杂性突显,自然和 社会环境均可影响人体健康,因此关注用户的身体 和心理健康是同等重要的。 通过用户移动行为轨迹 及周边区域特征等组成的用户社会行为相关信息, 研究如何在用户移动轨迹数据与健康体征信息密切 关联的海量空间数据分布式云存储和计算架构的基 础上实现为用户提供个性化的心理健康建议推荐信 息服务是大数据分析领域性应用中心理疾病防治与 个性化健康指导方面的主要难点问题。 GPS 采集的数据是用户移动行为轨迹数据的主 要来源,其中采样精度与采样频率对后续的分析有 较大影响,存在干扰因素的数据直接用于用户数据 挖掘时往往得到的不是预期的效果。 对于采样误差 的问题而言,一般地,民用 GPS 定位精度在米级,在 某些道路稠密的地段的误差将使用户的当前位置映 射到错误的道路上导致影响用户的定位与导航功 能,比较成熟的地图匹配(map matching) 的方法是 将带有位置偏差的 GPS 轨迹映射到正确的道路上, 从而实现导航质量的提高,但是如何实现采样误差 GPS 数据的用户社会行为分析与挖掘尚无相关的研 究和方法。 而对于采样频率低的问题而言,直接简 单的提高采样率方法来处理由于实时获取 GPS 设 备位置信息的通信和存储代价限制而无法实施。 文 献[2]针对这种低采样率的 GPS 轨迹提出了一种基 于全局信息的匹配方法,通过分析“存疑点” 周围 “确定点”的位置信息与关系信息,从而确定“存疑 点”可能出现的大致位置,这种处理方案可以实现 各采样点关联的过渡性轨迹平滑和底图匹配,但如 何在用户移动速度不稳或 POI( point of interest) 信 息点稠密等情况下有效地动态描述用户移动轨迹, 进而挖掘其所处驻点区域的社会行为特性还无法得 到解决。 采集用户移动轨迹时用户的交通出行方式可能 是不同的,因此,若能够从用户的移动轨迹信息中挖 掘出轨迹采集时用户的出行模式,则对用户的分类 和信息推荐是有辅助意义的。 当前基于 GPS 轨迹 的交通工具判别主要依据轨迹序列中时间序列与位 移距离计算得到的平均速度来实现,但在交通工具 的速度不均衡,特别是城市交通状况的影响导致这 种判断方法的识别精度小于 50%。 另外用户在两 次轨迹采集点的区间如变换交通方式,则使得同一 段移动轨迹可能会由多种交通方式所构成,若不能 每个位移区间的交通方式原子化,必然导致判断结 果也会包含不可避免的错误。 文献[4⁃6]针对上述问题提出的解决方法是:采 用一种有效的路线分割方法,其主要的思想是利用 步行路段来分割轨迹;通过发现一些受交通状况影 响不大的特征,如方向改变率等,并结合监督学习的 方法来训练一个分类模型;采用一种后处理方法,从 大量的线路中挖掘出一个隐含的地图,并分析了不 同路段上各种交通工具的使用概率和交通工具之间 的转移概率。 因此,巧妙地利用了自然常识、地理限 制和地图信息来修正错误的判别。 用户历史轨迹中出现的频繁模式反映了个人的 生活习惯和行为规律,若能够从轨迹中推理挖掘出 这些知识,服务提供商将会为用户提供更深入、更个 性化的位置服务[3] 。 而要从轨迹中挖掘这些频繁 模式首先要解决的问题是如何对个人的历史轨迹进 行建模。 可以通过算法检测出该用户停留过的有效 位置,一个用户的历史轨迹就可以基于这些位置表 达为一个停留位置序列,这样既可以挖掘出用户行 为的重点,同时也大大减轻了数据处理量。 更进一 步讲,由于用户多次访问同一地点所产生的停留点 由于 GPS 数据偏差原因可能不一定是完全一致的, 因此直接对停留点进行对比并是不可行的,这就需 要对从轨迹中提取出来的停留点进行聚类分析。 将 相近的停留点分配到同一个聚类中,此后再用各个 停留点所归属的聚类来替换该停留点,进而将停留 点序列进一步转化为相应的聚类序列,最终使得用 户在不同时间段的历史轨迹可以进行对比。 在用户 历史轨迹的模型基础上,可采用 FP⁃growth、Closet+ 等算法来挖掘其中的频繁项集,并且这些频繁模式 是可以相互组合和连接的,从而可进一步挖掘出一 些表征了用户生活、行为规律的顺序模型。 综上所述,现有基于位置的服务一般都是直接 通过用户提供的位置数据进行处理,缺乏对这些数 据的进一步分析和挖掘,忽略了这些位置数据中蕴 含的信息和知识。 因此,研究以云存储和计算技术 为基础,通过位置信息与地图 POI 兴趣点数据的融 合实现对用户轨迹数据更深入的分析和挖掘得到更 丰富的知识,最终达到更智能的为用户推送个性化 健康建议信息服务的目的。 第 2 期 陈万志,等: 基于用户移动轨迹的个性化健康建议推荐方法 ·265·
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有