正在加载图片...
3.数据质量检查 现今,手机信令数据已经被广泛应用于城市的交通特征出行分析,但是,不同的人清洗 数据的算法、阈值设置都不一样。为了保证算法的可靠性,需要对清洗的数据进行数据质量 检验。主要验证手机基站手机数据是否缺失,居住地和工作地识别、出行识别算法是否正确 大致的检验过程如下:用手机数据的人口数与已有的数据进行比较,判别居住地和工作地识 别算法的结果是否可靠;计算每小时的出行数量,从而找出数据收集比较稳定的日期作为后 面出行特征分析:计算手机数据的早高峰ωD,用于与宏观模型的早高峰出行OD对比,检查 出行识别算法的正确性。 31人口分布比较 考虑到手机数据中的人口不是全样数据,这里用各区人口数量占总人口比重进行比较 比较结果显示,不管是与宏观模型数据还是统计年鉴数据比较,误差最大不超过5%,误差 最大的行政区为福田,可能原因是福田、罗湖区原本发展程度已达到饱和,且深圳原关外地 区近年来建设用地不断扩大、交通路网不断完善、居民出行更加方便、配套设施逐渐齐全、 居民的择居选择受就业岗位地理位置的制约力下降,人们很多会选择居住在原关外。 2017年手机数据 2013年宏观模型数据 一圆 宝安龙岗龙华南山福田光明罗湖坪山盐田大鹏 图3手机数据与宏观棋型和统计年鉴人口分布比较 32早高峰OD比较 与宏观模型(2014年)比较结果显示,最大流量通道基本相似,特别是南部几个大区之 间的关联度,连接宝安、南山、福田和罗湖的通道联系强度基本一致:龙华到南山和福田 龙岗到罗湖和龙华的联系关系也一样紧密。 图4手机数据与宏观模型期望线对比3. 数据质量检查 现今,手机信令数据已经被广泛应用于城市的交通特征出行分析,但是,不同的人清洗 数据的算法、阈值设置都不一样。为了保证算法的可靠性,需要对清洗的数据进行数据质量 检验。主要验证手机基站手机数据是否缺失,居住地和工作地识别、出行识别算法是否正确。 大致的检验过程如下:用手机数据的人口数与已有的数据进行比较,判别居住地和工作地识 别算法的结果是否可靠;计算每小时的出行数量,从而找出数据收集比较稳定的日期作为后 面出行特征分析;计算手机数据的早高峰 OD,用于与宏观模型的早高峰出行 OD 对比,检查 出行识别算法的正确性。 3.1 人口分布比较 考虑到手机数据中的人口不是全样数据,这里用各区人口数量占总人口比重进行比较。 比较结果显示,不管是与宏观模型数据还是统计年鉴数据比较,误差最大不超过 5%,误差 最大的行政区为福田,可能原因是福田、罗湖区原本发展程度已达到饱和,且深圳原关外地 区近年来建设用地不断扩大、交通路网不断完善、居民出行更加方便、配套设施逐渐齐全、 居民的择居选择受就业岗位地理位置的制约力下降,人们很多会选择居住在原关外。 图 3 手机数据与宏观模型和统计年鉴人口分布比较 3.2 早高峰 OD 比较 与宏观模型(2014 年)比较结果显示,最大流量通道基本相似,特别是南部几个大区之 间的关联度,连接宝安、南山、福田和罗湖的通道联系强度基本一致;龙华到南山和福田、 龙岗到罗湖和龙华的联系关系也一样紧密。 图 4 手机数据与宏观模型期望线对比
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有