地铁客流量灰色关联度及预测模型研究 叶然然赵姣 长安大学汽车学院,陕西西安710064) 摘要:在仅有通车5年的地铁客流量小样本数据条件下,为了合理、科学地预测各城市 地铁客流量,量化不同影响因素对客流量的影响程度,本文提出了基于 Matlab的 灰色系统地铁客流量预测模型;以实际调硏的三个城市8条地铁线路的统计数据为 样本,运用灰色关联度模型对不同影响因素的影响程度进行量化评估;分别建立GM (1,1)单变量预测模型与GM(1,N)多变量预测模型对客流量进行预测分析。研 究结果表明:本文选取的影响因素对客流量的灰色关联度均大于0.5,说明它们对 客流量均具有较大影响;GM(1,1)预测模型85%的预测结果误差在10%以内,GM (1,N)预测模型80%的预测结果误差大于40%,从而得出GM(1,1)预测模型比 GM(1,N)预测模型的预测结果更加淮准确。因此,针对通车5年的地铁客流量小样 本数据预测,选用单变量预测模型更加科学、合理。 关镳词:交通运输工程;地铁客流量预测;灰色关联度;灰色预测模型 Research on grey relational grade and prediction model of subway passenger YE Ran-ran ZHAO Jigo ( School of automobile, Chang'an University, Shanxi Xi'an 710064) Abstract: Under the condition of small sample data of metro passenger flow quantity with only 5 years of operation, in order to predict metro passenger flow quantity reasonably and scientifically in each city, the research quantified the influence degree of different influencing factors on passenger flow quantity. This paper proposes a prediction model of the grey system of subway passenger flow quantity based on MATLAB. Based on the statistical data of 8 metro lines in three cities, this paper quantitatively evaluates the influence degree of different influencing factors by using grey correlation grade model, and establishes the GM(l, I) single variable prediction model and the GM(l, N)multi-variable prediction model to predict the passenger flow quantity. The results show that the grey correlation degree of the influencing factors selected in this paper is greater than 0.5, which indicates that they have great influence on the passenger flow quantity The prediction error of the GM(1, 1)prediction model of 85% is less than 10%, and that of the GM(I, N prediction model of 80% is more than 40%, which indicates that the Gm(l, I) prediction model is more accurate than the GM(1, N)prediction model. Therefore, the single variable prediction model is more reasonable and scientific for the small sample data prediction of subway passenger flow quantity for 5 years (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
地铁客流量灰色关联度及预测模型研究 叶然然赵姣 (长安大学 汽车学院,陕西 西安 710064) 摘要: 在仅有通车 5 年的地铁客流量小样本数据条件下,为了合理、科学地预测各城市 地铁客流量,量化不同影响因素对客流量的影响程度,本文提出了基于 Matlab 的 灰色系统地铁客流量预测模型;以实际调研的三个城市 8 条地铁线路的统计数据为 样本,运用灰色关联度模型对不同影响因素的影响程度进行量化评估;分别建立 GM (1,1)单变量预测模型与 GM(1,N)多变量预测模型对客流量进行预测分析。研 究结果表明:本文选取的影响因素对客流量的灰色关联度均大于 0.5,说明它们对 客流量均具有较大影响;GM(1,1)预测模型 85%的预测结果误差在 10%以内,GM (1,N)预测模型 80%的预测结果误差大于 40%,从而得出 GM(1,1)预测模型比 GM(1,N)预测模型的预测结果更加准确。因此,针对通车 5 年的地铁客流量小样 本数据预测,选用单变量预测模型更加科学、合理。 关键词:交通运输工程;地铁客流量预测;灰色关联度;灰色预测模型 Research on grey relational grade and prediction model of subway passenger flow quantity YE Ran-ran ZHAO Jiao (School of automobile,Chang’an University,Shanxi Xi’an 710064) Abstract: Under the condition of small sample data of metro passenger flow quantity with only 5 years of operation, in order to predict metro passenger flow quantity reasonably and scientifically in each city, the research quantified the influence degree of different influencing factors on passenger flow quantity.This paper proposes a prediction model of the grey system of subway passenger flow quantity based on MATLAB. Based on the statistical data of 8 metro lines in three cities, this paper quantitatively evaluates the influence degree of different influencing factors by using grey correlation grade model, and establishes the GM (1,1) single variable prediction model and the GM (1,N) multi-variable prediction model to predict the passenger flow quantity. The results show that the grey correlation degree of the influencing factors selected in this paper is greater than 0.5, which indicates that they have great influence on the passenger flow quantity. The prediction error of the GM (1,1) prediction model of 85% is less than 10%, and that of the GM (1,N) prediction model of 80% is more than 40%,which indicates that the GM (1,1) prediction model is more accurate than the GM (1, N) prediction model. Therefore, the single variable prediction model is more reasonable and scientific for the small sample data prediction of subway passenger flow quantity for 5 years
Key words: Transportation engineering; subway passenger flow quantity forecasting; grey correlation degree; grey prediction model 引言 近年来,随着国家经济的迅速发展,交通网络的规模越来越大,城市轨道交通也随之快 速发展起来。随着城市轨道交通网络的日益完善及客流量的不断增加,地铁站客流过度饱和 情况经常岀现,尤其是工作日的早晩高峰时段、大型活动和突发事件等情况下[]l因此, 准确的预测地铁客流量有利于地铁的运营管理和车辆调度,建立科学合理的地铁预测模型显 得尤为迫切 近几年众多学者对地铁、公交、铁路等客流量预测的模型进行硏究,大多数都是对短时 客流量进行预测,因为长期的客流量预测比较难,不同时期,不同的经济发展阶段客流量都 会有变化,在短时客流量的预测研究中,所选择的模型主要有两类:一类是基于数学和数理 统计的理论模型,一类是基于计算机的仿真技术模型。研究客流量预测的相关的文献主要集 中于:①姚恩建等提出了基于改进K近邻非参数回归的新站开通初期实时进出站客流量预 测方法[2]。②王炜炜选用BP人工神经网络、灰色模型、重力模型建立了高速铁路影响下的 铁路客流量预测模型对铁路客流量进行预测[3]。③李捷基于深度学习的方法对地铁短时客 流量进行预测硏究[4]④徐逸之等提出了基于栈式自编码的上海地铁短时流量预测模型[5] ⑤王洁提出了粒计算的公交客流量分析方法,并提高了预测公交客流量的精度[6]。但是 大部分对地铁客流量的硏究中,对于影响客流量的因素较多停留在定性分析层面,进行量化 分析的较少。目前,在铁路客车运用效率评价、列车运行图质量评价中较多引用灰色关联度 模型[7、8,而在地铁客流量影响因素分析中采用较少。另外,针对5年小样本数据进行预 测,也没有一个较为明确的预测模型。本文采用灰色关联度模型对地铁客流量的影响因素进 行量化评估,给出各影响因素对地铁客流量的影响程度;对于小样本数据(5个数据)分别 建立GM(1,1)单变量预测模型与GM(1,N)多变量预测模型进行预测,提出适合于小 样本数据的地铁客流量预测方法,并分析了适用性。 二、地铁客流量与自变量灰色关联度分析 (一)地铁客流量影响因素分析 国内大部分城市都修建了较多地铁,由于地铁速度快,运输能力强,日渐为人们喜爱的 种交通出行方式,而影响地铁客流量的因素与很多,比如区域经济发展水平、城镇居民生 活水平、人口数量变化、旅游供给能力等因素9-10 (1)区域经济发展水平 城市的经济发展水平很大程度的影响城市的客流量,经济水平越高的城市就会吸引周围 地区的人们大量涌入,其客流量的数据也会越大。生产总值(GDP),第一、第二、第三生 产总值等都反映了经济发展的情况及水平[1交通运输业作为基本建设近几年来也随着经 济水平的提高在迅猛发展。生产总值记为W1,其单位为亿元。 (2)城镇居民生活水平 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
Key words:Transportation engineering; subway passenger flow quantity forecasting; grey correlation degree; grey prediction model 一、引言 近年来,随着国家经济的迅速发展,交通网络的规模越来越大,城市轨道交通也随之快 速发展起来。随着城市轨道交通网络的日益完善及客流量的不断增加,地铁站客流过度饱和 情况经常出现,尤其是工作日的早晚高峰时段、大型活动和突发事件等情况下[1]。因此, 准确的预测地铁客流量有利于地铁的运营管理和车辆调度,建立科学合理的地铁预测模型显 得尤为迫切。 近几年众多学者对地铁、公交、铁路等客流量预测的模型进行研究,大多数都是对短时 客流量进行预测,因为长期的客流量预测比较难,不同时期,不同的经济发展阶段客流量都 会有变化,在短时客流量的预测研究中,所选择的模型主要有两类:一类是基于数学和数理 统计的理论模型,一类是基于计算机的仿真技术模型。研究客流量预测的相关的文献主要集 中于:①姚恩建等提出了基于改进 K 近邻非参数回归的新站开通初期实时进出站客流量预 测方法[2]。②王炜炜选用 BP 人工神经网络、灰色模型、重力模型建立了高速铁路影响下的 铁路客流量预测模型对铁路客流量进行预测[3]。③李捷基于深度学习的方法对地铁短时客 流量进行预测研究[4]。④徐逸之等提出了基于栈式自编码的上海地铁短时流量预测模型[5]。 ⑤王洁提出了粒计算的公交客流量分析方法,并提高了预测公交客流量的精度[6]。但是, 大部分对地铁客流量的研究中,对于影响客流量的因素较多停留在定性分析层面,进行量化 分析的较少。目前,在铁路客车运用效率评价、列车运行图质量评价中较多引用灰色关联度 模型[7、8],而在地铁客流量影响因素分析中采用较少。另外,针对 5 年小样本数据进行预 测,也没有一个较为明确的预测模型。本文采用灰色关联度模型对地铁客流量的影响因素进 行量化评估,给出各影响因素对地铁客流量的影响程度;对于小样本数据(5 个数据)分别 建立 GM(1,1)单变量预测模型与 GM(1,N)多变量预测模型进行预测,提出适合于小 样本数据的地铁客流量预测方法,并分析了适用性。 二、地铁客流量与自变量灰色关联度分析 (一)地铁客流量影响因素分析 国内大部分城市都修建了较多地铁,由于地铁速度快,运输能力强,日渐为人们喜爱的 一种交通出行方式,而影响地铁客流量的因素与很多,比如区域经济发展水平、城镇居民生 活水平、人口数量变化、旅游供给能力等因素[9-10]。 (1)区域经济发展水平 城市的经济发展水平很大程度的影响城市的客流量,经济水平越高的城市就会吸引周围 地区的人们大量涌入,其客流量的数据也会越大。生产总值(GDP),第一、第二、第三生 产总值等都反映了经济发展的情况及水平[11]。交通运输业作为基本建设近几年来也随着经 济水平的提高在迅猛发展。生产总值记为 W1,其单位为亿元。 (2)城镇居民生活水平
经济的快速发展也使得人们的生活水平逐渐提高,居民的收入也越来越充足,人均出行 次数增多,地铁的客流量也相应的增加。由此可见居民的生活水平越高,对地铁等交通运输 设施的需求也越大。能够反映人民的生活水平及结构的指标有居民人均可支配收入、消费价 格指数水平、交通和通信费用支出[12]。城镇居民人均可支配收入记为W2,其单位为元 (3)人口数量发展状况 城市人口的数量对地铁客流量数据的变化有着直接的影响,随着市区和流动人口的逐渐 增多,客运量的需求也在迅速增加。人口越密集的地区,人们出行的频率也就较高。城市人 口数量随着城市经济水平的提高每年都在逐渐增多,人们在城市之间往返的出行次数也在逐 渐增加,因此地铁的客流量数据也逐年增加。城镇人口总数记为W3,其单位为万人。 (4)第三产业的发展 第三产业即各类服务或商品,随着人们生活水平的提高,在满足基本的生活需求后,逐 渐注重生活质量的提高,因此,这就促进了第三产业的发展,其中旅游成为人们所热衷的 种提高自己的生活质量和开拓自己的眼界的方式。如“春节”、“中秋佳节”、“国庆节” 等黄金假期时间,人们更愿意到各大城市去旅游。因此在旅游高峰期,城市地铁的客流量大 大增加。第三产业主要以旅游业为主,其影响指标可以通过第三产业生产总值体现。第三产 业生产总值为W4,单位万人。 (二)建立自变量与因变量的灰色关联分析模型 考虑到影响地铁客流量的某些影响因素很难量化及所收集到信息的局限性,本文从区域 经济发展水平、人们生活水平、人口数量变化、旅游供给能力四个方面选取了4个指标,分 别以西安、长春、成都三个城市的生产总值、居民人均可支配收入、城镇总人口数量、第三 产业总值为指标,建立自变量与因变量的灰色关联度分析模型 (1)初始数据处理 针对确定的四个影响因素,各城市的生产总值、居民人均可支配收入、城镇总人口数量、 第三产业总值进行初步处理,由于四个影响因素量纲不同、意义不同,且在数量上悬殊很大, 因此在进行建模前要先采用初值化算子将各序列样本值化为无量纲数据 设X1=(x(1),X(2),…,X(n))为因素x,的行为序列,D1为序列算子,且 xD=(x()d,x(2)d1…,X,(n)d),其中 x(k)d=x(k)/x():k=,2…,n(1) Dl为处值化算子,为原像,XD为X,在初值化算子D1的像,即初值像[13] (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
经济的快速发展也使得人们的生活水平逐渐提高,居民的收入也越来越充足,人均出行 次数增多,地铁的客流量也相应的增加。由此可见居民的生活水平越高,对地铁等交通运输 设施的需求也越大。能够反映人民的生活水平及结构的指标有居民人均可支配收入、消费价 格指数水平、交通和通信费用支出[12]。城镇居民人均可支配收入记为 W2,其单位为元。 (3)人口数量发展状况 城市人口的数量对地铁客流量数据的变化有着直接的影响,随着市区和流动人口的逐渐 增多,客运量的需求也在迅速增加。人口越密集的地区,人们出行的频率也就较高。城市人 口数量随着城市经济水平的提高每年都在逐渐增多,人们在城市之间往返的出行次数也在逐 渐增加,因此地铁的客流量数据也逐年增加。城镇人口总数记为 W3,其单位为万人。 (4)第三产业的发展 第三产业即各类服务或商品,随着人们生活水平的提高,在满足基本的生活需求后,逐 渐注重生活质量的提高,因此,这就促进了第三产业的发展,其中旅游成为人们所热衷的一 种提高自己的生活质量和开拓自己的眼界的方式。如“春节”、“中秋佳节”、“国庆节” 等黄金假期时间,人们更愿意到各大城市去旅游。因此在旅游高峰期,城市地铁的客流量大 大增加。第三产业主要以旅游业为主,其影响指标可以通过第三产业生产总值体现。第三产 业生产总值为 W4,单位万人。 (二)建立自变量与因变量的灰色关联分析模型 考虑到影响地铁客流量的某些影响因素很难量化及所收集到信息的局限性,本文从区域 经济发展水平、人们生活水平、人口数量变化、旅游供给能力四个方面选取了 4 个指标,分 别以西安、长春、成都三个城市的生产总值、居民人均可支配收入、城镇总人口数量、第三 产业总值为指标,建立自变量与因变量的灰色关联度分析模型。 (1)初始数据处理 针对确定的四个影响因素,各城市的生产总值、居民人均可支配收入、城镇总人口数量、 第三产业总值进行初步处理,由于四个影响因素量纲不同、意义不同,且在数量上悬殊很大, 因此在进行建模前要先采用初值化算子将各序列样本值化为无量纲数据。 设 ( (1), (2),..., (n)) ii i i XX X X 为因素 i X 的行为序列,D1 为序列算子,且 Xiii i D X d X d X nd 1 11 1 1 , ,..., 2 ,其中: 1 1 12 ; , ,..., i ii x kd x k x k n (1) D1 为处值化算子, i X 为原像, i 1 X D 为 i X 在初值化算子 D1 的像,即初值像[13]
经过上述方法进行处理后。得到表1 表1训研各城市消除量纲后样本数据 序号各城市地铁 年份 地铁客流量 12 w3 14 1.000 1.000 1.000 1.0001.000 西安地铁二 1.481 l.199 1.190 1.091 1.5031.344 号线 1.737 1.131 1.533 2.164 长春地铁三 1.198 1.0351.200 号线 1.280 1.320 2017 1.274 0.995 1.000 1.0001.000 l.120 成都地铁一 1.856 1.186 1.0341.247 号线 2017 3.000 1.525 1.299 1.208 (2)自变量与因变量灰色关联度分析 在建立预测模型之前,需要分析各自变量与因变量之间的相关性,即定量分析各城市的 生产总值、居民人均可支配收入、城镇总人口数量、第三产业总值对各城市地铁客流量的影 响程度 采用灰色关联度模型进行自变量与因变量相关性分析 设系统行为序列 X。=(X(1),X(2 ro(n)) X1=(X(1),X X=(X(1),x(2 xn=(X(1),X(2) 对于5∈(0,1),令 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
经过上述方法进行处理后。得到表 1: 表 1 调研各城市消除量纲后样本数据 序号 各城市地铁 年份 地铁客流量 W1 W2 W3 W4 1 西安地铁二 号线 2013 1.000 1.000 1.000 1.000 1.000 2014 1.264 1.121 1.003 1.481 1.199 2015 1.402 1.190 1.091 1.503 1.344 2016 1.737 1.281 1.131 1.533 1.502 2017 2.164 1.529 1.164 1.979 1.802 2 长春地铁三 号线 2013 1.000 1.000 1.000 1.000 1.000 2014 1.118 1.068 1.049 1.002 1.092 2015 1.208 1.105 1.198 1.035 1.200 2016 1.280 1.171 1.193 1.001 1.320 2017 1.362 1.305 1.274 0.995 1.510 3 成都地铁一 号线 2013 1.000 1.000 1.000 1.000 1.000 2014 1.399 1.104 1.090 1.019 1.120 2015 1.856 1.186 1.117 1.034 1.247 2016 2.274 1.336 1.198 1.178 1.413 2017 3.000 1.525 1.299 1.208 1.525 (2)自变量与因变量灰色关联度分析 在建立预测模型之前,需要分析各自变量与因变量之间的相关性,即定量分析各城市的 生产总值、居民人均可支配收入、城镇总人口数量、第三产业总值对各城市地铁客流量的影 响程度。 采用灰色关联度模型进行自变量与因变量相关性分析。 设系统行为序列: XX X X 00 0 0 (1), (2),..., (n) XX X X 11 1 1 (1), (2),..., (n) XX X X ii i i (1), (2),..., (n) XX X X nn n n (1), (2),..., (n) 对于 ( ,) 0 1 ,令
r(o(k), x,(K) 1()-x(6别+哪x()-x((2) ()-x()+5mXmx(k)-x(k) y(xn,x)=1∑(x(),x(6)(3) 则(X,x)称为x0与X的灰色关联度 通过灰色关联度计算公式进行计算,得到各自变量与因变量的关联度,将计算结果汇总 如表2 表2自变量与地铁客流量关联度 序号 各城市地铁 自变量 关联度 w2 0.612 西安地铁二号线 0.794 0.808 0.763 长春地铁三号线 w3 0.572 w4 0.842 0.638 0.618 成都地铁一号线 0.60 0.649 由表2结果可知,从单因素分析各自变量与因变量的关联度均大于0.5,表明各自变量 与因变量的变化趋势大体接近,四个自变量对因变量均有较大影响,选取的四个自变量具有 定的合理性:另外,关联度越大,表示自变量对因变量影响程度越大。但是,四个因素综 合起来对地铁客流量的影响程度无法进行判断 三、地铁客流量灰色系统预测模型 通过上述分析,地铁客流量预测模型中共有四个自变量,从理论上预测模型应选用多变 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
0 0 0 0 0 min min max max , max max i i ik ik i i i i k x k xk xk xk xk xk xk xk xk xk (2) 0 0 1 1 , , n i i k X X xk xk n (3) 则 0 , i X X 称为 0 X 与 i X 的灰色关联度[13]。 通过灰色关联度计算公式进行计算,得到各自变量与因变量的关联度,将计算结果汇总 如表 2: 表 2 自变量与地铁客流量关联度 序号 各城市地铁 自变量 关联度 1 西安地铁二号线 W1 0.689 W2 0.612 W3 0.794 W4 0.808 2 长春地铁三号线 W1 0.763 W2 0.806 W3 0.572 W4 0.842 3 成都地铁一号线 W1 0.638 W2 0.618 W3 0.601 W4 0.649 由表 2 结果可知,从单因素分析各自变量与因变量的关联度均大于 0.5,表明各自变量 与因变量的变化趋势大体接近,四个自变量对因变量均有较大影响,选取的四个自变量具有 一定的合理性;另外,关联度越大,表示自变量对因变量影响程度越大。但是,四个因素综 合起来对地铁客流量的影响程度无法进行判断。 三、地铁客流量灰色系统预测模型 通过上述分析,地铁客流量预测模型中共有四个自变量,从理论上预测模型应选用多变
量预测模型(GM(1,N)模型),但原始数据按年份来看数据量较少,虽然单因素对因变 量的影响很大,但是联合影响关联度并不确定,因而建立单因素预测模型(GM(1,1)模 型)与多变量预测模型(GM(1,N)模型)进行对比分析,从而得到最优预测模型。 通过对原始调査数据进行无量纲处理得到预测模型建模样本数据,分别建立基于 Matlab 的单因素预测模型(GM(1,1)模型)与多变量预测模型(GM(1,N)模型),根据前 四年调査数据对2017年各城市的地铁客流量进行预测,将2017年预测数据与调查数据进行 对比,据此判断两种预测模型的准确性。 在Matb软件中输入代码后,得到所选择的各项目的两种预测模型的预测数据。 (一)GM(1,1)和GM(1,N)模型预测结果 (1)GM(1,1)模型 分别对各城市地铁的客流量数据建立GM(1,1)模型进行预测分析,并对预测出来的 结果与实际值进行对比,得出预测的精度,计算结果如表3-5 表3H(1,1)模型西安地铁二号线客流量预测值及误差分析 年份 客流量消除量纲值调研客流量(万人) 预测值(万人) 相对误差(%) 2013 27115 2014 34279 1.737 2.164 58688 54615 6.94 2018 69632 由于灰色系统预测模型建模数据最少需要4个,因此第五年的预测值具有说服力,由表 3可知第五年预测结果与真实值的相对误差为694%,拟合效果较好,满足对西安地铁二号 线客流量的预测精度要求 表4M(1,1)模型长春地铁三号线客流量预测值及误差分析 通车年份 客流量消除量纲值调研客流量(万人)预测值(万人)相对误差(%) 1.000 1.118 5775 2016 1.362 6512 0.73 2018 6957 对长春市地铁三号线建立灰色系统预测模型,通过对其建模数据的研究结果分析,由表 4可知第五年预测结果与真实值的相对误差为0.73%,因为在灰色系统模型预测中第五年的 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
量预测模型(GM(1,N)模型),但原始数据按年份来看数据量较少,虽然单因素对因变 量的影响很大,但是联合影响关联度并不确定,因而建立单因素预测模型(GM(1,1)模 型)与多变量预测模型(GM(1,N)模型)进行对比分析,从而得到最优预测模型。 通过对原始调查数据进行无量纲处理得到预测模型建模样本数据,分别建立基于 Matlab 的单因素预测模型(GM(1,1)模型)与多变量预测模型(GM(1,N)模型),根据前 四年调查数据对 2017 年各城市的地铁客流量进行预测,将 2017 年预测数据与调查数据进行 对比,据此判断两种预测模型的准确性。 在 Matlab 软件中输入代码后,得到所选择的各项目的两种预测模型的预测数据。 (一)GM(1,1)和 GM(1,N)模型预测结果 (1) GM(1,1)模型 分别对各城市地铁的客流量数据建立 GM(1,1)模型进行预测分析,并对预测出来的 结果与实际值进行对比,得出预测的精度,计算结果如表 3-5。 表 3 GM(1,1)模型西安地铁二号线客流量预测值及误差分析 年份 客流量消除量纲值 调研客流量(万人) 预测值(万人) 相对误差(%) 2013 1.000 27115 _ _ 2014 1.264 34279 _ _ 2015 1.402 38002 _ _ 2016 1.737 47101 _ _ 2017 2.164 58688 54615 6.94 2018 69632 由于灰色系统预测模型建模数据最少需要 4 个,因此第五年的预测值具有说服力,由表 3 可知第五年预测结果与真实值的相对误差为 6.94%,拟合效果较好,满足对西安地铁二号 线客流量的预测精度要求。 表 4 GM(1,1)模型长春地铁三号线客流量预测值及误差分析 通车年份 客流量消除量纲值 调研客流量(万人) 预测值(万人) 相对误差(%) 2013 1.000 4782 _ _ 2014 1.118 5347 _ _ 2015 1.208 5775 _ _ 2016 1.280 6120 _ _ 2017 1.362 6512 6560 0.73 2018 6957 对长春市地铁三号线建立灰色系统预测模型,通过对其建模数据的研究结果分析,由表 4 可知第五年预测结果与真实值的相对误差为 0.73%,因为在灰色系统模型预测中第五年的
预测值具有说服力,因此可见长春市地铁三号线的预测模型拟合效果较好,满足对长春地铁 三号线客流量的预测精度要求。 表5M(1,1)模型成都地铁—号线客流量预测值及误差分析 通车年份 客流量消除量纲值调硏客流量(万人)预测值(万人)相对误差(%) 2013 l1519 1.399 1.856 21374 2.274 26199 2.614 33197 2018 41422 而对成都地铁一号线的客流量预测的统计数据进行分析,由表5可知其第五年的预测结 果与真实值的相对误差为394%,也可见其灰色系统预测模型的拟合效果较好,也满足对成 都地铁一号线客流量的预测精度要求。 (2)GM(1,N)多变量预测模型 GM(1,N)预测模型预测下一年的客流量时,需要知道该年的各影响因素取值,本文 采用GM(1,1)单变量预测模型对2018年各城市地铁影响因素进行预测,其预测结果如 表6: 表6M(1,1)模型各城市地铁客流量影响因素预测值 年份 城市地铁 w3 西安市地铁二号线1. 018 长春市地铁三号线 1.373 1.353 1.665 成都市地铁一号线 1.366 1.299 1.705 将表6中预测的2018年影响因素带入GM(1,N)多变量预测模型 MATLAB程序中, 得到客流量的预测结果如表7-9 表7M(1,N)機型西安地铁二号线客流量预测值及误差分析 通车年份客流量消除量纲值调研客流量(万人) 预测值(万人) 相对误差(%) 2013 27115 2014 2015 38002 2016 47101 2018 182755 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
预测值具有说服力,因此可见长春市地铁三号线的预测模型拟合效果较好,满足对长春地铁 三号线客流量的预测精度要求。 表 5 GM(1,1)模型成都地铁一号线客流量预测值及误差分析 通车年份 客流量消除量纲值 调研客流量(万人) 预测值(万人) 相对误差(%) 2013 1.000 11519 _ _ 2014 1.399 16111 _ _ 2015 1.856 21374 _ _ 2016 2.274 26199 _ _ 2017 2.614 34558 33197 3.94 2018 41422 而对成都地铁一号线的客流量预测的统计数据进行分析,由表 5 可知其第五年的预测结 果与真实值的相对误差为 3.94%,也可见其灰色系统预测模型的拟合效果较好,也满足对成 都地铁一号线客流量的预测精度要求。 (2) GM(1,N)多变量预测模型 GM(1,N)预测模型预测下一年的客流量时,需要知道该年的各影响因素取值,本文 采用 GM(1,1)单变量预测模型对 2018 年各城市地铁影响因素进行预测,其预测结果如 表 6: 表 6 GM(1,1)模型各城市地铁客流量影响因素预测值 年份 城市地铁 W1 W2 W3 W4 2018 西安市地铁二号线 1.652 1.233 2.063 2.03 长春市地铁三号线 1.373 1.353 0.995 1.665 成都市地铁一号线 1.685 1.366 1.299 1.705 将表 6 中预测的 2018 年影响因素带入 GM(1,N)多变量预测模型 MATLAB 程序中, 得到客流量的预测结果如表 7-9。 表 7 GM(1,N)模型西安地铁二号线客流量预测值及误差分析 通车年份 客流量消除量纲值 调研客流量(万人) 预测值(万人) 相对误差(%) 2013 1.000 27115 _ _ 2014 1.264 34279 _ _ 2015 1.402 38002 _ _ 2016 1.737 47101 _ _ 2017 2.164 58688 91893 56.6 2018 182755
由表7的预测结果可知,采用多因素分析,第五年预测结果与真实值的相对误差为 566%,拟合效果较差,预测精度较低,因此其2018年的预测值可信度较低。 表8M(1,N模型长春地铁三号线客流量预测值及误差分析 通车年份 客流量消除量纲值调研客流量(万人)预测值(万人) 1.000 4782 2014 l.118 6120 1.362 2018 23498 由表8可知,采用多因素分析对长春市地铁三号线的客流量进行预测,其第五年的预测 结果与真实值的相对误差为1849%,拟合效果很差,可见预测精度很低,其2018年的预测 值可信度很低。 9M(1,N)模型成都地铁一号线害流量预测值及误差分析 车年份 客流量消除量纲值调研客流量(万人)预测值(万人)相对误差(%) 11519 l6l11 2015 21374 2.274 26199 2.614 4558 126248 265.32 2018 127861 由表9可知,对成都市地铁一号线的客流量采用多因素进行预测分析,在其第五年的预 测结果与真实值的相对误差为26532%,预测模型的拟合效果很差,表明其预测精度很低 因此其2018年的预测值可信度很低 (二)GM(1,1)和GM(1,N)模型预测结果对比分析 选择的城市共有3个,线路共有8条,建立GM(1,1)和GM(1,N)两种预测模型 进行预测。预测结果表明:GM(1,1)单变量预测模型预测结果85%误差均小于10%,预 测效果较好,能够满足对各城市地铁客流量预测精度的要求:GM(l,N)多变量预测模型 预测结果80%误差均大于40%,预测效果较差,不能够满足对高速公路小修保养维修量的 预测精度要求。 本文以西安市地铁二号线、长春地铁三号线、成都地铁一号线共三条线路为例进行了预 测分析。取2017年预测结果与实际调硏结果进行对比,将三条线路的两种模型预测结果汇 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
由表 7 的预测结果可知,采用多因素分析,第五年预测结果与真实值的相对误差为 56.6%,拟合效果较差,预测精度较低,因此其 2018 年的预测值可信度较低。 表 8 GM(1,N)模型长春地铁三号线客流量预测值及误差分析 通车年份 客流量消除量纲值 调研客流量(万人) 预测值(万人) 误差 2013 1.000 4782 _ _ 2014 1.118 5347 _ _ 2015 1.208 5775 _ _ 2016 1.280 6120 _ _ 2017 1.362 6512 18554 184.9 2018 23498 由表 8 可知,采用多因素分析对长春市地铁三号线的客流量进行预测,其第五年的预测 结果与真实值的相对误差为 184.9%,拟合效果很差,可见预测精度很低,其 2018 年的预测 值可信度很低。 表 9 GM(1,N)模型成都地铁一号线客流量预测值及误差分析 通车年份 客流量消除量纲值 调研客流量(万人) 预测值(万人) 相对误差(%) 2013 1.000 11519 _ _ 2014 1.399 16111 _ _ 2015 1.856 21374 _ _ 2016 2.274 26199 _ _ 2017 2.614 34558 126248 265.32 2018 127861 由表 9 可知,对成都市地铁一号线的客流量采用多因素进行预测分析,在其第五年的预 测结果与真实值的相对误差为 265.32%,预测模型的拟合效果很差,表明其预测精度很低, 因此其 2018 年的预测值可信度很低。 (二)GM(1,1)和 GM(1,N)模型预测结果对比分析 选择的城市共有 3 个,线路共有 8 条,建立 GM(1,1)和 GM(1,N)两种预测模型 进行预测。预测结果表明:GM(1,1)单变量预测模型预测结果 85%误差均小于 10%,预 测效果较好,能够满足对各城市地铁客流量预测精度的要求;GM(1,N)多变量预测模型 预测结果 80%误差均大于 40%,预测效果较差,不能够满足对高速公路小修保养维修量的 预测精度要求。 本文以西安市地铁二号线、长春地铁三号线、成都地铁一号线共三条线路为例进行了预 测分析。取 2017 年预测结果与实际调研结果进行对比,将三条线路的两种模型预测结果汇
成折线如图1 050 实际调研数据 GM(1,1)模型 西安市地铁二号线长春市地铁三号线成都地铁一号线 各城市地铁 图1各城市地铁2017年消除量纲客流量对比分析 由图1可知,GM(1,1)模型数据变化平稳,与实际调研数据吻合度较高,而GM(1,N) 模型数据波动较大,与实际调研数据吻合度较差,因此,对于仅有5年的小样本数据,GM (1,1)单变量预测模型更加准确,能够适用于各个城市地铁线路客流量的预测精度要求。 (三)GM(1,1)预测模型与通车年份的时间响应式 通过上述分析,得到GM(1,1)模型比GM(1,N)模型预测效果更好,精度更高,针 对GM(1,1)模型,建立地铁客流量与通车年份的时间响应式。 选取实际调研的西安市地铁二号线客流量建立单变量灰色预测时间响应式,变量为通车 年份。由表2.1中的调研客流量构造原始数据列X:即 X0)=(x(1),x(2),,,x0(m)=(27115,34279,38002,47101,58688) 对X0进行一次累加(1-AGO),生成数列 x=(x(1),x(2),,xn)=(27115,61394,99396,146497,205185) o(2)「34279 z(2) -44254.51 A470/·=-=0(3) x0(3)38002 -803951 122946.51 x0(n)L58688 -2(m)1」-1758411 x(k+1)=x(k+1)-x(1)=(4-c)Xx()-b)c,k=12,,n(4) 上式是GM(1,1)模型的最终还原式[4 其中a=[ab]为参数列,且a=( BBIBY,得a=[01920y0 最终得到地铁客流量的灰色预测模型: (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
成折线如图 1。 西安市地铁二号线 长春市地铁三号线 成都地铁一号线 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 2017年消除量纲客流量 各城市地铁 实际调研数据 GM(1,1)模型 GM(1,N)模型 图 1 各城市地铁 2017 年消除量纲客流量对比分析 由图 1 可知,GM(1,1)模型数据变化平稳,与实际调研数据吻合度较高,而 GM(1,N) 模型数据波动较大,与实际调研数据吻合度较差,因此,对于仅有 5 年的小样本数据,GM (1,1)单变量预测模型更加准确,能够适用于各个城市地铁线路客流量的预测精度要求。 (三)GM(1,1)预测模型与通车年份的时间响应式 通过上述分析,得到 GM(1,1)模型比 GM(1,N)模型预测效果更好,精度更高,针 对 GM(1,1)模型,建立地铁客流量与通车年份的时间响应式。 选取实际调研的西安市地铁二号线客流量建立单变量灰色预测时间响应式,变量为通车 年份。由表 2.1 中的调研客流量构造原始数据列 X(0) :即 0 00 0 1 2 () () () () X x x xn ( ( ), ( ),..., ( )) (27115,34279,38002,47101,58688) 对 X(0)进行一次累加(1—AGO),生成数列: 11 1 1 1 1 1 27115 61394 99396 146497 205185 34279 1 44254 5 2 38002 1 80395 3 47101 58688 1 X x x xn x z x z Y B x n zn () () () () (0) ( ) (0) () (0) () =( (1), (2),..., ( ))=( , , , , ) (2) ( ) - . (3) ( ) = , = () ( ) 1 1 122946 5 1 175841 1 - . - (0) (1) (1) (0) ( 1) ( 1) (1) (1 )( (1) ) 1,2,..., a ak b x k xk x ex e k n a , (4) 上式是 GM(1,1)模型的最终还原式[14]。 其中 T a ab , 为参数列,且 T T 1 a BY (B B) ,得 -0.19,24380.009 T a 。 最终得到地铁客流量的灰色预测模型:
(0) x(k+1)=189.167×(1-e)e01”,k=1,2,,n 根据上述计算方法,能够得到其他城市地铁客流量与通车年份的时间响应式 四、结论 对地铁客流量进行预测的模型有很多,但是其方法也存在一些问题,例如在时间序列模 型中,自回归滑动平均模型是建立在变量线性关联的假设的基础上,无法反映现实中存在着 的非线性关系问题;而有的学者采用支持向量机等模型对地铁进行短时客流量预测,也存在 着浅层结构对于有限样本和计算单元的复杂函数,其表示能力有限;而选用BP神经网络等 模型中也存在着拟合和训练的方法并不是很理想的问题。因此本文采用灰色关联分析模型定 量分析了生产总值、居民人均可支配收入、城镇总人口数量、第三产业总值对西安,长春, 成都三个城市三条线路地铁客流量的影响程度,四个影响因素对客流量的灰色关联度均大于 05,说明选取的四个因素对客流量均有较大影响,且灰色关联度越大,其影响程度越高。 在通车年份为5年的小样本数据条件下,虽然理论上地铁的客流量受多个因素影响,应 该采用GM(1,N)多变量预测模型,但是由于数据量太少。另外,下一年的影响因素未知, 需要采用单变量预测模型进行预测,使得预测误差进一步累计,从而导致多变量预测模型并 不能准确预测实际客流量。由预测结果可知,GM(1,1)单变量预测模型的预测结果与实际 调研数据误差较小,吻合度较好。因此,对于仅有小数据的各城市地铁客流量的预测,建议 采用GM(1,1)单变量预测模型。本文所研究的内容与方法还有待进一步深化,未来可以 采用多种预测方法进行对比分析研究,更进一步对地铁客流量进行更加精确的预测,对实际 情况考虑更全面,也可以将此方法应用在其他领域进行更深入的研究。 参考文献 ]林培群,陈丽甜雷永巍基于K近邻模式匹配的地铁客流量短时预测凹华南理工大学学 报(自然科学版),201846(01)50-57 on LIN Peiqun, CHEN Litian, LEI Yongwei Short-Term Forecasting of Subway Traffic Based K-Nearest Neighbour Pattern Matching J]Journal of South China University of Technology( Natural Science Edition), 2018, 46(01): 50-57 2]王炜炜高速铁路影响下铁路客流量预测硏究卩铁道运输与经济,2016,38(04)-42-46+51 WANG Wei-wei. Study on Forecast of Railway Passenger Flow Volume under Influence of High-speed Rail ways[ J RAILWAY TRANSPORT AND ECONOMY, 2016, 38(04): 42-46+51 3]姚恩建周文华张永生城市轨道交通新站开通初期实时进出站客流量预测[中国铁道 科学,2018,39(02):119-127 YAO Enjian, ZHOUWenhua, ZHANG Yongsheng Real-Time Forecast of Entrance and Exit (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net
(0) -0.19 0.19 x ( 1) 189.167 (1 ) 1,2,..., k ee k n k , 根据上述计算方法,能够得到其他城市地铁客流量与通车年份的时间响应式。 四、结论 对地铁客流量进行预测的模型有很多,但是其方法也存在一些问题,例如在时间序列模 型中,自回归滑动平均模型是建立在变量线性关联的假设的基础上,无法反映现实中存在着 的非线性关系问题;而有的学者采用支持向量机等模型对地铁进行短时客流量预测,也存在 着浅层结构对于有限样本和计算单元的复杂函数,其表示能力有限;而选用 BP 神经网络等 模型中也存在着拟合和训练的方法并不是很理想的问题。因此本文采用灰色关联分析模型定 量分析了生产总值、居民人均可支配收入、城镇总人口数量、第三产业总值对西安,长春, 成都三个城市三条线路地铁客流量的影响程度,四个影响因素对客流量的灰色关联度均大于 0.5,说明选取的四个因素对客流量均有较大影响,且灰色关联度越大,其影响程度越高。 在通车年份为 5 年的小样本数据条件下,虽然理论上地铁的客流量受多个因素影响,应 该采用 GM(1,N)多变量预测模型,但是由于数据量太少。另外,下一年的影响因素未知, 需要采用单变量预测模型进行预测,使得预测误差进一步累计,从而导致多变量预测模型并 不能准确预测实际客流量。由预测结果可知,GM(1,1)单变量预测模型的预测结果与实际 调研数据误差较小,吻合度较好。因此,对于仅有小数据的各城市地铁客流量的预测,建议 采用 GM(1,1)单变量预测模型。本文所研究的内容与方法还有待进一步深化,未来可以 采用多种预测方法进行对比分析研究,更进一步对地铁客流量进行更加精确的预测,对实际 情况考虑更全面,也可以将此方法应用在其他领域进行更深入的研究。 参考文献 [1] 林培群,陈丽甜,雷永巍.基于 K 近邻模式匹配的地铁客流量短时预测[J].华南理工大学学 报(自然科学版),2018,46(01):50-57. LIN Peiqun, CHEN Litian, LEI Yongwei. Short-Term Forecasting of Subway Traffic Based on K-Nearest Neighbour Pattern Matching[J].Journal of South China University of Technology( Natural Science Edition),2018,46(01):50-57. [2] 王炜炜.高速铁路影响下铁路客流量预测研究[J].铁道运输与经济,2016,38(04):42-46+51. WANG Wei-wei.Study on Forecast of Railway Passenger Flow Volume under Influence of High-speed Railways[J].RAILWAY TRANSPORT AND ECONOMY, 2016,38(04):42-46+51. [3] 姚恩建,周文华,张永生.城市轨道交通新站开通初期实时进出站客流量预测[J].中国铁道 科学,2018,39(02):119-127. YAO Enjian,ZHOUWenhua,ZHANGYongsheng.Real-Time Forecast of Entrance and Exit