正在加载图片...
·466· 智能系统学报 第13卷 预测立方体算法: 域,为各业务系统调用提供一致、规范的数据。该 1)计算聚集:在显示维度的时段a(0、费用)、 数据中心管理的数据包括: 客流特征)定义立方体数据空间,在其作用下的 1)业务数据,包含了轨道交通内部信息系统的 客流量聚集度量M用于存放立方体中的所有元组 原始数据、衍生数据、过程数据等: Passenger()。首先将数组划分为块,通过访问立方 2)线网基础数据,覆盖相关的各类文件数据 体单元计算在线网上某一路径下的可能客流量。 基础线网数据和基本参数数据: 2)划分客流运行特征的置信区间:将满足客流 3)配置数据,主要包括用于支撑业务工具和方 特征()的指定条件下置信水平为95%以上的客 案的相关配置数据和业务资源数据。 流类型记作count(O。此处指定条件包括工作日、节 建立数据仓库,设定主题域和逻辑模型,定义 假日、大型活动、突发事件、早晚高峰、平峰时段。 “维度表”,作为基础公共表,此类代码表在明确标识 累计对应的在网车站数、时长、乘距的进出站客流 代码值与业务含义的基础上,还具备逐级汇总功 量、断面客流量、换乘客流量。 能,细化了各个维度层级之间的上下级关系,为表 3)查询数据立方体“关注点”客流:提升小样本 的逐层汇总提供了先决条件。以公共代码表为例, 的置信度,如多种交通方式的枢纽集散站点、票价 说明数据仓库的基础表关联关系,设计基础代码的 优惠路径、避开拥堵路径的可替代路径选择等,分 逻辑模型如图7。 配权重值,在需求客流量基础上适度扩展。需精确 统计口径线路 统计口径线路代码表 地度量维值与立方体值的相关性,通过语义类似值 映射表 统计线路编号 际准线路编号 即可联机分析。 统计口径代码表 统计口径代码FK) 合并标志 统计口径代码 4)计算预测客流量:调取线网的任意组合路 统计口径代码 名称 径,使用数据立方体快速重复客流预测模型的构 统计口径描述 开通时间 统计线路编号 关闭时间 TCC线路映射历史 建,预测立方体的每个单元值等于该单元数据子集 基础线路编号 上的基础客流预测量,经加权修正计算得到预测客 线路编号 流量。 基础线路名称 统计口径代码 5)预测值的优化:采用基于概率的组合方法, 米 统计周期 统计口径换乘站 统计口径车站代码表 对最细粒度的单元构建模型。以断面客流量需求预 统计口径车站 统计预乘站编号 统计车站编号 映射表 测为例,给定分段路径的客流属性子集,将粒度集 统计口径代码 统计口径代码 合并标志 标准车站编号 合P<p1,…,Pa>的预测立方体定义为d维数组,其 合并标志 换乘站名称 合并标志 统计车站名称 中每个单元(条件[O,D,路径对;上行;工作日早高峰 换乘站描述 统计口径代码 统计车站描述 开闭时间 统计车站编号 时段;>线网平均乘距])的值即为该单元定义的基础 车站类型代码 换乘站编号 终点站标志 列车定员信息历史 客流预测量估计值的预测修正量。 换乘标志 线路编号 因此,利用线网大规模客流数据的特征分析结 上行标识 开始日期 下行标识 列车编组 果,在既有客流需求预测量基础上结合各城市实际 统计口径车站 开闭时间 列车定员 换乘历史 客流特点予以修正,在很大程度上改善了由单线客 上行运行时间 满载率 统计车站编 下行运行时间 运营车辆数 流预测方法直接得出线网客流预测理论计算值的单 统计口径代码 上行停站时间 统计开始时间 结束日期 下行停站时间 性。 统计换乘站编号 统计线路编码 结束时间 5 案例 图7数据中心基础代码逻辑模型 依托某城市轨道交通的已运营构成线网,近 Fig.7 Logical model of a basic code for a data center 3年内投入运营将达到9条以上线路,正在快速积 采集数据源包括行车信号系统、机电设备综合 累各类业务数据。随着企业信息系统衍生,形成了 监控系统、票务清分系统等,采用TeraData数据仓 大量分立的小型业务系统,数据内容交叉,关联信 库产品,导入数据处理,构建主题域进行数据建模, 息无法共享的问题日益显著。由于快速增长的数据 建立数据中心的系统框架。数据中心平台包括以下 量,简单整合的数据容量规模大,业务统计分析响 业务模块。 应时间受关系型数据库的影响已无法支持实时业 1)数据采集系统:包括设备监控实时信息采 务,因此面向网络化运营的需求,搭建线网数据中 集,文件传输,采集接口通道监控,接口数据质量管 心平台,承担数据采集和资源整合。 理,接口双冗余双实时采集数据配置等模块。 按照该轨道交通线网数据管理标准的要求,对 2)数据管理系统:包括基础数据字典管理,数 源系统统一加工和整合,存储细粒度的历史数据区 据存档备份管理,主数据管理,主题域关联视图可预测立方体算法: 1) 计算聚集:在显示维度的时段 α()、费用 β()、 客流特征 γ() 定义立方体数据空间,在其作用下的 客流量聚集度量 M 用于存放立方体中的所有元组 Passenger()。首先将数组划分为块,通过访问立方 体单元计算在线网上某一路径下的可能客流量。 2) 划分客流运行特征的置信区间:将满足客流 特征 γ(i) 的指定条件下置信水平为 95% 以上的客 流类型记作 count()。此处指定条件包括工作日、节 假日、大型活动、突发事件、早晚高峰、平峰时段。 累计对应的在网车站数、时长、乘距的进出站客流 量、断面客流量、换乘客流量。 3) 查询数据立方体“关注点”客流:提升小样本 的置信度,如多种交通方式的枢纽集散站点、票价 优惠路径、避开拥堵路径的可替代路径选择等,分 配权重值,在需求客流量基础上适度扩展。需精确 地度量维值与立方体值的相关性,通过语义类似值 即可联机分析。 4) 计算预测客流量:调取线网的任意组合路 径,使用数据立方体快速重复客流预测模型的构 建,预测立方体的每个单元值等于该单元数据子集 上的基础客流预测量,经加权修正计算得到预测客 流量。 P < p1,··· , pd > 5) 预测值的优化:采用基于概率的组合方法, 对最细粒度的单元构建模型。以断面客流量需求预 测为例,给定分段路径的客流属性子集,将粒度集 合 的预测立方体定义为 d 维数组,其 中每个单元 (条件[OiDi 路径对;上行;工作日早高峰 时段;>线网平均乘距]) 的值即为该单元定义的基础 客流预测量估计值的预测修正量。 因此,利用线网大规模客流数据的特征分析结 果,在既有客流需求预测量基础上结合各城市实际 客流特点予以修正,在很大程度上改善了由单线客 流预测方法直接得出线网客流预测理论计算值的单 一性。 5 案例 依托某城市轨道交通的已运营构成线网,近 3 年内投入运营将达到 9 条以上线路,正在快速积 累各类业务数据。随着企业信息系统衍生,形成了 大量分立的小型业务系统,数据内容交叉,关联信 息无法共享的问题日益显著。由于快速增长的数据 量,简单整合的数据容量规模大,业务统计分析响 应时间受关系型数据库的影响已无法支持实时业 务,因此面向网络化运营的需求,搭建线网数据中 心平台,承担数据采集和资源整合。 按照该轨道交通线网数据管理标准的要求,对 源系统统一加工和整合,存储细粒度的历史数据区 域,为各业务系统调用提供一致、规范的数据。该 数据中心管理的数据包括: 1) 业务数据,包含了轨道交通内部信息系统的 原始数据、衍生数据、过程数据等; 2) 线网基础数据,覆盖相关的各类文件数据、 基础线网数据和基本参数数据; 3) 配置数据,主要包括用于支撑业务工具和方 案的相关配置数据和业务资源数据。 建立数据仓库,设定主题域和逻辑模型,定义 “维度表”,作为基础公共表,此类代码表在明确标识 代码值与业务含义的基础上,还具备逐级汇总功 能,细化了各个维度层级之间的上下级关系,为表 的逐层汇总提供了先决条件。以公共代码表为例, 说明数据仓库的基础表关联关系,设计基础代码的 逻辑模型如图 7。 采集数据源包括行车信号系统、机电设备综合 监控系统、票务清分系统等,采用 TeraData 数据仓 库产品,导入数据处理,构建主题域进行数据建模, 建立数据中心的系统框架。数据中心平台包括以下 业务模块。 1) 数据采集系统:包括设备监控实时信息采 集,文件传输,采集接口通道监控,接口数据质量管 理,接口双冗余双实时采集数据配置等模块。 2) 数据管理系统:包括基础数据字典管理,数 据存档备份管理,主数据管理,主题域关联视图可 统计口径描述 统计口径代码 统计线路编号 统计口径代码(FK) 统计线路编号 标准线路编号 合并标志 统计口径代码 合并标志 换乘站名称 换乘站描述 开闭时间 换乘站编号 统计换乘站编号 统计口径代码 统计换乘站编号 结束时间 统计车站编号 统计口径代码 统计开始时间 列车编组 列车定员 满载率 运营车辆数 结束日期 线路编号 开始日期 统计车站编号 标准车站编号 合并标志 统计口径代码 合并标志 统计车站名称 统计车站描述 车站类型代码 终点站标志 换乘标志 上行标识 下行标识 开闭时间 上行运行时间 下行运行时间 上行停站时间 下行停站时间 统计线路编码 统计车站编号 统计口径代码 线路编号 基础线路名称 统计口径代码 统计周期 基础线路编号 统计口径代码表 统计口径线路代码表 统计口径线路 映射表 TCC线路映射历史 统计口径车站 映射表 统计口径换乘站 统计口径车站代码表 列车定员信息历史 统计口径车站 换乘历史 合并标志 统计线路名称 开通时间 关闭时间 图 7 数据中心基础代码逻辑模型 Fig. 7 Logical model of a basic code for a data center ·466· 智 能 系 统 学 报 第 13 卷
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有