正在加载图片...
、引言 居民出行调査是获取人流、车流及货流日常出行特征和规律的基础调査之一,是掌握交 通供给和需求之间关系的基本手段之一。出行方式的选择为出行调查中的重要一环,不同出 行方式对于满足居民的日常出行需求及交通结构的合理性改变起着举足轻重的作用。因此, 对于出行方式的研究已成为交通领域的重点问题之一。 目前,各大城市均开展了居民出行调查项目,对调查数据进行了一定的分析研究工作① 最为基本的研究是对城市居民出行特征的阐述及对其交通发展策略的建议。对于出行方 式的研究多基于集计模型或非集计模型的方法。刘霞基于非集计理论,以个人为单位, 通过研究居民的出行行为特征,应用效用最大化原理,建立不同影响因素与出行方式选择之 间的函数关系。耿纪超基于个体、群体两个对象,从主观、客观两个视角梳理了居民出行 方式选择行为的主要影响因素,并深入阐明了各影响因素的概念、相互联系及作用机制 刘宇峰选取个人属性、交通供给属性和城市规模为外因变量,同时选取出行目的、出行时间、 出行偏好、出行距离和出行方式选择为内因变量,采用结构方程模型(SEM)建立各影响因素 与城市居民出行方式选择的关系结构。决策树作为数据挖掘领域的一种方法,为出行方式 的分析提供了一种新思路。王凤英对居民出行数据进行了分类规则挖掘。李庭洋在基本决 策树的基础上,使用随机森林组合学习算法来建立交通方式选择模型∽。本文以最新的2015 年居民出行调査数据为基础,采用数据挖掘中的决策树技术,探讨居民出行方式的影响因素 及其作用规律,得出了西安市居民的个人属性、家庭因素与出行方式选择的相关性,以期对 交通政策的制定起到一定的指导作用。 二、决策树及GART算法概述 决策树( Decisiontree)一般都是自上而下的来生成的。每个决策或事件(即自然状态) 都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干, 故称决策树 CART算法是构建决策树的一种方法,该算法构建的决策树为一棵二叉树。CART算法 构建出来的决策树既能是分类树,又能是回归树。当CART是分类树时,采用GINI值作为 节点分裂的依据,其作用是通过一个对象的特征来预测该对象所属的类别:当CART是回 归树时,采用样本的最小方差作为节点分裂的依据,其目的是根据一个对象的信息预测该对 象的属性,并以数值表示。本文所建的决策树为分类树。 CART通过不断二分裂使数据变得更纯,使决策树输出的结果更接近真实值。该算法采 (c)1994-2019ChinaAcademicJournalElectronicPublishingHouse.Allrightsreservedhttp://www.cnki.net一、引言 居民出行调查是获取人流、车流及货流日常出行特征和规律的基础调查之一,是掌握交 通供给和需求之间关系的基本手段之一。出行方式的选择为出行调查中的重要一环,不同出 行方式对于满足居民的日常出行需求及交通结构的合理性改变起着举足轻重的作用。因此, 对于出行方式的研究已成为交通领域的重点问题之一。 目前,各大城市均开展了居民出行调查项目,对调查数据进行了一定的分析研究工作[1] 。 最为基本的研究是对城市居民出行特征的阐述[2]及对其交通发展策略的建议[3]。对于出行方 式的研究多基于集计模型[4]或非集计模型[5]的方法。刘霞基于非集计理论,以个人为单位, 通过研究居民的出行行为特征,应用效用最大化原理,建立不同影响因素与出行方式选择之 间的函数关系[6]。耿纪超基于个体、群体两个对象,从主观、客观两个视角梳理了居民出行 方式选择行为的主要影响因素,并深入阐明了各影响因素的概念、相互联系及作用机制[7] 。 刘宇峰选取个人属性、交通供给属性和城市规模为外因变量,同时选取出行目的、出行时间、 出行偏好、出行距离和出行方式选择为内因变量,采用结构方程模型(SEM)建立各影响因素 与城市居民出行方式选择的关系结构[8]。决策树作为数据挖掘领域的一种方法,为出行方式 的分析提供了一种新思路。王凤英对居民出行数据进行了分类规则挖掘[9]。李庭洋在基本决 策树的基础上,使用随机森林组合学习算法来建立交通方式选择模型[10] 。本文以最新的 2015 年居民出行调查数据为基础,采用数据挖掘中的决策树技术,探讨居民出行方式的影响因素 及其作用规律,得出了西安市居民的个人属性、家庭因素与出行方式选择的相关性,以期对 交通政策的制定起到一定的指导作用。 二、决策树及 CART 算法概述 决策树(Decisiontree)一般都是自上而下的来生成的。每个决策或事件(即自然状态) 都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干, 故称决策树。 CART 算法是构建决策树的一种方法,该算法构建的决策树为一棵二叉树。CART 算法 构建出来的决策树既能是分类树,又能是回归树。当 CART 是分类树时,采用 GINI 值作为 节点分裂的依据,其作用是通过一个对象的特征来预测该对象所属的类别;当 CART 是回 归树时,采用样本的最小方差作为节点分裂的依据,其目的是根据一个对象的信息预测该对 象的属性,并以数值表示。本文所建的决策树为分类树。 CART 通过不断二分裂使数据变得更纯,使决策树输出的结果更接近真实值。该算法采
<<向上翻页向下翻页>>
©2008-现在 cucdc.com 高等教育资讯网 版权所有