融合多元数据的轨道客流分析及建模研究——以澳门轻轨为例

1. 研究背景

轨道交通系统是城市公共交通系统的重要组成部分,提升轨道交通系统规划和运营水平,有助于提升其出行比例,进而缓解整个城市交通系统其他部分的压力,减少交通拥堵的发生。对轨道交通系统的客流进行精准刻画和描述,探究其出行机理、客流分布规律以及与城市建成环境的关系,对线路的规划建设和调整等有很重要的借鉴意义。

虽然城市轨道交通线路和站点可能很少,但站点乘降客流量非常大,能快速将城市内某一轨道站点周边的大量乘客运输到其他站点,其大规模的客流移动以及在时间和空间上的波动很大程度上代表和反映出城市内部人群的流动规律和城市建成环境的布局。站点影响区域往往是城市轨道交通与城市其他组成部分发生相互关系的关键地点,也是城市建成环境开发利用中至关重要的节点。

以澳门为例,2019年12月10日澳门轻轨氹仔线通车运行,全线共设11座车站,在12月免费乘坐期间日均客流33,000人次。后期由于疫情影响,2020年-2022年日均客流小于2000人次。随着疫情政策调整,2023年8月澳门轻轨客流已恢复至9,150人次/日。在此背景下,针对澳门轻轨客流进行分析其特征和出行行为机理显得更加有意义。

对于城市轨道交通出行研究需从多角度、多方位出发:一、需要从个体层面了解居民利用轨道交通出行的特征,同时也需要利用大量刷卡数据从站点、网络层面来认清城市内部人群流动在空间维度以及时间维度上的变化规律。二、基于交通出行需求归根到底来源于活动需要的基本共识,城市轨道交通客流及出行特征与建成环境有着密不可分的联系,建成环境不仅影响着城市轨道交通个体出行特征也影响着网络、站点客流的时空特征,例如居民出行的平均距离、空间分布很大程度上由用地功能布局决定。三、传统的客流分析方法往往只基于单一数据源,无法全面、准确地描述复杂的客流行为。因此,融合多元数据进行轨道客流特征分析和建模研究具有重要的理论和实践意义。

2. 文献综述

国内外学者开展了许多关于地铁站点客流影响因素的研究。Taylor等采用距离衰减权重回归模型探究了西班牙马德里地铁站点客流影响因素 [1];Jun等基于Logit model模型探究了韩国首尔地铁站点客流影响因素 [2];Sohn等通过多元线性回归和结构方程模型挖掘出影响地铁站点客流的变量 [3];Choi等探讨了首尔地铁站点间客流的影响因素 [4];Zhao等建立站点客流直接预测模型,探讨了影响南京客流的主要因素 [5];Sun等采用多元线性回归方法,探讨了北京市地铁站点客流的影响因素 [6]。

  • OD 分布研究: [相关文献1]、[相关文献2]* 站点客流研究: [相关文献3]、[相关文献4]* 与建成环境的关系: [相关文献5]、[相关文献6]* 轨道出行出行行为选择模型: [相关文献7]、[相关文献8]

3. 研究目标

  • 通过对轨道刷卡数据处理和分析,得到 OD 时间和空间维度的特征、站点客流特性。* 通过对出行调查结果分析,得到轨道交通出行者的个体出行特征。* 以建成环境数据作为纽带,将刷卡数据和个体出行调查数据串联起来,不仅从宏观层面探索城市建成环境与城市轨道交通出行特征的天然内在联系,而且从微观层面揭示城市建成环境对个体城市轨道交通出行的潜在影响。

4. 数据来源

  • (1) 澳门地铁刷卡数据:来自动售检票系统,处理分析获取 OD 分布、站点客流、平均出行距离等特征。* (2) 澳门建成环境:通过地图绘制暨地籍局等相关网站获取土地利用现状数据和路网数据等,高德地图 WebAPI 接口获取 POI 数据。* (3) 居民出行调查数据(预计 2024 年澳门将开展居民出行调查,2019 年调查时轻轨尚未运营,新一轮调查应该会增加接驳及满意度等相关问题或自行设计问卷进行调查)。

5. 理论方法

  • (1) 站点分类 K-means:,作为数据挖掘的重要研究内容和手段,聚类(clustering)是一种无监督模式识别算法。在没有任何先验信息指导下,从数据集中发现其中可能存在的相似模式,然后对数据集进行合理分类。根据各站点的日均小时进出站客流时间序列属性(time series),对各个城市轨道交通站点进行聚类,从而使同一聚类中的城市轨道交通站点具有相似度较高的进出站客流时间序列,而不同聚类中的城市轨道交通站点的进出站客流时间序列的相似度最低。而 K-means 聚类算法是聚类分析中使用最为主流的算法,其最大的特点是简洁和高效。* (2) 建成环境指标构建:参照 Ewing 等 [17] 提出的“5D”指标体系,从密度、多样性、设计、可达性和与交通设施距离 5 个维度,综合考虑已有研究构建的建成环境指标体系,选取 8 个指标进行建成环境指标测度,分为单元基础性大尺度宏观指标和小尺度采样指标 2 大类。为了减少变量多重共线性对结果带来的影响,对变量进行多重共线性检验。

| 指标类别 | 指标名称 | 计算方法 ||---|---|---|| 密度 | 人口密度(人/km2) | 单元内总人口数/单元总面积 || 设计 | 交叉口密度(个/km2) | 交叉口数量/单元总面积 || 设计 | 道路中心性 | 单元内所有节点的邻近中心性的平均值 || 多样性 | 商服用地比例 | 单元内商服用地面积/单元总面积 || 多样性 | POI 混合度 | 兴趣点(POI)的土地利用混合熵指数 || 交通可达性 | 路网密度(km/km2) | 单元内路网长度/单元总面积 || 交通可达性 | 最近地铁站距离(m) | 单元中心点到最近的地铁站距离 || 交通可达性 | 公交站密度(个/km2) | 单元内公交站数量/单元总面积 || 目的地可达性 | 距 CBD 距离(m) | 单元中心点到 CBD 的最近距离 |

  • (3) 建立梯度提升回归树模型:考虑大多数建成环境属性和城市轨道交通站点间 OD 客流之间的关系很有可能并不是简单线性关系,因此建立能够捕捉自变量与因变量之间非线性关系的梯度提升回归树(gradient boosting regression trees, GBRT)模型,探索城市轨道交通网络 OD 客流与出发站点端和达到站点端建成环境之间的关系,对比各建成环境属性变量在不同时段对城市轨道交通网络 OD 客流的相对重要度及其排名,捕捉建成环境对城市轨道交通网络 OD 客流的非线性影响及其在时间上的动态变化。* (4) 多项 Logistic 回归模型:依据居民出行调查数据和建成环境数据,建立包含地铁作为出行方式的多项出行方式选择模型,揭示个人社会经济属性及城市土地利用等建成环境变量与选择乘坐轨道交通的关系。

6. 研究意义和价值

  • 构建轨道站点周围影响范围的建成环境水平评价体系来评价城市轨道站点建成环境现状水平。* 探究建成环境对轨道交通客流的影响,比较不同建成环境影响因素对客流影响的差异。* 为澳门轻轨的规划建设和运营管理提供科学依据。

7. 时间安排

  • 阶段一:文献综述和研究方案设计 (2 个月) * 搜集国内外轨道客流分析和建模相关文献,了解研究现状和发展趋势。 * 确定研究方法和技术路线,制定详细的研究计划。* 阶段二:数据收集和处理 (3 个月) * 获取澳门轻轨刷卡数据、建成环境数据和居民出行调查数据。 * 对数据进行清洗、筛选、转换等预处理,构建研究数据库。* 阶段三:模型构建和分析 (4 个月) * 利用 K-means 聚类算法对站点进行分类。 * 构建建成环境指标体系,并对指标进行多重共线性检验。 * 建立梯度提升回归树模型,分析建成环境对轨道交通 OD 客流的影响。 * 构建多项 Logistic 回归模型,分析个人社会经济属性及建成环境对居民轨道交通出行选择的影响。* 阶段四:结果验证和结论撰写 (3 个月) * 对模型结果进行验证和分析,评估模型的预测精度和可靠性。 * 撰写研究报告,总结研究结论和政策建议。

8. 预期成果

  • 学术论文:发表 2-3 篇高水平学术论文。* 研究报告:提交一份完整的研究报告,为澳门轻轨的规划建设和运营管理提供决策参考。

9. 参考文献[此处列出所有相关文献,格式请参考学术期刊要

融合多元数据的轨道客流分析及建模研究——以澳门轻轨为例

原文地址: https://www.cveoy.top/t/topic/U6e 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录