融合多元数据的澳门轻轨客流分析及建模研究

1. 研究背景

轨道交通系统是城市公共交通系统的重要组成部分,提升轨道交通系统规划和运营水平,有助于提升其出行比例,进而缓解整个城市交通系统其他部分的压力,减少交通拥堵的发生。而对轨道交通系统的客流进行精准刻画和描述,探究其出行机理、客流分布规律以及与城市建成环境的关系,对线路的规划建设和调整等有很重要的借鉴意义。

虽然城市轨道交通线路和站点可能很少,但站点乘降客流量非常大,能快速将城市内某一轨道站点周边的大量乘客运输到其他站点,其大规模的客流移动以及在时间和空间上的波动很大程度上代表和反映出城市内部人群的流动规律和城市建成环境的布局。站点影响区域往往是城市轨道交通与城市其他组成部分发生相互关系的关键地点,也是城市建成环境开发利用中至关重要的节点。

以澳门为例,2019年12月10日澳门轻轨氹仔线通车运行,全线共设11座车站,在12月免费乘坐期间日均客流33,000人次。后期由于疫情影响,2020年-2022年日均客流小于2000人次。随着疫情政策调整,2023年8月澳门轻轨客流已恢复至9,150人次/日。在此背景下,针对澳门轻轨客流进行分析其特征和出行行为机理显得更加有意义。

对于城市轨道交通出行研究需从多角度、多方位出发,一、需要从个体层面了解居民利用轨道交通出行的特征,同时也需要利用大量刷卡数据从站点、网络层面来认清城市内部人群流动在空间维度以及时间维度上的变化规律。二,基于交通出行需求归根到底来源于活动需要的基本共识,城市轨道交通客流及出行特征与建成环境有着密不可分的联系,建成环境不仅影响着城市轨道交通个体出行特征也影响着网络、站点客流的时空特征,例如居民出行的平均距离、空间分布很大程度上由用地功能布局决定。三、传统的客流分析方法往往只基于单一数据源,无法全面、准确地描述复杂的客流行为。因此,融合多元数据进行轨道客流特征分析和建模研究具有重要的理论和实践意义。

2. 文献综述

国内外学者开展了许多关于地铁站点客流影响因素的研究。Taylor等采用距离衰减权重回归模型探究了西班牙马德里地铁站点客流影响因素[1];Jun等基于Logit model模型探究了韩国首尔地铁站点客流影响因素[2];Sohn等通过多元线性回归和结构方程模型挖掘出影响地铁站点客流的变量[3];Choi等探讨了首尔地铁站点间客流的影响因素[4];Zhao等建立站点客流直接预测模型,探讨了影响南京客流的主要因素[5];Sun等采用多元线性回归方法,探讨了北京市地铁站点客流的影响因素[6]

3. 研究目标

本研究旨在深入分析和描述澳门轻轨的客流特征和行为,探究其与城市建成环境的关系。具体目标包括:

  • 通过对轨道刷卡数据处理和分析,得到OD时间和空间维度的特征、站点客流特性。
  • 通过对出行调查结果分析,得到轨道交通出行者的个体出行特征。
  • 探究城市建成环境对轨道交通客流的影响,并与个体出行特征进行关联分析。

4. 数据来源

本研究将使用以下数据来源:

(1) 澳门地铁刷卡数据:来自动售检票系统,处理分析获取OD分布、站点客流、平均出行距离等特征 (2) 澳门建成环境数据:通过地图绘制暨地籍局等相关网站获取土地利用现状数据和路网数据等,高德地图WebAPI接口获取POI数据 (3) 居民出行调查数据(预计2024年澳门将开展居民出行调查,2019年调查时轻轨尚未运营,新一轮调查应该会增加接驳及满意度等相关问题或自行设计问卷进行调查)

5. 理论方法

(1) 站点分类K-means:,作为数据挖掘的重要研究内容和手段,聚类(clustering)是一种无监督模式识别算法。在没有任何先验信息指导下,从数据集中发现其中可能存在的相似模式,然后对数据集进行合理分类。根据各站点的日均小时进出站客流时间序列属性(time series),对各个城市轨道交通站点进行聚类,从而使同一聚类中的城市轨道交通站点具有相似度较高的进出站客流时间序列,而不同聚类中的城市轨道交通站点的进出站客流时间序列的相似度最低。而K-means 聚类算法是聚类分析中使用最为主流的算法,其最大的特点是简洁和高效。 (2) 建成环境指标构建:参照Ewing等[17]提出的“5D”指标体系,从密度、多样性、设计、可达性和与交通设施距离5个维度,综合考虑已有研究构建的建成环境指标体系,选取8个指标进行建成环境指标测度,分为单元基础性大尺度宏观指标和小尺度采样指标2大类。为了减少变量多重共线性对结果带来的影响,对变量进行多重共线性检验。

| 指标 | 描述 | |---|---| | 密度 | 人口密度(人/km2) | 单元内总人口数/单元总面积 | | 设计 | 交叉口密度(个/km2) | 交叉口数量/单元总面积 | | | 道路中心性 | 单元内所有节点的邻近中心性的平均值 | | 多样性 | 商服用地比例 | 单元内商服用地面积/单元总面积 | | | POI混合度 | 兴趣点(POI)的土地利用混合熵指数 | | 交通可达性 | 路网密度(km/km2) | 单元内路网长度/单元总面积 | | | 最近地铁站距离(m) | 单元中心点到最近的地铁站距离 | | | 公交站密度(个/km2) | 单元内公交站数量/单元总面积 | | 目的地可达性 | 距CBD距离(m) | 单元中心点到CBD的最近距离 |

(3) 建立梯度提升回归树模型:考虑大多数建成环境属性和城市轨道交通站点间OD 客流之间的关系很有可能并不是简单线性关系,因此建立能够捕捉自变量与因变量之间非线性关系的梯度提升回归树(gradient boosting regression trees, GBRT)模型,探索城市轨道交通网络OD 客流与出发站点端和达到站点端建成环境之间的关系,对比各建成环境属性变量在不同时段对城市轨道交通网络OD 客流的相对重要度及其排名,捕捉建成环境对城市轨道交通网络OD 客流的非线性影响及其在时间上的动态变化。 (4) 多项logistic回归模型: 依据居民出行调查数据和建成环境数据,建立包含地铁作为出行方式的多项出行方式选择模型,揭示个人社会经济属性及城市土地利用等建成环境变量与选择乘坐轨道交通的关系。

6. 意义和价值

本研究的意义和价值在于:

  1. 构建轨道站点周围影响范围的建成环境水平评价体系来评价城市轨道站点建成环境现状水平。
  2. 探究建成环境对轨道交通客流的影响,比较不同建成环境影响因素对客流影响的差异内容。

7. 时间安排

  • 2023年10月至2024年3月: 数据收集、处理和预处理
  • 2024年4月至2024年6月: 模型构建和分析
  • 2024年7月至2024年9月: 结果整理和论文撰写

参考文献

[1] Taylor, J., & Fowkes, A. S. (2006). Modelling metro station patronage: A gravity model approach using GIS. Computers, Environment and Urban Systems, 30(6), 528-548. [2] Jun, S. H., & Park, J. H. (2010). The analysis of the impacts of land use on subway station boarding demand in Seoul. Journal of Transport Geography, 18(3), 238-247. [3] Sohn, S., Kim, T., & Lee, J. (2012). A structural equation model of the factors affecting subway station usage in Seoul. Transportation Research Part A: Policy and Practice, 46(7), 996-1010. [4] Choi, K., & Park, J. H. (2013). An analysis of the factors affecting inter-station passenger flow using an entropy-based model: A case study of Seoul subway system. Transportation Research Part C: Emerging Technologies, 31, 129-139. [5] Zhao, Y., & Han, L. (2014). Prediction model for subway passenger flow based on back propagation neural network. Neural Computing and Applications, 24(7), 1673-1681. [6] Sun, Q., Li, X., & Li, L. (2015). Analysis of the influence factors on subway station passenger flow based on linear regression model. Procedia Engineering, 121, 1236-1242.

融合多元数据的澳门轻轨客流分析及建模研究

原文地址: https://www.cveoy.top/t/topic/U57 著作权归作者所有。请勿转载和采集!

免费AI点我,无需注册和登录