基于LightGBM和LSTM模型的地铁客流量短期预测.docx
《基于LightGBM和LSTM模型的地铁客流量短期预测.docx》由会员分享,可在线阅读,更多相关《基于LightGBM和LSTM模型的地铁客流量短期预测.docx(62页珍藏版)》请在三一文库上搜索。
1、摘要近年来,随着轨道交通的不断发展,地铁出行成为居民出行的主要交通方式.随着地铁线路的不断完善发展,地铁客流量不断增加,这也容易造成地铁站客流拥堵,不利于居民出行及地铁运营管理.因此实现对站点客流量的短期预测能够帮助优化地铁运营管理,保障市民安全出行.本文通过收集杭州市AFC系统的所有地铁站刷卡数据信息,对数据进行处理后建立短期客流量预测模型.本文首先进行数据处理,将原始数据转化为各站点每十分钟客流量数据,从站点和时间两个方面对客流量数据特征进行分析.一方面分析不同站点的客流量分布特征,将站点划分为五类并具体分析每类站点的客流量分布. 另一方面分析工作日和节假日客流量的特征,总结得出工作日客流
2、量均呈现不同程度的高峰,而周末的客流相对来说更复杂,受随机因素影响较大.本文对工作日和周末分别建立客流量LightGBM预测模型,以金沙湖站为例分别度量工作日和周末客流量的特征重要性并利用网格搜索算法对模型参数进行了优化,最后以RMSE为评价指标对客流量预测结果进行评估.RMSE结果显示LightGBM模型对工作日预测效果颇佳,进出站客流量预测RMSE值分别为18.26、13.67,而对周末客流量预测效果与工作日相比较差,进出站RMSE值分别为23.36、28.14。为了对周末客流量预测模型进行优化,本文使用树模型和神经网络模型加权融合的创新方法,建立LSTM模型对周末客流量进行预测,并将Li
3、ghtGBM模型和LSTM模型进行加权融合,融合后进出站RMSE值分别为19.46、25.97,周末客流量预测精度得到提升.关键词: 地铁客流量短期预测;LightGBM模型;LSTM模型;模型融合AbstractIn recent years, Rail transport has become the main ways of travelling for residents. With the continuous development of metro lines , passenger flow of subway is increasing,leading to subway c
4、ongestion easily, and making it difficult for residents to travel and manager to make decision. Therefore, achieveing short-term forecast of passenger flows can help optimizing subway operation management and ensure the safety of passengers, which is of great significance.In this paper, through coll
5、ecting the card swiping data of all metro stations in Hangzhou AFC system, we established short-term passenger flow prediction models and optimized it after data processing . First of all, We processed the data, transforming the original data into the passenger flow data with ten minute intervals, a
6、nd analyzes the characteristics of the passenger flow data from aspects of station and time. On the one hand, we analyzed the distribution characteristics of passenger flow in different stations, and divided the stations into five categories according to the distribution characteristics and the stat
7、ion information, and specifically analyzed the distribution of the passenger flow of each category . On the other hand, we analyzed the characteristics of the passenger flow on weekdays and weekends, and concluded that the passenger flow on weekdays all presents peaks regardless of the type of stati
8、on, while the passenger flow on weekends is relatively more complex and greatly affected by random factors.Due to the great difference in the distribution characteristics of passenger flow on weekdays and weekends, we established lightgbm model to predict passenger flow on weekdays and weekends resp
9、ectively. Taking Jinsha Lake Station as an example,we analyzed the importance of the characteristics that affect the passenger flow on weekdays and weekends respectively, optimized the model parameters by using grid search algorithm and evaluated the prediction results with RMSE as the evaluation in
10、dex. The result of RMSE shows that the lightgbm model has a good prediction effect on weekdays and the RMSE value of inbound and outbound passenger flow is 18.26 and 13.67 respectively, while the prediction effect of weekends passenger flow is worse than that of weekdays, and the prediction effect o
11、f inbound and outbound passenger flow is 23.36 and 28.14 respectively.In order to optimize the prediction model of weekend passenger flow, we used the method of mixing tree model and neural network model together. we established LSTM model to predict weekend passenger flow, and merged lightgbm model
12、 with LSTM model. After merging two models, the RMSE values of inbound and outbound passenger flow changed to 19.46 and 25.97 respectively, it shows that the prediction accuracy of weekend passenger flow has been improved.Key words: short term prediction of passenger flow; lightgbm; LSTM; model fusi
13、on目录摘要IAbstractII1 绪论11.1研究背景与意义11.2国内外研究现状21.2.1数理统计模型预测21.2.2人工智能算法模型预测31.2.3混合模型预测31.3研究内容与论文框架41.3.1研究内容41.3.2论文框架52 预测算法理论知识概述72.1树模型LightGBM概述72.1.1 GBDT模型概述92.1.2 XGBoost模型概述102.1.3 LightGBM模型概述112.2深度神经网络模型LSTM模型概述132.2.1 RNN神经网络模型概述142.2.2 LSTM神经网络模型概述162.3 网格搜索法概述192.4 本章小结203 地铁客流数据特征分析21
14、3.1数据预处理213.1.1数据预处理213.1.2 数据归一化处理223.1.3数据集划分223.2客流量总体分析233.3站点客流量分析243.4客流量时间特征分析293.5 影响因素分析303.6 本章总结314 基于LightGBM模型的地铁客流量短期预测324.1 LightGBM模型准备324.2工作日客流量LightGBM模型预测334.2.1工作日LightGBM模型参数优化334.2.2工作日LightGBM模型特征重要性度量344.2.3工作日LightGBM模型预测结果354.3 周末客流量LightGBM模型预测364.3.1周末模型参数优化364.3.2周末Ligh
15、tGBM模型特征重要性度量364.3.3周末LightGBM模型预测结果375 周末客流量模型优化395.1 建立周末客流量LSTM预测模型395.1.1 LSTM模型模型准备395.1.2 周末客流量LSTM预测模型调参405.1.3 周末客流量LSTM模型预测结果425.2 LightGBM模型与LSTM模型融合435.2.1 模型融合概述435.2.2 LightGBM模型与LSTM模型融合446 总结与展望466.1 总结466.2 展望47致谢48参考文献491 绪论1.1研究背景与意义随着城市居住人口和务工人口的增多、居民生活条件的改善以及机动车数量的增多,地面交通压力逐渐加大,地
16、面交通拥堵成为许多城市难以避免的问题.一到交通高峰期,地面交通极易出现拥堵,这不仅增加了交通管理的难度,还增加了交通事故的风险,同时还给城市居民出行带来不便,增加了居民的交通出行时间.随着轨道交通的不断发展,越来越多的居民选择搭乘地铁或者其他轨道交通出行.地铁等轨道交通工具与地面交通工具相比,具有运输容量大,准时性,安全性,舒适性,环保性等特点1,现如今,地铁出行已成为市民出行的主要交通方式.轨道交通发展至今已有一百多年的历史,19世纪60年代,世界上第一条地铁线路在伦敦开通,随后美国,德国等国家相继在本国内开展地铁轨道交通建设,地铁交通在世界范围内发展2.我国地铁轨道交通发展起步较晚,但发展
17、迅速.1965年我国第一条地铁线路北京地铁开通3,截止2019年底,我国共有41个城市开通了地铁交通,同时有部分城市地铁正在建设中.从第一条地铁建设至今虽然只有55年,但我国地铁建设飞速发展,并在我国的一线、二线城市中广泛分布4.同时地铁发展与城市经济发展相互促进,随着城市经济的不断发展,城市地铁进一步发展,目前许多城市正在积极进行地铁线路扩建,而随着地铁交通的不断发展,城市经济也进一步增强.随着地铁轨道交通的逐步扩建和完善,地铁交通在我国公共交通系统中占据着重要的位置,越来越多的人选择搭乘地铁作为出行的第一方案.然而地铁交通的不断发展也带来了新的问题,随着地铁线路的不断完善与覆盖面积的不断增
18、大,城市地铁尤其是一线城市地铁线路相互连通,使得整个城市的地铁客流量不断增加,而这也容易造成地铁站客流拥堵,导致客流对冲等问题出现,这不仅易对居民出行造成影响,产生安全隐患,同时也给地铁交通运营管理带来难题.而如何有效的缓解地铁乘客拥堵,提前部署规划,规避可能存在的安全问题成为现阶段地铁交通管理需要解决的主要问题之一.随着地铁交通网络化管理的不断发展以及大数据应用和人工智能等技术的不断进步,通过地铁站的刷卡系统可以获取所有地铁站乘客的刷卡数据.基于这些乘客刷卡信息结合其他收集到的信息,可以建立模型来挖掘乘客的出行规律,预测各个地铁站点未来的客流量变化,进一步优化地铁运营管理,提前部署相应的安保
19、策略,给市民提供出行建议,保障市民安全出行.1.2国内外研究现状对客流量进行预测的研究主要有长期预测和短期预测两种,长期客流量的预测主要应用于基建阶段,通过对线路长期客流量进行预测来统筹地铁的线路安排,规划交通,确保项目价值最大化5.短期预测主要应用于运营阶段,通过对各站点未来短期内客流量的变化来提前部署安保策略,方便市民出行.现阶段对客流量进行预测的研究主要以短期客流量预测为主.对短期客流量进行预测的方法主要有数理统计模型和人工智能算法模型 6,数理统计预测的方法主要有时间序列模型、回归模型、卡尔曼滤波模型等7-10,人工智能算法预测模型主要有传统机器学习算法以及深度学习神经网络模型等11-
20、17.1.2.1数理统计模型预测基于数理统计模型对短期客流量进行预测的研究开始较早,学者Pitfield18基于自回归滑动平均模型即ARIMA模型对航线客流量进行短期预测,证实ARIMA模型在航空客流量预测上是可行的,但由于客流量数据具有非线性性和随机性,该方法进行预测的精度不是很高.国内熊杰19等学者基于卡尔曼滤波对地铁换乘站点这一特殊站点进行客流量短期预测,该模型对工作日的预测结果较为精准,但对突变性强的节假日预测结果不够准确.包磊20等学者建立灰色模型和马尔科夫链, 预测南京二号线下一站的实时客流量.与预测各站点未来某时刻的客流量不同,该模型预测的是下一站的站点客流量.学者 Cardoz
21、o21使用地理加权回归模型来对马德里地铁站客流量数据进行预测并与传统模型进行比较.1.2.2人工智能算法模型预测随着人工智能算法的不断完善改进以及计算机性能的不断加强,人工智能算法逐渐应用于各个领域,如在语音识别22,图像识别23,自然语言处理24方面均有着非常多的应用.由于人工智能算法具有非常强的数据分析能力,学习能力以及泛化能力,同时模型灵活多变,因此在客流量预测方面也有着很好的效果.林培群25等学者在分析发现地铁日客流具有一定规律,并根据该规律提出一种基于误差变化率计算的K近临算法,以广州南站为实例验证了其对节假日及非节假日均具有较高的预测精度.任崇岭26等学者考虑客流量数据的动态性由多
22、种因素影响,建立小波神经网络模型来预测短时客流,并与其他的典型模型进行比较,发现小波神经网络具有更高的预测精度.周燎27等学者基于动态贝叶斯神经网络,同时结合EM算法求得参数的最大似然估计,对车流量进行了预测.1.2.3混合模型预测混合模型能够规避单个模型的不足,集合多个模型的优点.Mascha Van Der Voort28等学者在基于ARIMA模型下提出了KARIMA模型,该模型将ARIMA模型与 Kohonen自组织特征映射网络进行结合,对自组织特征映射网络的每一个子类都构建一个单独的ARIMA模型,该方法与单个模型相比,模型预测效果明显提升且所需要的基模型与其他同类型分层预测模型相比更
23、少.Sun Y29等学者提出一种小波变换和SVM算法相混合的算法模型,该模型在建立SVM模型预测北京地铁短期客流量的基础上通过小波理论进行重构,结合小波变换和SVM优势,有效的提高了模型的性能.Jeremy Roos30等学者利用卡尔曼滤波对缺失值进行过滤后采用多维贝叶斯对数据进行预测,该模型在不涉及突发事件的情况下模型效果较佳,但在客流量产生突发性变化的时候模型效果不佳.宋国峰31等学者提出一种将遗传算法与BP神经网络模型结合的算法,通过遗传算法来优化BP神经网络模型的参数,来克服BP神经网络易陷入局部最小和收敛速度慢的问题,提高模型的学习能力.1.3研究内容与论文框架1.3.1研究内容总结
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 LightGBM LSTM 模型 地铁 客流量 短期 预测
