火车票购票网站优化问题_数学建模竞赛论文.doc
《火车票购票网站优化问题_数学建模竞赛论文.doc》由会员分享,可在线阅读,更多相关《火车票购票网站优化问题_数学建模竞赛论文.doc(19页珍藏版)》请在三一文库上搜索。
1、数学建模竞赛论文论文题目:火车票购票网站优化问题 摘要 本文针对火车票购票网站的优化问题,在合理的假设下,分别建立了参数估计 、蒙特卡罗模拟和主成成分分析这三个模型,较好地解决了火车票购票网站的优化问题。:(估计该队列每秒最多能处理多少数据并计算其错误率问题)首先对题目所给数据进行处理,采集样本。然后运用参数估计的方法,采用最大似然估计法(假设似然函数是正态分布函数)给出参数的点估计。经软件计算得到该队列每秒最多能处理128个数据,其错误率为0.0319.:(模拟2013年1月17日网站订票请求量数据并计算需要多少个队列可以满足需求问题)本文根据网站日访问量数据和现行的分时购票策略,采用蒙特卡
2、罗方法随机模拟网站获取号码次数、获取号码耗时和入队列总耗时数据,在满足入队列错误率低于0.1%,队列排队的时间不超过30分钟的前提下,得到2013年1月17日的网站订票请求量数据(部分见附录2.1),经软件计算需要61+75+69+1155+554+514+71+73+87+13904=16563个队列可以满足需求。:(评价现行的分时购票策略是否合理,若不合理,请优化,并根据优化后的分时购票策略,重新计算第二问问题)首先收集影响现行的分时购票策略的每个因素,然后采用主成成分分析法,用软件计算每个时段的最后总得分,并对其降序,得到结果如下:时刻得分时刻得分18:002.839:00-0.3711
3、:00-0.0716:00-0.3712:00-0.2515:00-0.3713:00-0.268:00-0.3917:00-0.3610:00-0.39从表中可以看出该分时购票策略不合理,经优化后的分时购票策略为8:00、9:00、11:00、12:00、13:00、15:00、16:00、17:00、18:00.并重新计算第二问得到2013年1月17日网站订票请求量数据,共需要61+75+1155+554+514+71+73+87+13904=16494 个队列可以满足需求。:(给网站提出一个建议书)通过查阅相关资料,访问火车票购票网站,然后结合购票过程中遇到的实际问题,本文提出了4个较合
4、理的建议。关键词: 火车票 、购票网站、参数估计、极大似然法、蒙特卡罗随机模拟、主成成分分析一、问题重述1.1问题背景与条件火车,是人们出行的重要的交通工具之一。尤其在节假日,购买火车票的旅客将会非常多,能买到一张火车票是每个旅客的愿望。中国从2011年开始实行网络售票,购买火车票的方式从只能到火车票售票口排队购票,逐步发展为可通过电话订票和网站订票等多种便利的途径。网络购票给人来了便利,旅客可以不出家门在网络上就能买到车票,售票窗口也不用那么繁忙,节省了大量的人力物力。网络售票给人带来便利的同时,也出现了不少问题。典型的是2013年春节的时候,购票网站出现了包括登录、购买、付款等各个环节的问
5、题。为了保证网站更稳定的工作,需要你帮忙提出优化意见。本文为就在此背景下提出下面的问题。1.2需要解决的问题为了便于对问题的分析,现对网站的订票过程做如下简化:1、登录网站:根据用户名和密码登录网站;2、查询余票:查找某趟列车的剩余车票;3、生成订单:锁定剩余车票中的一张作为购买的车票,根据车票信息和购票人信息生成支付订单;4、付款完成:车票购买完成;付款失败:车票回收继续等待预定。经分析,网站订票的瓶颈可能是以下两方面的原因:第一,网站并发问题,也就是同一时刻订票人数过多的问题。在同一时刻(例如1秒之间)访问网站的人数过多,服务器无法响应所有人的请求,导致无法登录、无法查询票车票等问题。在春
6、节期间网站的访问量是非常大的,网站的日访问量可以参考alexa的记录(见参考资料)。为了缓解同一时间段内网站访问量过大的问题,网站采取了分时购票的方法,相当于分散了请求量,减轻了同一时间段并发访问过大的问题。第二,唯一资源问题,也就是唯一的一张车票。所有来订票的人先要锁定一张车票,如果出现多人同时请求订购同一张票,那么系统就无法判断这张车票该给谁锁定,这样系统就会让请求重试。如果一直无法锁定车票,就会导致系统死锁、订票失败。为了应对车票这唯一资源的分配问题,网站又采取了排队的方法,即请求到来先获取一个号码等待排队,这样就避免了对车票直接造成死锁。获取一个号码,入队列的过程相对于处理一张车票的过
7、程(包括锁定车票、生成订单、检测支付等一系列操作)是非常快速的。(这个过程可以和银行的操作流程对比,先获取一个号码排队等待处理,服务窗口是处理器,按照队列先进先出的顺序依次处理)。订票网站想要利用一种队列来满足现在的订票需要,附件给出了这个队列的测试数据:一个队列的入队列数据和一个队列的出队列数据,这些数据只是测试队列性能使用的,不是预测这一时间网站请求量的依据。根据资料回答以下问题:1、根据队列的数据估计该队列每秒最多能处理多少数据,错误率是多少。2、根据网站日累计访问量数据(见参考资料)和现行的网站分时策略,模拟2013年1月17日的网站订票请求量数据,计算需要多少个队列可以满足需求(总的
8、票数用N表示,要求入队列错误率低于0.1%,要求队列排队的时间不超过30分钟)。3、评价现行的分时购票策略是否合理,可以如何优化(要求分时不超过10个)根据优化的分时策略重新计算第2问的问题。4、给网站提出一个建议书,可以包括其他的方面,例如预售期、退票等,不需要建立模型说明。 2、 问题分析2011年年底,全国铁路已经全面推行网络售票,中国铁路开始走进电子商务时代。但随着时间的推移,网络购票出现的问题越演越烈。本文的主要工作首先是根据队列的数据,估计该队列每秒最多能处理多少数据并计算其错误率,其次是根据网站日累计访问量数据和现行的网站分时策略,模拟2013年1月17日的网站订票请求量数据,计
9、算需要多少个队列可以满足需求。然后是评价现行的分时购票策略是否合理,可以如何优化(要求分时不超过10个)根据优化的分时策略重新计算第2问的问题。最后是给网站提出一个建议书。对于问题一,要估计该队列每秒最多能处理多少数据并计算其错误率。首先对题目所给数据进行处理,采集样本。然后运用参数估计的方法,采用最大似然估计法(假设似然函数是正态分布函数)给出参数的点估计。最后用软件求出该正态分布函数的参数估计值。对于问题二,要根据网站日累计访问量数据和现行的网站分时策略,模拟2013年1月17日的网站订票请求量数据,并计算需要多少个队列可以满足需求。建立蒙特卡罗模拟模型,采用蒙特卡罗方法随机模拟网站获取号
10、码次数、获取号码耗时和入队列总耗时数据,在满足入队列错误率低于0.1%,队列排队的时间不超过30分钟的前提下,得到2013年1月17日的网站订票请求量数据,并计算需要多少个队列可以满足需求。 对于问题三,要评价现行的分时购票策略是否合理,可以如何优化(要求分时不超过10个)根据优化的分时策略重新计算第2问的问题。首先要收集影响现行的分时购票策略的每个因素,然后采用主成成分分析法,用软件计算每个时段的最后总得分,并对其降序,从中可以看出哪些具有优势和劣势,相对于优势来说,劣势可以进行优化。最后在优化的分时策略的基础上,用蒙特卡洛方法重新计算第二问的问题。 对于问题四,要给网站提出一个建议书。查阅
11、相关资料,访问火车票购票网站,再结合购票过程中遇到的实际问题,提出相关的合理建议即可。三、模型假设 结合本题的实际,为了确保模型求解的准确性和合理性,我们排除了一些因素的干扰,提出以下几点假设:1、 假设题目所给的数据真实可靠;2、 假设模型建立的过程中不存在网站订票的瓶颈;3、 假设现行的网站分时策略比较合理;4、 假设模型进行参数估计的显著性水平为0.05;5、 假设模型给出的似然函数是正态分布函数;6、 假设模型模拟网站订票请求量数据的方法可靠;7、 假设模型评价现行的分时购票策略的方法可靠;8、 假设针对问题所给出的建议能够起到较好的结果,建议可靠,作用性强。 四、符号说明 为了便于问
12、题的求解,我们给出以下符号说明:符号说明参数似然函数对数似然函数概率密度函数样本观察值联合密度函数火车起售车站数量、网站购票数量、网站访问量、网站预售票数量时刻(除去14:00)第个指标的样本均值和样本标准差标准化指标变量相关系数矩阵特征值特征向量信息贡献率累积贡献率综合得分5、 模型的建立与求解 经过以上的分析和准备,我们将逐步建立以下数学模型,进一步阐述模型的实际建立及求解过程。5.1模型一(参数估计模型)5.11极大似然估计算法步骤:数据处理,采集样本;:由总体分布导出样本的联合概率密度函数;:把样本联合概率密度函数中自变量看成已知常数,而把参数看作自变量,得到似然函数;:求似然函数的最
13、大值点(常转化为求对数似然函数的最大值点);:在最大值点的表达式中,用样本值代入就得参数的极大似然估计值5.12具体过程 要根据队列的数据,估计该队列每秒最多能处理多少数据并计算其错误率。首先对题目所给数据进行处理,采集样本。然后以作为参数,使已知数据在某种意义下最可能出现,使得似然函数(假设似然函数是正态分布函数)最大。在最大值点的表达式中,用样本值代入就得参数的极大似然估计值具体过程如下:(1) :对题目所给数据进行处理,采集样本,将它们制作成表格如下:处理个数22015910989101100111111错误率0.05910.0503000.00990.0100处理个数166150164
14、116122101101错误率0.06020.08670.1220.02590.02460.00990.0198 表1(2) :假设总体近似服从正态分布,即,估计参数。(3):设总体是连续离散型随机变量,其概率密度函数为,若取得样本观察值为,则因为随机点取值为时联合密度函数值为所以,按极大似然法,应选择的值使此概率达到最大我们取似然函数为。 【1】(4):极大似然估计法就是在参数的可能取值范围内,选取使达到最大的参数值,作为参数的估计值即取,使,【2】因此,求总体参数的极大似然估计值的问题就是求似然函数的最大值问题这可通过解下面的方程 【3】来解决因为是的增函数,所以与在的同一值处取得最大值我
15、们称为对数似然函数因此,常将方程【3】写成: 【4】方程【4】称为似然方程(5) :解方程【3】或【4】得到的就是参数的极大似然估计值(6):得出.通过软件求解得到参数的极大似然估计值为128, 0.0319(程序见附录一)即最大处理数据为128,其错误率为0.0319.5.2模型二(蒙特卡罗模拟模型) 根据网站日累计访问量数据和现行的网站分时策略,建立蒙特卡罗模拟模型,具体过程如下:(1) :查阅2013年1月17日的网站日累积访问量数据为16564480,查阅12306网站及关于调整部分车站互联网、电话订票起售时间的公告,了解现行的网站分时策略,并作出相关分析。(3) :以1000次作为一
16、次模拟,随机模拟获取号码次数、获取好码耗时和入队列总耗时数据,在满足入队列错误率低于0.1%,队列排队的时间不超过30分钟的前提下,得到2013年1月17日的网站订票请求量数据(8:00时刻部分见附录2.1),并且计算出需要多少个队列可以满足需求。(4) :经软件编程(具体程序见附录2.2)算出需要61+75+69+1155+554+514+71+73+87+13904=16563个队列可以满足需求。5.3模型三5.31(主成分分析模型)要评价现行的分时购票策略是否合理,可以如何优化(要求分时不超过10个)。采用主成成分分析方法对现行的分时购票策略进行综合评价,具体步骤如下:(1) :收集影响
17、现行的分时购票策略的每个因素,将其做成表格如下:时刻火车起售车站数量网站购票数量网站访问量网站预售票数量8:00257500061250785009:00361080007541011450010:003090000690409410011:00178534000115520054100012:008826400055412028740013:008525500051420026540015:0033990007120010070016:00341020007251011540017:00391170008741012410018:0013084924000139041404759007总数1
18、8566478900165644806480107表2(2) :用分别表示火车起售车站数量、网站购票数量、网站访问量、网站预售票数量,用分别表示时刻(除去14:00),第时刻的取值分别记作,构造矩阵.(3) :对原始数据进行标准化处理。将各指标转换成标准化指标,有=,其中:,即为第个指标的样本均值和样本标准差。对应地,称,为标准化指标变量。(4) :计算相关系数矩阵。相关系数矩阵,有其中:是第个指标与第个指标的相关系数。(5) :计算特征值和特征向量。计算相关系数矩阵的特征值,及对应的标准化特征向量。(6) :计算特征值的信息贡献率和累计贡献率。称为主成分的信息贡献率,为主成分的累积贡献率。经
19、软件计算得到累计贡献率为0.99976,达到符合要求。(7) :计算综合得分:,其中:为第个主成分的信息贡献率,根据综合得分值就可以进行评价。经软件计算得到各时刻的信息贡献率和和综合得分如下表:表3(8) :评价现行的分时购票策略是否合理并且优化:从表3中可以看出,各时段的综合得分前两个数据明显大于后面的数据,并且第一个数据又明显大于第二个数据,后面的数据相对比较均匀,由此可以得出现行的分时购票策略不合理,应该让18:00时刻和11:00时刻火车起售车数量均匀分给其他时刻,并且重新调整分时购票策略如下:8:00、9:00、11:00、12:00、13:00、15:00、16:00、17:00、
20、18:00.5.32(优化后重新计算第二问的问题)根据优化的分时策略,经软件编程(部分程序见附录3.1)重新模拟2013年1月17日的网站订票请求量数据(部分见附录3.2),计算出共需要 61+75+1155+554+514+71+73+87+13904=16494 队列可以满足需求。5.4给出建议书 2011年年底,中国铁路开始全面实行网上售票。然而网络购票给广大客户带来便利的同时,也相继出现了不少问题。归根结底,还是需要提升12306网站的体验,做好应急预案,才是王道。现建议如下:建议一:目前用户进入车票预定页面所默认的起始时间是当日,其实在春运期间,可以默认的是最早订到车票的日期,服务好
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 火车票 购票 网站 优化 问题 数学 建模 竞赛 论文
链接地址:https://www.31doc.com/p-3957607.html