余票放票究竟有什么规律_火车票放票

编者按:本文的数据采集和统计分析时间为2018年9月,部分数据特征和结论可能与春运高峰期不符 。
春节想去浪
没有火车票怎么办
让我们一起来看看12306的数据
发放剩余的票有什么规定吗
这完全取决于性格
还是有一定的规律可循?
十行代码带你获得超过12,306票
-通过url获取网页数据
我们选择在12306网站上获取数据
这个界面大家应该都挺熟悉的
然后在网页空白处点击右键——查看元素
在网络界面中查找请求网址,该网址包含剩余的票证信息
让我们用python做一个简单的数据清理
剩余的票证数据已成功爬网

-使用python,构建剩余投票的自动抓取代码
我们使用python的时间表库
构建全天候运行的数据代码
不断获取剩余的票证数据
由于篇幅有限,我就不赘述了
什么样的火车票有机会买到
-大区域有票,小区域没有票
理论上随时都有抢火车票的机会,因为一旦退款回到系统,12306基本上就会实时回到剩余票库 。
我们这里指的抢票,是指车票过剩,驾驶时间相对较短的长途车票 。铁路部门因为要降低空载率,实现利润最大化,所以单独销售长途车票 。
举个栗子:
小长假想去平遥古城玩两天,先看看火车票:
根据系统显示,G627的二等座全部售完,只剩下一个一等座 。平遥古城能不去吗?当然不是 。我们发现平遥古城不是终点站,但是火车的终点站是运城北 。
搜索北京到运城北看到的结果:

结果表明,北京到运城北的票源充足,剩余票超过99张 。这里先大胆猜测一下 。铁路部门认为全程剩余票卖不出去 。为了降低空载率,在可以接受开卖的情况下,会放出大量剩余票 。接下来,让我们验证并看看这些剩余的票是如何发行的 。
大数据分析剩余票发布时间
由于12306的修订,当剩余票数超过20张时,不会显示为“是”,但实际上系统还是会在提交12306购票订单前提示实际剩余票数 。
但长期爬虫登录后容易对账号产生不良影响,建议需要抓取实际投票的朋友谨慎,退一步选择其他网站出售 。剩下的票数一般可以显示到99 。
感谢郑涛先生提供了包含剩余门票准确信息的源数据 。数据是连续七天的剩余火车票数,采集间隔一分钟 。我们来讨论一下剩余火车票的发售方式 。
-同一列车不同车站售票时间是否相同?
同一列车上,不同车站的放票时间是否相同,即放票时间是否与车站有关 。为了验证这个问题,我们当天选了D306次,分三个区间对剩余票数进行了分析比较 。

结果显而易见 。我们发现,三个车站的售票时间集中在中午12点和下午18点半,三个车站之间没有明显的差异,即该列车剩余车票的售票时间基本上没有站与站之间的差异 。
同一列火车在不同日期的时间是一样的吗?
我们也以D306次为例,连续三天看D306次当天的剩余票数 。

我们可以看到,虽然三天剩余票不一样,但是每天从183,336,025到18: 30都有大量剩余票放出,三天的放票时间非常接近,所以D306上海到南京的放票时间在这三天是相对固定的 。
这是普遍现象还是个案?我们把时间拉长,看看七天的数据是否还符合这个规律 。

从表中可以看出,答案是肯定的 。蒂姆
【余票放票究竟有什么规律_火车票放票】此外,小编还观察了G1252-苏州至无锡、G7072-丹阳至南京、G7244-无锡至镇江等共20趟列车不同日期同一天同一区段剩余车票的放行情况,发现上述20趟列车的放行时间也有一个相对固定的时刻 。
-那么,多久你才能抓住它,让它出来
余票?
我们将20趟列车的“发车——放票时间”做成一个柱状图,来看看其中有没有什么规律 。
从上面的数据来看,每趟列车的放票时间不尽相同,但是我们发现了两个数据非常密集的区段,开车前7小时(420分钟)和开车前1小时(60分钟),我们在实际的抢票过程中可以重点关注这两个时间段 。
再来看看这20趟列车每日放票的时间差,并制箱型图,发现绝大部分车次不同日的放票时间差距很小,与我们之前个体数据的规律基本相符 。
总结与展望
1.通过本次样本数据的分析,车辆余票放票的时间与车站不存在直接关系,而是因车票而异 。
2.在大区间有余票的情况下,小区间放票的时间相对固定,这个时间是存在的,但因车次而异,而且不受12306网站停止服务影响的,绝大多数情况下也不是整点,例如早九时发车的D3022,会在凌晨两点左右放票 。在确认大区间有票的情况下,提前7小时和1小时观察该车次的放票情况,有更高概率发现车辆的放票时间 。