将gtfs转换为较小的转换数据

时间:2014-11-12 17:12:44

标签: python gtfs transit

我有时会有一个非常大的gtfs zip文件 - 有效期为6个月,但这对于将这么大的数据大小加载到低资源(例如,2 gig内存和10 gig硬盘)来说是不经济的disk)EC2服务器。

我希望能够将这个大尺寸的gtfs分成2个月(6个月/ 3个文件)期间有效数据的3个较小的gtfs zip文件,当然这意味着我需要每2个月更换一次数据。

我找到了一个python程序,它实现了相反的目标MERGE https://github.com/google/transitfeed/blob/master/merge.py(这是一个非常好的python项目顺便说一句。)

我非常感谢任何指针。

致以最诚挚的问候,

唐恩。

1 个答案:

答案 0 :(得分:1)

值得注意的是,在加载GTFS Feed时,stop_times.txt中的条目通常是最大的内存耗尽。由于大多数系统都没有为这些旅行活动的日期复制旅行+停止时间,因此减少服务日历可能不会为您节省太多。

也就是说,有一些切片和切割GTFS的工具。查看OneBusAway GTFS Transformer工具,例如:

http://developer.onebusaway.org/modules/onebusaway-gtfs-modules/1.3.3/onebusaway-gtfs-transformer-cli.html