我有时会有一个非常大的gtfs zip文件 - 有效期为6个月,但这对于将这么大的数据大小加载到低资源(例如,2 gig内存和10 gig硬盘)来说是不经济的disk)EC2服务器。
我希望能够将这个大尺寸的gtfs分成2个月(6个月/ 3个文件)期间有效数据的3个较小的gtfs zip文件,当然这意味着我需要每2个月更换一次数据。
我找到了一个python程序,它实现了相反的目标MERGE https://github.com/google/transitfeed/blob/master/merge.py(这是一个非常好的python项目顺便说一句。)
我非常感谢任何指针。
致以最诚挚的问候,
唐恩。
答案 0 :(得分:1)
值得注意的是,在加载GTFS Feed时,stop_times.txt中的条目通常是最大的内存耗尽。由于大多数系统都没有为这些旅行活动的日期复制旅行+停止时间,因此减少服务日历可能不会为您节省太多。
也就是说,有一些切片和切割GTFS的工具。查看OneBusAway GTFS Transformer工具,例如: