我们每天都会从多个来源下载新的GTFS(基本上是CSV文件的zip文件)数据,以查看更新是否已更新。现在,我们只检查拉链本身是否不同,如果它们不同则更新。
事实上,在某些消息来源上,GTFS每天都在变化。这对我们来说是一个问题,因为这会触发许多设备上的离线数据更新。
大多数情况下,更新是次要的(更改了停止名称,不同的ID但内容相同等)。我想区分主要更新(计划更改,新路线)与未成年人。差异工具本身是无用的,因为每个GTFS可以具有相同的内容,但在CSV中具有不同的ID和/或顺序。
有没有人有同样的问题?那里有工具可以提供帮助吗?