解析ATCO CIF文件以生成CSV或XML输出

时间:2012-05-21 18:19:09

标签: sqlite parsing csv

我有一堆.cif文件,总共大约33Mb,包含有关本地总线及其时间表的信息。每行以不同的标识符开头,以指示该行的全部内容。

示例行:

QSN319 020S3_20110104219912311111100 S3 LFBUS O

表示这是公共汽车旅程信息,一些不同的日期以及公共汽车S3运行的星期几。您可以查看更详细的示例http://pastebin.com/3jzp6QL9

我需要做的是以某种方式将所有(或部分选择,例如我不需要QSN我的数据库中的部分)数据解析为CSV或XML以进行进一步的SQLite导入。我只需要一个正确的方向和一些我可以使用的工具。 awk和sed是否足以做到这一点,或者我会更多地从头开始编写解析器。

非常感谢任何建议或建议!

1 个答案:

答案 0 :(得分:0)

我与David J. Rice的ATCO-CIF parser取得了相当不错的成绩。它是用Ruby编写的。