我有一堆.cif文件,总共大约33Mb,包含有关本地总线及其时间表的信息。每行以不同的标识符开头,以指示该行的全部内容。
示例行:
QSN319 020S3_20110104219912311111100 S3 LFBUS O
表示这是公共汽车旅程信息,一些不同的日期以及公共汽车S3
运行的星期几。您可以查看更详细的示例http://pastebin.com/3jzp6QL9
我需要做的是以某种方式将所有(或部分选择,例如我不需要QSN
我的数据库中的部分)数据解析为CSV或XML以进行进一步的SQLite导入。我只需要一个正确的方向和一些我可以使用的工具。 awk和sed是否足以做到这一点,或者我会更多地从头开始编写解析器。
非常感谢任何建议或建议!