我经常会遇到各种纯文本格式的EDI消息,例如格式:
HEAD[customer,8][date,8][reference,10]
[lineno, 3][product, 8][quantity, 3][currency, 3][price, 10]...
..导致这样的消息:
HEAD1122334420091031 LINDAHL
00100004711010USD0000234055
00200004712005USD0000004543
...
阅读上面的转储显然需要关注,我经常发现自己失去了对列和字段的跟踪。有一种方法可以表达消息的语法并获得标记文件(例如在HTML中)。
使用任何语言的自定义脚本当然可以做到这一点,但我很好奇:转换纯文本是否有通用的东西,比如XSLT对XML的作用?
答案 0 :(得分:2)
看起来像awk
的工作。它的设计完全是为了解析这样的文本文件。它基于规则,与XSLT完全相同。它已经安装在你的Unix机器上 - 只是man awk
。