以固定宽度解析多模式记录

时间:2016-09-30 13:20:00

标签: java text-parsing univocity

<00> 0000321C #Foo Foo

23234HSBCA#123433-000HSBCAUS

00234HSBCB#222343-130HSBCCADCE

<00> 0000322C#Mr Bar

给定文件是固定宽度,包含A#,B#和C#的记录映射到不同的模型。 (A#,B#和C#是记录指标)

我确实找到了一个库(univocity-parser),我们可以在这里做类似的事情,但限制是记录指示器,但是在行的开头。

请建议。

1 个答案:

答案 0 :(得分:0)

这是一个非常不寻常的要求,坦率地说它是固定宽度格式的不良使用,因为它需要解析器在每一行上来回读取,以试图识别#C是否在8位,B#在12或在位置7处#C,然后使用与标识符相关联的适当格式消耗记录。

如果这对于为您提供类似输入的应用程序是一个真正的要求,我可以给出的唯一建议是:在此库的帮助下自己实现这一点,或者如果性能如此,请付某人为您执行此操作关注。