可恢复的XML解析

时间:2012-05-25 15:21:37

标签: java xml xml-parsing

我有一个数据导入工具,可以解析大量的XML(它使用SAX解析器,但是适应性是我遇到的最少的问题)。失败,新部署,系统重启发生,我不想完全重新开始,所以我需要不时保存解析器状态(我们可以将其称为XML游标)。

是否有任何解析器能够保存状态并恢复它们(显然我必须在恢复时搜索文件)?

我还没有找到这样的解析器,所以我对此有疑问,所以这是我的第二个问题:你有什么建议我应该如何开始实现它?采用SAX解析器实现并深入研究,或者我最好从头开始?

如果重要,我需要xml命名空间,但没有架构/ DTD检查。

对于预先解析xml并分发工作以进行并行处理,游标也可以派上用场。

1 个答案:

答案 0 :(得分:0)

真的取决于内容,你能编写一个XQuery来明确地找到文件中的节点。

例如<Item id="1000"/>

如果是这样,在成功解析一个节点之后会持续它,那么当你恢复传入它时(null将从第一个开始)。然后移动到目标节点,移动到下一个节点,然后移动到y va。