我有一个数据导入工具,可以解析大量的XML(它使用SAX解析器,但是适应性是我遇到的最少的问题)。失败,新部署,系统重启发生,我不想完全重新开始,所以我需要不时保存解析器状态(我们可以将其称为XML游标)。
是否有任何解析器能够保存状态并恢复它们(显然我必须在恢复时搜索文件)?
我还没有找到这样的解析器,所以我对此有疑问,所以这是我的第二个问题:你有什么建议我应该如何开始实现它?采用SAX解析器实现并深入研究,或者我最好从头开始?
如果重要,我需要xml命名空间,但没有架构/ DTD检查。
对于预先解析xml并分发工作以进行并行处理,游标也可以派上用场。
答案 0 :(得分:0)
真的取决于内容,你能编写一个XQuery来明确地找到文件中的节点。
例如<Item id="1000"/>
如果是这样,在成功解析一个节点之后会持续它,那么当你恢复传入它时(null将从第一个开始)。然后移动到目标节点,移动到下一个节点,然后移动到y va。