使用600M解析大型XML文件

时间:2017-03-23 09:52:59

标签: python xml linux fedora

如果有任何方法可以使用unstagle / python解析XML文件(size = 600M),请告诉我 事实上,我使用untangle.parse(file.xml),我收到错误消息: 流程已完成,退出代码为137

有没有办法通过bloc解析这个文件,例如函数untangle.parse()或者特定的linux配置使用的其他选项......?

由于

2 个答案:

答案 0 :(得分:0)

您可以使用 xml 模块 sax (Simple API for XML)解析器。

SAX是基于XML的流式上下文,文档以线性方式进行处理。

DOM树消耗太多内存时,这是有利的,因为通常DOM实现使用 10个字节的内存来表示1个字节的XML

做类似的示例代码:

broadcastReceiver

答案 1 :(得分:-1)

可以将sax与untangle一起使用吗?这意味着我用sax加载文件并通过untangle读取它,因为我有很多使用untagle编写的代码而且我很长时间都在开发,而且我不想从头开始重启 感谢