使用lxml的iterparse时如何跳过格式错误的数据包?

时间:2015-02-24 07:00:19

标签: python malformed iterparse

我有一些非常庞大的xml文件(> 50G)从wireshark转换而来。当使用iterparse从这些文件中提取信息时,我发现有一些格式错误的数据包会导致iterparse报告错误,其中包含:

for event,elem in context:   在lxml.etree.iterparse文件“iterparse.pxi”,第207行。 next (src / lxml / lxml.etree.c:126122) lxml.etree.XMLSyntaxError:属性p的规范授权值,第285430929行,第50列

我可以做些什么来跳过这些格式错误的数据包并继续解析?

0 个答案:

没有答案