应用错误收集

我有一些非常庞大的xml文件（＆gt; 50G）从wireshark转换而来。当使用iterparse从这些文件中提取信息时，我发现有一些格式错误的数据包会导致iterparse报告错误，其中包含：

for event，elem in context：在lxml.etree.iterparse文件“iterparse.pxi”，第207行。 next （src / lxml / lxml.etree.c:126122） lxml.etree.XMLSyntaxError：属性p的规范授权值，第285430929行，第50列

我可以做些什么来跳过这些格式错误的数据包并继续解析？

使用lxml的iterparse时如何跳过格式错误的数据包？

0 个答案: