我有一些非常庞大的xml文件(> 50G)从wireshark转换而来。当使用iterparse从这些文件中提取信息时,我发现有一些格式错误的数据包会导致iterparse报告错误,其中包含:
for event,elem in context: 在lxml.etree.iterparse文件“iterparse.pxi”,第207行。 next (src / lxml / lxml.etree.c:126122) lxml.etree.XMLSyntaxError:属性p的规范授权值,第285430929行,第50列
我可以做些什么来跳过这些格式错误的数据包并继续解析?