Question

我有很多从各种来源收集的XML'片段'。由于这些不是完全形成的xml文档，因此很多都没有声明它们的标记前缀。例如。像<exch:p> paragraph text </exch:p>

这样的标签

在python中使用Elementtree来解析这些，我经常得到无界前缀错误。是否有一个开关使解析器一起忽略前缀。

由于

Answer 1

我认为你不能同时使用lxml和elementtree。 XMLParser上的选项有限。错误消息来自expat解析器库。处理它的方法是在解析之前声明一个命名空间。

在XPath中，有一种方法只能获取本地名称

//*[local-name()='p']

但是在文档中提到的元素树中没有完全实现XPath。