Python Elementtree:忽略未定义的前缀

时间:2011-10-21 11:03:28

标签: python xml undefined ignore prefix

我有很多从各种来源收集的XML'片段'。由于这些不是完全形成的xml文档,因此很多都没有声明它们的标记前缀。例如。像<exch:p> paragraph text </exch:p>

这样的标签

在python中使用Elementtree来解析这些,我经常得到无界前缀错误。是否有一个开关使解析器一起忽略前缀。

由于

1 个答案:

答案 0 :(得分:0)

我认为你不能同时使用lxml和elementtree。 XMLParser上的选项有限。错误消息来自expat解析器库。处理它的方法是在解析之前声明一个命名空间。

在XPath中,有一种方法只能获取本地名称

//*[local-name()='p']

但是在文档中提到的元素树中没有完全实现XPath。