我有很多从各种来源收集的XML'片段'。由于这些不是完全形成的xml文档,因此很多都没有声明它们的标记前缀。例如。像<exch:p> paragraph text </exch:p>
在python中使用Elementtree来解析这些,我经常得到无界前缀错误。是否有一个开关使解析器一起忽略前缀。
由于
答案 0 :(得分:0)
我认为你不能同时使用lxml和elementtree。 XMLParser上的选项有限。错误消息来自expat解析器库。处理它的方法是在解析之前声明一个命名空间。
在XPath中,有一种方法只能获取本地名称
//*[local-name()='p']
但是在文档中提到的元素树中没有完全实现XPath。