如何处理lxml中的名称空间

时间:2018-11-03 13:00:10

标签: python lxml

我尝试使用lxml读取xml文件(从word文件中提取),但是没有用。此xml中的标签不同于HTML命名空间标签:始终以w:作为前缀。

代码如下:

from lxml import etree

tree = etree.parse(r'C:\Users\Administrator\Desktop\word\document.xml')
aa=tree.xpath("//w:r")
print(aa)

和错误消息:

  

F:\ Anaconda3 \ python.exe F:/Projects/untitled1/item2.py追溯(大多数   最近一次通话):文件“ F:/Projects/untitled1/item2.py”,第3行,在          aa = tree.xpath(“ // w:r”)文件“ src / lxml / etree.pyx”,第2289行,位于lxml.etree._ElementTree.xpath(src \ lxml \ etree.c:69785)文件中   “ src / lxml / xpath.pxi”,第359行,在   lxml.etree.XPathDocumentEvaluator。呼叫(src \ lxml \ etree.c:179365)
  文件“ src / lxml / xpath.pxi”,第227行   lxml.etree._XPathEvaluatorBase._handle_result   (src \ lxml \ etree.c:177729)lxml.etree.XPathEvalError:未定义   命名空间前缀

     

以退出代码1完成的过程

0 个答案:

没有答案