我使用Python 2.7,lxml 3.7.3和exlst扩展,通过使用XPath从XML中提取数据。 我可以在测试节点时使用正则表达式扩展,就像lxml documentation 建议的那样。摘录:
>>> regexpNS = "http://exslt.org/regular-expressions"
>>> find = etree.XPath("//*[re:test(., '^abc$', 'i')]",
... namespaces={'re':regexpNS})
>>> root = etree.XML("<root><a>aB</a><b>aBc</b></root>")
>>> print(find(root)[0].text)
aBc
我想使用xpath表达式只生成节点text()的子字符串。 我该怎么做?
答案 0 :(得分:0)
要在此处使用xpath表达式,可以执行
import xml.etree.ElementTree as ET
root = ET.fromstring("<root><a>aB</a><b>aBc</b></root>")
for item in root.findall(".//b"):
print(item.text)
# aBc
有关更多示例,请参阅documentation page。