用lxml中的regex替换字符串

时间:2017-10-26 06:28:38

标签: python regex lxml

我使用Python 2.7,lxml 3.7.3和exlst扩展,通过使用XPath从XML中提取数据。 我可以在测试节点时使用正则表达式扩展,就像lxml documentation 建议的那样。摘录:

>>> regexpNS = "http://exslt.org/regular-expressions"
>>> find = etree.XPath("//*[re:test(., '^abc$', 'i')]",
...                    namespaces={'re':regexpNS})

>>> root = etree.XML("<root><a>aB</a><b>aBc</b></root>")   
>>> print(find(root)[0].text)
aBc

我想使用xpath表达式只生成节点text()的子字符串。 我该怎么做?

1 个答案:

答案 0 :(得分:0)

要在此处使用xpath表达式,可以执行

import xml.etree.ElementTree as ET
root = ET.fromstring("<root><a>aB</a><b>aBc</b></root>")

for item in root.findall(".//b"):
    print(item.text)
    # aBc

有关更多示例,请参阅documentation page