在Python中从XML树的子元素中提取所有文本

时间:2016-04-17 10:19:37

标签: python xml parsing

我正在尝试提取政府账单数据部分,例如https://www.govtrack.us/data/congress/113/bills/sconres/sconres14/text-versions/is/document.xml。我只想要该部分的文本,但不能知道如何使用python的xml.etree.ElementTree导航到它。等效的javascript就像getElementbyTagName。

1 个答案:

答案 0 :(得分:1)

xml.etree.ElementTree中,您可以使用findall()传递XPath expression字符串作为参数,以查找具有特定条件的元素。因此,对于简单的元素名称(那些不包含前缀的元素名称),getElementbyTagName("elementName")中Javascript ElementTree的等价物将为findall(".//tagName")