如何使用Python ElementTree获取元素树的所有子元素?

时间:2012-05-02 06:43:50

标签: python xml elementtree

我想找到一种方法来获取元素树的所有子元素,就像ElementTree.getchildren()那样,因为getchildren()自Python版本2.7以后不推荐使用,我不想使用它已经不在了,虽然我现在还可以使用它。

感谢。

5 个答案:

答案 0 :(得分:13)

elem的所有子元素(后代):

all_descendants = list(elem.iter())

更完整的例子:

>>> import xml.etree.ElementTree as ET
>>> a = ET.Element('a')
>>> b = ET.SubElement(a, 'b')
>>> c = ET.SubElement(a, 'c')
>>> d = ET.SubElement(a, 'd')
>>> e = ET.SubElement(b, 'e')
>>> f = ET.SubElement(d, 'f')
>>> g = ET.SubElement(d, 'g')
>>> [elem.tag for elem in a.iter()]
['a', 'b', 'e', 'c', 'd', 'f', 'g']

要排除根本身:

>>> [elem.tag for elem in a.iter() if elem is not a]
['b', 'e', 'c', 'd', 'f', 'g']

答案 1 :(得分:4)

如果你想获得所有元素'a',你可以使用:

a_lst = list(elem.iter('a'))

如果elem也是'a',则会包含它。

答案 2 :(得分:2)

现有的答案都不会找到所有孩子。这个解决方案使用BeautifulSoup而不是ETree,但会找到所有孩子,而不仅仅是顶级:

from bs4 import BeautifulSoup    

with open(filename) as f:
    soup = BeautifulSoup(f, 'xml')

results = soup.find_all('element_name')

答案 3 :(得分:2)

也许这与OP的实际问题不符,但从更广泛的意义上讲,我建议如果有人想获得所有使用特定名称命名的元素,例如可以使用“对象”(@Turtles Are Cute的另一种方法,至少对我来说似乎更自然):

objs = tree.findall('object')

还会返回一个列表。

答案 4 :(得分:0)

在pydoc中提到在节点上使用list()方法来获取子元素。
list(elem)