Etree返回“随机”字符串而不是属性名称

时间:2016-10-07 14:09:57

标签: python xml tree elementtree graphml

我根本不熟悉python和树,但遇到了一些问题。

我将以下数据集结构化为:

<?xml version="1.0" encoding="UTF-8"?>
<graphml xmlns="http://graphml.graphdrawing.org/xmlns">
  <node id="someNode">
    <data key="label">someNode</data>
  </node>
</graphml>

我想要获取根元素和节点元素的属性和属性值。

我尝试过像这样使用Python xml.etree.ElementTree:

import xml.etree.ElementTree as etree

tree = etree.parse('myDataset')
root = tree.getroot()

print('Root: ', root)

print('Children: ', root.getchildren())

但这就是我得到的:

Root:  <Element '{http://graphml.graphdrawing.org/xmlns}graphml' at 0x031DB5A0>
Children:  [<Element '{http://graphml.graphdrawing.org/xmlns}key' at 0x03F9BFC0>

我也尝试过.text和.tag,它只删除了“at 0x03 ......”。

希望这个问题是可以理解的,有人知道解决方案。

1 个答案:

答案 0 :(得分:1)

如果要将根节点和子节点输出为xml文本而不是默认表示,请使用xml.etree.ElementTree.tostring(root)

for child in root:
    xml.etree.ElementTree.tostring(child)

官方文件:https://docs.python.org/2/library/xml.etree.elementtree.html#xml.etree.ElementTree.tostring

如果你想要标记名称,请使用每个元素的tag属性:

print(root.tag)
for child in root:
    print(child.tag)
描述可用属性的

doc:https://docs.python.org/2/library/xml.etree.elementtree.html#xml.etree.ElementTree.Element