我根本不熟悉python和树,但遇到了一些问题。
我将以下数据集结构化为:
<?xml version="1.0" encoding="UTF-8"?>
<graphml xmlns="http://graphml.graphdrawing.org/xmlns">
<node id="someNode">
<data key="label">someNode</data>
</node>
</graphml>
我想要获取根元素和节点元素的属性和属性值。
我尝试过像这样使用Python xml.etree.ElementTree:
import xml.etree.ElementTree as etree
tree = etree.parse('myDataset')
root = tree.getroot()
print('Root: ', root)
print('Children: ', root.getchildren())
但这就是我得到的:
Root: <Element '{http://graphml.graphdrawing.org/xmlns}graphml' at 0x031DB5A0>
Children: [<Element '{http://graphml.graphdrawing.org/xmlns}key' at 0x03F9BFC0>
我也尝试过.text和.tag,它只删除了“at 0x03 ......”。
希望这个问题是可以理解的,有人知道解决方案。
答案 0 :(得分:1)
如果要将根节点和子节点输出为xml文本而不是默认表示,请使用xml.etree.ElementTree.tostring(root)
和
for child in root:
xml.etree.ElementTree.tostring(child)
官方文件:https://docs.python.org/2/library/xml.etree.elementtree.html#xml.etree.ElementTree.tostring
如果你想要标记名称,请使用每个元素的tag
属性:
print(root.tag)
for child in root:
print(child.tag)
描述可用属性的doc:https://docs.python.org/2/library/xml.etree.elementtree.html#xml.etree.ElementTree.Element