我正在运行一个python程序来从XML文件中获取子树。以下是我运行以从标记获取子树的代码。
示例文件:
<?xml version="1.0" encoding="utf-8"?>
<nc:data xmlns:nc="urn:ietf:params:xml:ns:netconf:base:1.0">
<system xmlns="abc.org">
<context>
<name>context_1</name>
<host>
<name>Name_Node</name>
<tag1>
<name>ABC</name>
<tag2>PQR</tag2>
</tag1>
</host>
</context>
</system>
</nc:data>
和iterparse的功能
class xml_file_generation:
def xml_parse_new(self):
for event, elem in ET.iterparse('sample.xml', events=events, tag="context"):
print "In loop"
print ET.tostring(elem)
print("%s" % (elem.tag))
elem.close()
test = xml_file_generation()
test.xml_parse_new()
但是这段代码没有显示任何内容。
如果我运行与下面相同的代码,输出就像预期的那样:
xml = '''\
<root>
<element key='value'>text</element>
<element>text</element>tail
<empty-element xmlns="testns" />
<testtag>abc</testtag>
</root>
'''
events = ("start", "end")
context = ET.iterparse(StringIO(xml), events=events, tag='testtag')
for action, elem in context:
print action, elem.tag
print elem.text
如果可能,请建议解决方案。
答案 0 :(得分:0)
在您的xml中,您的元素 - <context>
- 具有名称空间 - 'abc.org'
,它从其父元素获取。在这种情况下,在tag
参数中指定标记名时,还需要指定名称空间。
并非真的,确定elem.close()
的意思,但删除它,Element
没有方法close()
。
尝试以下示例 -
class xml_file_generation:
def xml_parse_new(self):
for event, elem in ET.iterparse('a.xml', events=events, tag="{abc.org}context"):
print("In loop")
print(ET.tostring(elem))
print("%s" % (elem.tag))
test = xml_file_generation()
test.xml_parse_new()