我有一个XML文件,我需要在Python
中提取feature标记内的所有文本<person>
<text id="1">
<title>
student
</title>
<feature>
xxxx
<name>yyyy</name>
zzzz
<country>dddd</country>
ffff
</feature>
我的代码是:
for person in tree.iter():
for text in person:
for feature in text:
if feature.tag=="feature":
print(feature.text)
它只是向我展示了“xxxx”,但我的理想答案是 xxxx yyyy zzzz dddd ffff
答案 0 :(得分:1)
当然最后会遗漏一条线(</person>
)。你应该评论你正在使用的库,如果有的话
如果您使用图书馆来解析&#39;将xml转换为树结构,比如xml.etree.ElementTree
,您可以通过库的查询功能轻松提取标签,属性甚至文本。您可以按照所需的顺序执行此操作,并以所需的格式创建结果。
xml.etree.ElementTree
是Python标准库的一部分。看看Python ElementTree documentation。有很多例子。