Question

我有一个XML文件，我需要在Python

中提取feature标记内的所有文本

<person>
    <text id="1">
    <title>
      student
    </title>
    <feature>
       xxxx
      <name>yyyy</name>
      zzzz
      <country>dddd</country>
      ffff
    </feature>

我的代码是：

 for person in tree.iter():
    for text in person:
        for feature in text:
            if feature.tag=="feature":
                print(feature.text)

它只是向我展示了“xxxx”，但我的理想答案是 xxxx yyyy zzzz dddd ffff

Answer 1

当然最后会遗漏一条线（</person>）。你应该评论你正在使用的库，如果有的话

如果您使用图书馆来解析＆＃39;将xml转换为树结构，比如xml.etree.ElementTree，您可以通过库的查询功能轻松提取标签，属性甚至文本。您可以按照所需的顺序执行此操作，并以所需的格式创建结果。

xml.etree.ElementTree是Python标准库的一部分。看看Python ElementTree documentation。有很多例子。

如何从Python中获取XML标记的值

1 个答案: