标签: xml xml-parsing string-formatting python-2.6
我有一个文件,其中有多条XML消息都写到了一行。因此,文件的每一行都是一个单独的XML字符串。
某些XML消息具有重复的XML标签。我希望能够遍历文件,捕获每个XML标签和标签中的数据并追加到列表中,如果XML标签和数据已存在于列表中,那么我想删除XML标签并文件中标签中的数据。
示例
之前的XML
<tag> data </tag><tag>data</tag><tag>data</tag>
之后的XML
<tag>data</data>