我使用Python SAX解析大型xml文件(2 GB以上),比较它们,然后创建一个新的xml文件。对于创建,我想从标签开始并在标签的结尾处将代码的一部分转换为新的xml文件。换句话说,从这个xml文件:
<collection>
<record>
<leader> lorem ipsum </leader>
<controlfield tag="1">aa</controlfield>
<controlfield tag="2">bb</controlfield>
<controlfield tag="3">cc</controlfield>
<controlfield tag="4">dd</controlfield>
<datafield tag="a">
<subfield code="1">ee</subfield>
</datafield>
<datafield tag="b">
<subfield code="1">ff</subfield>
</datafield>
<datafield tag="c">
<subfield code="1">gg</subfield>
<subfield code="2">hh</subfield>
<subfield code="3">ii</subfield>
<subfield code="4">jj</subfield>
</datafield>
</record>
</collection>
我想将xml标记中的记录和/记录标记之间的所有内容都作为字符串。可以用SAX完成,还是有其他库可以做到这一点?