Python SAX - 提取xml代码

时间:2017-08-16 11:06:15

标签: python xml parsing xml-parsing sax

我使用Python SAX解析大型xml文件(2 GB以上),比较它们,然后创建一个新的xml文件。对于创建,我想从标签开始并在标签的结尾处将代码的一部分转换为新的xml文件。换句话说,从这个xml文件:

<collection>
<record>
  <leader> lorem ipsum </leader>
  <controlfield tag="1">aa</controlfield>
  <controlfield tag="2">bb</controlfield>
  <controlfield tag="3">cc</controlfield>
  <controlfield tag="4">dd</controlfield>
  <datafield tag="a">
    <subfield code="1">ee</subfield>
  </datafield>
  <datafield tag="b">
    <subfield code="1">ff</subfield>
  </datafield>
  <datafield tag="c">
    <subfield code="1">gg</subfield>
    <subfield code="2">hh</subfield>
    <subfield code="3">ii</subfield>
    <subfield code="4">jj</subfield>
  </datafield>
</record>
</collection>

我想将xml标记中的记录和/记录标记之间的所有内容都作为字符串。可以用SAX完成,还是有其他库可以做到这一点?

0 个答案:

没有答案