以规范形式规范化Python中的两个XML文件

时间:2016-04-04 10:34:11

标签: python xml canonicalization canonical-form

我有两个XML文件,我需要检查它们是否包含相同的确切信息。

无论标签或属性顺序如何。

例如,这两个XML文件应该等于:

test1.xml

<blocklist lastupdate="1459262434336" xmlns="http://www.mozilla.org/2006/addons-blocklist">
  <emItems>
    <emItem blockID="i454" id="sqlmoz@facebook.com">
      <versionRange minVersion="0" maxVersion="*" severity="3">
        <targetApplication id="{ec8030f7-c20a-464f-9b0e-13a3a9e97384}">
          <versionRange maxVersion="3.6.*" minVersion="3.6"/>
        </targetApplication>
      </versionRange>
      <versionRange maxVersion="*" minVersion="0"/>
      <prefs>
        <pref>test.blocklist</pref>
      </prefs>
    </emItem>
  </emItems>
</blocklist>

test2.xml

<blocklist lastupdate="1459262434336" xmlns="http://www.mozilla.org/2006/addons-blocklist">
  <emItems>
    <emItem blockID="i454" id="sqlmoz@facebook.com">
      <prefs>
        <pref>test.blocklist</pref>
      </prefs>
      <versionRange minVersion="0" maxVersion="*" severity="3">
        <targetApplication id="{ec8030f7-c20a-464f-9b0e-13a3a9e97384}">
          <versionRange maxVersion="3.6.*" minVersion="3.6"/>
        </targetApplication>
      </versionRange>
      <versionRange minVersion="0" maxVersion="*"/>
    </emItem>
  </emItems>
</blocklist>

我试图找到一些解决方案,如:

我也将尝试this solution

但是你知道我的选择是什么吗?是不是XML规范化和规范化应该为我处理这个问题?

我在这里做错了什么?

如果我在JSON中这样做,我会使用:json.dumps(data, sort_keys=True, separators=(',', ':'))

1 个答案:

答案 0 :(得分:1)

对于那些对此主题感兴趣的人,我创建了一个xml-verifier脚本,通过将xml转换为JSON文件然后将这两个文件导出为Canonical JSON并对其进行差异来实现这一目的。

https://github.com/mozilla-services/amo2kinto/blob/1.7.2//amo2kinto/verifier.py#L80-L108