如何在脚本中比较python中的两个xml文件?

时间:2013-08-08 05:01:51

标签: python xml file python-2.7 filecompare

我是新的python。我有一些预定义的xml文件。我有一个生成新的xml文件的脚本。我想编写一个自动脚本来比较xmls文件并在输出文件中存储不同xml文件名的名称? 提前致谢

4 个答案:

答案 0 :(得分:2)

我认为你正在寻找filecmp module。您可以像这样使用它:

import filecmp
cmp = filecmp.cmp('f1.xml', 'f2.xml')

# Files are equal
if cmp:
    continue
else:
    out_file.write('f1.xml') 

f1.xmlf2.xml替换为您的xml文件。

答案 1 :(得分:1)

你说的是按字节顺序比较它们还是语义相等? (<tag attr1="1" attr2="2" />是否等于<tag attr2="2" attr1="1" />?) 如果要检查语义相等性,请查看Xml comparison in Python

生成xml时,特别是如果使用普通dicts属性,某些属性顺序可能会混合,即使有时使用相同的脚本具有相同的输入。

  

items()

     

...

     

CPython实现细节:键和值以任意顺序列出,非随机,在Python实现中各不相同,并且取决于字典的插入和删除历史。

答案 2 :(得分:0)

以@ Xaranke的回答为基础:

import filecmp

out_file = open("diff_xml_names.txt")
# Not sure what format your filenames will come in, but here's one possibility.
filePairs = [('f1a.xml', 'f1b.xml'), ('f2a.xml', 'f2b.xml'), ('f3a.xml', 'f3b.xml')]

for f1, f2 in filePairs:
    if not filecmp.cmp(f1, f2):
        # Files are not equal
        out_file.write(f1+'\n')

out_file.close()

答案 3 :(得分:0)

以下代码段如何:

def separator(self):
    return "!@#$%^&*" # Very ugly separator

def _traverseXML(self, xmlElem, tags, xpaths):
    tags.append(xmlElem.tag)
    for e in xmlElem:
        self._traverseXML(e, tags, xpaths)

    text = ''
    if (xmlElem.text):
        text = xmlElem.text.strip()

    xpaths.add("/".join(tags) + self.separator() + text)
    tags.pop()

def _xmlToSet(self, xml):
    xpaths = set() # output
    tags = list()
    root = ET.fromstring(xml)
    self._traverseXML(root, tags, xpaths)

    return xpaths

def _areXMLsAlike(self, xml1, xml2):
    xpaths1 = self._xmlToSet(xml1)
    xpaths2 = self._xmlToSet(xml2)

    return xpaths1 == xpaths2