我是新的python。我有一些预定义的xml文件。我有一个生成新的xml文件的脚本。我想编写一个自动脚本来比较xmls文件并在输出文件中存储不同xml文件名的名称? 提前致谢
答案 0 :(得分:2)
我认为你正在寻找filecmp
module。您可以像这样使用它:
import filecmp
cmp = filecmp.cmp('f1.xml', 'f2.xml')
# Files are equal
if cmp:
continue
else:
out_file.write('f1.xml')
将f1.xml
和f2.xml
替换为您的xml文件。
答案 1 :(得分:1)
你说的是按字节顺序比较它们还是语义相等?
(<tag attr1="1" attr2="2" />
是否等于<tag attr2="2" attr1="1" />
?)
如果要检查语义相等性,请查看Xml comparison in Python
生成xml时,特别是如果使用普通dicts属性,某些属性顺序可能会混合,即使有时使用相同的脚本具有相同的输入。
items()
...
CPython实现细节:键和值以任意顺序列出,非随机,在Python实现中各不相同,并且取决于字典的插入和删除历史。
答案 2 :(得分:0)
以@ Xaranke的回答为基础:
import filecmp
out_file = open("diff_xml_names.txt")
# Not sure what format your filenames will come in, but here's one possibility.
filePairs = [('f1a.xml', 'f1b.xml'), ('f2a.xml', 'f2b.xml'), ('f3a.xml', 'f3b.xml')]
for f1, f2 in filePairs:
if not filecmp.cmp(f1, f2):
# Files are not equal
out_file.write(f1+'\n')
out_file.close()
答案 3 :(得分:0)
以下代码段如何:
def separator(self):
return "!@#$%^&*" # Very ugly separator
def _traverseXML(self, xmlElem, tags, xpaths):
tags.append(xmlElem.tag)
for e in xmlElem:
self._traverseXML(e, tags, xpaths)
text = ''
if (xmlElem.text):
text = xmlElem.text.strip()
xpaths.add("/".join(tags) + self.separator() + text)
tags.pop()
def _xmlToSet(self, xml):
xpaths = set() # output
tags = list()
root = ET.fromstring(xml)
self._traverseXML(root, tags, xpaths)
return xpaths
def _areXMLsAlike(self, xml1, xml2):
xpaths1 = self._xmlToSet(xml1)
xpaths2 = self._xmlToSet(xml2)
return xpaths1 == xpaths2