IMAP过滤和搜索指示我的脚本的工作方式如下:每晚我都会收到一封附有相关.doc
文件的电子邮件。我的Python脚本总是选择最后一个(最近的)电子邮件,并对该.doc
文件执行某些操作。
每天发送的所有.doc
个文件的名称都完全相同。
问题是:发件人有时会忽略发送新文件。结果是我的脚本对错误的文件(从前一天开始)执行操作。如果我能以某种方式检查两个文件是否是同一文件的实际(副本),那么我可以避免进行操作。
如何在Python中最容易/有效地实现这一目标?
答案 0 :(得分:1)
要以二进制方式比较文件,最好/最快的方法是使用filecmp
模块:
>>> import filecmp
>>> filecmp.cmp("first.doc","second.doc",shallow=False)
如果两个文件共享确切的文件内容,则返回True
。 shallow
设置为False
,因此无论日期的差异(提取两个文件时都有),都会分析文件内容。