Python:检查“两个”.doc文件是否是同一个文件?

时间:2017-04-02 20:33:14

标签: python file

IMAP过滤和搜索指示我的脚本的工作方式如下:每晚我都会收到一封附有相关.doc文件的电子邮件。我的Python脚本总是选择最后一个(最近的)电子邮件,并对该.doc文件执行某些操作。

每天发送的所有.doc个文件的名称都完全相同。

问题是:发件人有时会忽略发送新文件。结果是我的脚本对错误的文件(从前一天开始)执行操作。如果我能以某种方式检查两个文件是否是同一文件的实际(副本),那么我可以避免进行操作。

如何在Python中最容易/有效地实现这一目标?

1 个答案:

答案 0 :(得分:1)

要以二进制方式比较文件,最好/最快的方法是使用filecmp模块:

>>> import filecmp
>>> filecmp.cmp("first.doc","second.doc",shallow=False)
如果两个文件共享确切的文件内容,则

返回Trueshallow设置为False,因此无论日期的差异(提取两个文件时都有),都会分析文件内容。