在文件哈希不同的情况下查找相同的照片?

时间:2015-03-17 10:25:02

标签: image photo

我有两个100%相同照片的文件夹(以及我需要的其他文件)。大约100GB + 100GB。

每个像素都是相同的,但由于添加了exif数据,因此哈希不会成像。我不想删除exif。

是否有任何软件可以识别像素相同的照片并删除其中一个,这样只有文件夹之间的差异仍然存在?其中一个?

1 个答案:

答案 0 :(得分:2)

您可以使用ImageMagick为每个文件的数据计算哈希值 - 忽略EXIF数据,如下所示:

identify -format "%# %f\n" *jpg *.png

13604ac55b0af81970c9aa2a7df699f0c34b7bc7676b3cc78cf5f339246a146b tiles.jpg
ccc559642d15d9f6d16d99e5be2a7dae5d13e27cf0f6af974d7c73dd86974e1e 5.png
a136e20c10f161169f3603ad95c4ba31ded66d7e5e9f42233afe5821222b0dd0 7.png
cd46ad516c6fad8f14a80a0c9952a3121b4b123cec84423509ad32fa9ac6bacf a.png

然后将该数据放入文件中并通过sortuniq运行以查找重复项。这样做的好处是不会比较单个文件的所有可能组合,而只是为每个文件生成一次校验和。

ImageMagick已安装在大多数Linux上,并且可用于OS X(理想情况下可以通过homebrew,在我看来)以及Windows - 请参阅here