我有两个100%相同照片的文件夹(以及我需要的其他文件)。大约100GB + 100GB。
每个像素都是相同的,但由于添加了exif数据,因此哈希不会成像。我不想删除exif。
是否有任何软件可以识别像素相同的照片并删除其中一个,这样只有文件夹之间的差异仍然存在?其中一个?
答案 0 :(得分:2)
您可以使用ImageMagick为每个文件的数据计算哈希值 - 忽略EXIF数据,如下所示:
identify -format "%# %f\n" *jpg *.png
13604ac55b0af81970c9aa2a7df699f0c34b7bc7676b3cc78cf5f339246a146b tiles.jpg
ccc559642d15d9f6d16d99e5be2a7dae5d13e27cf0f6af974d7c73dd86974e1e 5.png
a136e20c10f161169f3603ad95c4ba31ded66d7e5e9f42233afe5821222b0dd0 7.png
cd46ad516c6fad8f14a80a0c9952a3121b4b123cec84423509ad32fa9ac6bacf a.png
然后将该数据放入文件中并通过sort
和uniq
运行以查找重复项。这样做的好处是不会比较单个文件的所有可能组合,而只是为每个文件生成一次校验和。
ImageMagick
已安装在大多数Linux上,并且可用于OS X(理想情况下可以通过homebrew
,在我看来)以及Windows - 请参阅here。