从目录中删除重复项并将其保存在另一个目录中

时间:2015-10-09 08:22:00

标签: python image duplicates

我正在尝试查找目录中存在的重复图像并将其从原始目录中删除并将它们保存在不同的目录中。现在我能够找到重复的图像,但我无法将其从原始文件夹并将重复的图像保存在新文件夹中。

import sys
import os
import hashlib
dir ='/Users/Documents/LiClipse Workspace/cnf/duplicate_image'
uniquelist =[]
count = 0
for dirpath, dirs, files in os.walk('image'):
  files = sorted(files)
  for filename in files:
    with open(os.path.join(dirpath, filename)) as f:
        im= f.read()
        hash=hashlib.md5(im).hexdigest()
        if hash not in uniquelist: 
            uniquelist.append(hash)
        else:
            print hash

请帮我解决如何从原始文件夹中删除它并将其保存到我的新目录中。谢谢你提前做好准备。如果这是一个愚蠢的问题,请道歉

1 个答案:

答案 0 :(得分:4)

您可以使用shutil或os模块。语法类似于

import os, shutil
os.rename("source", "destination")
#or
shutil.move("source", "destination")