使用python删除重复的文件

时间:2017-11-10 21:25:38

标签: python

我正在尝试删除磁盘上的重复文件但是我被卡住了。

我创建了一个包含3个字段的新类:路径,大小和文件名:

class photo:
   def __init__(self, path, size):
      self.path = re.sub(r'.*\\', '', path)
      self.size = size
      self.hash = self.path+self.size
   def getTitle(self):
       return (self.path)
   def getSize(self):
       return (self.size)
   def getHash(self):
       return (self.hash)

然后,我将所有文件添加到列表中:

for path, subdirs, files in os.walk(root):
for name in [f for f in files if f.endswith(".jpg")]:
   title = os.path.join(path, name)
   size = str(os.path.getsize(os.path.join(path, name)))
   photo_list.append(photo(title, size))

我现在需要的是提取重复的文件,例如当我有这样的东西时: C:\ example.jpg C:\子目录\ example.jpg

我需要将其提取到像duplicated_list这样的其他列表中,在下一步中我会选择删除哪一个。

0 个答案:

没有答案