我正在尝试删除磁盘上的重复文件但是我被卡住了。
我创建了一个包含3个字段的新类:路径,大小和文件名:
class photo:
def __init__(self, path, size):
self.path = re.sub(r'.*\\', '', path)
self.size = size
self.hash = self.path+self.size
def getTitle(self):
return (self.path)
def getSize(self):
return (self.size)
def getHash(self):
return (self.hash)
然后,我将所有文件添加到列表中:
for path, subdirs, files in os.walk(root):
for name in [f for f in files if f.endswith(".jpg")]:
title = os.path.join(path, name)
size = str(os.path.getsize(os.path.join(path, name)))
photo_list.append(photo(title, size))
我现在需要的是提取重复的文件,例如当我有这样的东西时: C:\ example.jpg C:\子目录\ example.jpg
我需要将其提取到像duplicated_list这样的其他列表中,在下一步中我会选择删除哪一个。