我最近从朋友的死硬盘中找到了很多照片,我决定想用python写一个程序来:
浏览所有文件
检查他们的MD5Sum
检查MD5Sum是否存在于文本文件中
如果确实如此,请告诉我“重复已经找到”
如果没有,请将MD5Sum添加到文本文件中。
最终目标是删除所有重复项。但是,当我运行此代码时,我得到以下内容:
Traceback (most recent call last):
File "C:\Users\godofgrunts\Documents\hasher.py", line 16, in <module>
for line in myfile:
io.UnsupportedOperation: not readable
我这样做完全错了还是我只是误解了什么?
import hashlib
import os
import re
rootDir = 'H:\\recovered'
hasher = hashlib.md5()
with open('md5sums.txt', 'w') as myfile:
for dirName, subdirList, fileList in os.walk(rootDir):
for fname in fileList:
with open((os.path.join(dirName, fname)), 'rb') as pic:
buf = pic.read()
hasher.update(buf)
md5 = str(hasher.hexdigest())
for line in myfile:
if re.search("\b{0}\b".format(md5),line):
print("DUPLICATE HAS BEEN FOUND")
else:
myfile.write(md5 +'\n')
答案 0 :(得分:4)
您已在写入模式('w'
)中以with
语句打开文件。要打开它的写入和阅读模式,请执行以下操作:
with open('md5sums.txt', 'w+') as myfile:
答案 1 :(得分:3)
正确的模式是“r +”,而不是“w +”。
http://docs.python.org/3.3/tutorial/inputoutput.html#reading-and-writing-files