我找到了一个对我来说非常重要的二进制文件。 如果我在文本编辑器中打开它,我会看到很多二进制数据,但有些字符串是纯文本的。
我通过
在python中读取我的文件with open(my_precious_file, mode='rb') as file: # b is important -> binary
fileContent = file.read()
fileContent包含许多二进制值/x00
,它们没有ascii对应的字符,而且我的字符串
如何清理它,即返回一个只包含可打印字符的字符串?
答案 0 :(得分:1)
您可以尝试 io module
EX:
import io
with io.open(filename,'rb',encoding='utf8') as f:
fileContent = file.read()