从二进制文件中提取纯文本

时间:2018-02-02 10:53:37

标签: python file binary

我找到了一个对我来说非常重要的二进制文件。 如果我在文本编辑器中打开它,我会看到很多二进制数据,但有些字符串是纯文本的。

我通过

在python中读取我的文件
with open(my_precious_file, mode='rb') as file: # b is important -> binary
    fileContent = file.read()

fileContent包含许多二进制值/x00,它们没有ascii对应的字符,而且我的字符串

如何清理它,即返回一个只包含可打印字符的字符串?

1 个答案:

答案 0 :(得分:1)

您可以尝试 io module

EX:

import io
with io.open(filename,'rb',encoding='utf8') as f:
    fileContent = file.read()