Python从非ascii文件读取

时间:2015-06-02 17:49:54

标签: io

我有一个包含以下字符的文本文件: 的ÿ

当我尝试阅读文件时,我试过了两个:

with open (file, "r") as myfile:

with codecs.open(file, encoding='utf-8') as myfile:

成功。但是,当我尝试使用以下方式将文件作为字符串读取时

file_string=myfile.read()

OR

file_string=myfile.readLine()

我一直收到这个错误:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 11889: invalid start byte

理想情况下,我希望它忽略该字符或用''或空格

替换它

1 个答案:

答案 0 :(得分:0)

我想出了一个解决方案。只需使用python2而不是python3。我仍然无法让它在python3中工作但是