Question

我有一个包含以下字符的文本文件：的ÿ

当我尝试阅读文件时，我试过了两个：

with open (file, "r") as myfile:

和

with codecs.open(file, encoding='utf-8') as myfile:

成功。但是，当我尝试使用以下方式将文件作为字符串读取时

file_string=myfile.read()

OR

file_string=myfile.readLine()

我一直收到这个错误：

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 11889: invalid start byte

理想情况下，我希望它忽略该字符或用''或空格

替换它

Answer 1

我想出了一个解决方案。只需使用python2而不是python3。我仍然无法让它在python3中工作但是