Question

我正在使用readline()逐行读取python中的大文件。在接近672,280行后，我收到一个错误：

 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfd in position 228:
 invalid start byte.

但是，我使用grep搜索了一个字节0xfd并且没有返回任何文件。我还写了c++代码来浏览文件并查找一个字节0xfd但仍然没有得到任何结果。所以我不知道这里发生了什么。这是一个错误，因为文件太大了吗？

我只是不知道如何对不在文件中的字节发生解码错误。

由于

Answer 1

您可以尝试使用ISO编码打开文件。

open('myfile.txt', encoding = "ISO-8859-1")