不在文件

时间:2016-01-12 09:49:00

标签: python c++ unicode

我正在使用readline()逐行读取python中的大文件。在接近672,280行后,我收到一个错误:

 UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfd in position 228:
 invalid start byte.

但是,我使用grep搜索了一个字节0xfd并且没有返回任何文件。我还写了c++代码来浏览文件并查找一个字节0xfd但仍然没有得到任何结果。所以我不知道这里发生了什么。这是一个错误,因为文件太大了吗?

我只是不知道如何对不在文件中的字节发生解码错误。

由于

1 个答案:

答案 0 :(得分:0)

您可以尝试使用ISO编码打开文件。

open('myfile.txt', encoding = "ISO-8859-1")