我正在使用readline()
逐行读取python中的大文件。在接近672,280行后,我收到一个错误:
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xfd in position 228:
invalid start byte.
但是,我使用grep
搜索了一个字节0xfd
并且没有返回任何文件。我还写了c++
代码来浏览文件并查找一个字节0xfd
但仍然没有得到任何结果。所以我不知道这里发生了什么。这是一个错误,因为文件太大了吗?
我只是不知道如何对不在文件中的字节发生解码错误。
由于
答案 0 :(得分:0)
您可以尝试使用ISO编码打开文件。
open('myfile.txt', encoding = "ISO-8859-1")