如何解决UnicodeDecodeError,无效的连续字节错误

时间:2015-12-04 22:41:05

标签: python linux position character

我在Python中运行了一些代码并使用f = open(file)和f.read()命令收到以下错误:

File "/usr/lib/python3.4/codecs.py", line 313, in decode
(result, consumed) = self._buffer_decode(data, self.errors, final)  
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 62475: invalid continuation byte

首先,如何在源文件中找到位置62475以查看字符是什么?我尝试在pluma和notepadqq中打开文件,并且都显示行号和列号,但似乎没有办法按位置编号搜索。

找到问题区域后,是否有快速指导字符类型以及如何解决问题?

2 个答案:

答案 0 :(得分:1)

在open encoding = latin-1中 - Padraic Cunningham

谢谢,代码完美无缺!没有错误信息,所以我认为编码实际上是latin-1而不是UTF-8,所以在62475位置的任何东西都可能没有实际意义。 - user2144412

答案 1 :(得分:0)

如果有帮助,您可以尝试使用<HTML> <HEAD> <TITLE>Unauthorized</TITLE> </HEAD> <BODY BGCOLOR="#FFFFFF" TEXT="#000000"> <H1>Unauthorized</H1> <H2>Error 401</H2> </BODY> </HTML>