我想读取文本文件时出现Unicode解码错误

时间:2018-08-16 20:58:18

标签: python

我有一个匈牙利语文件,我想通过代码对其进行修改,但是存在问题。这是我的简单代码:

f = open('nametext','r')

text=f.read()

print(text)

f.close()

名称文本文件包含以下字符串:

Bevallás iparűzési adófeltöltési kötelezettségről 2013  
Gépjárműadó-kedvezmény mentesség bevallás 2013  
Helyi iparűzési adóbevallás 2013    
Idegenforgalmi adóbevallás 2013 
Kommunális adóbevallás 2013 
Talajterhelési díj bevallás 2013

我收到一条错误消息,内容如下:

Traceback (most recent call last):

  File "python", line 2, in <module>

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 6: invalid continuation byte

位置6是文字中的第七个字符,是匈牙利字母:ű

如何编译?我已经在repl.it上编译了文件。我对Ruby几乎有同样的问题。文本编码有问题,但我仍然没有解决方案。

1 个答案:

答案 0 :(得分:1)

your previous question中,您声明该文件使用ISO-8859-2编码。因此,您需要在对open()的调用中指定此编码:

f = open('nametext', 'r', encoding='iso-8859-2')