我有一个匈牙利语文件,我想通过代码对其进行修改,但是存在问题。这是我的简单代码:
f = open('nametext','r')
text=f.read()
print(text)
f.close()
名称文本文件包含以下字符串:
Bevallás iparűzési adófeltöltési kötelezettségről 2013
Gépjárműadó-kedvezmény mentesség bevallás 2013
Helyi iparűzési adóbevallás 2013
Idegenforgalmi adóbevallás 2013
Kommunális adóbevallás 2013
Talajterhelési díj bevallás 2013
我收到一条错误消息,内容如下:
Traceback (most recent call last):
File "python", line 2, in <module>
UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe1 in position 6: invalid continuation byte
位置6是文字中的第七个字符,是匈牙利字母:ű
如何编译?我已经在repl.it上编译了文件。我对Ruby几乎有同样的问题。文本编码有问题,但我仍然没有解决方案。
答案 0 :(得分:1)
在your previous question中,您声明该文件使用ISO-8859-2编码。因此,您需要在对open()
的调用中指定此编码:
f = open('nametext', 'r', encoding='iso-8859-2')