如何使Python 3从UTF-8 .txt文件正确加载外来字符

时间:2019-04-17 22:14:30

标签: python python-3.x unicode utf-8

我正在尝试对克罗地亚语词典进行一些处理,但是从文件中加载非英语字符时遇到了问题。特定字符为“ž”,“š”,“č”,“ć”和“đ”。在前几行中,它将“ž”解码为“ž”。这是代码:

dic=open("tester.txt", "r").readlines()
print(dic)

可以正确加载字典,但不会错误解码这些字符,但是在另一个示例中,我尝试使用仅在单独的行中包含那些字符的文本文件对其进行了尝试,

  

UnicodeDecodeError:“字符映射”编解码器无法解码位置12的字节0x8d:>字符映射到(未定义)

Python以IDLE编写时,将它们打印出来没有问题,但是似乎不能自动从txt文件中正确读取它们。 .txt在加载之前已保存为UTF-8,因为默认编码和其他所有选项均未正确显示任何字符。有什么办法可以轻松解决此问题?

0 个答案:

没有答案