Question

我有一个dict作为utf-8文件并从命令行读取该单词并在字典键中搜索它。但我的文件有土耳其和阿拉伯语的字符

word ='şüyûh'

mydictionary [字]

我的程序给了我'şüyûh'这个词作为KeyError这个'ÅŸÃ¼yÃ»h'回来。我该怎么办呢。

Answer 1

将所有内容处理为unicode。

Answer 2

如果你正在读取一个文件，你需要告诉python如何将文件中的字节（文件只能包含字节）解释为你理解的字符。

最基本的方法是使用codecs.open而不是内置的open函数打开文件。当您以这种方式从文件中提取数据时，它将被解码：

import codecs
with codecs.open("something.txt", encoding="utf-8") as myfile:
    # do something with the file.

请注意，您必须告诉python该文件的编码。