我有一个dict作为utf-8文件并从命令行读取该单词并在字典键中搜索它。但我的文件有土耳其和阿拉伯语的字符
word ='şüyûh'
mydictionary [字]
我的程序给了我'şüyûh'这个词作为KeyError这个'şüyûh'回来。我该怎么办呢。
答案 0 :(得分:0)
将所有内容处理为unicode
。
答案 1 :(得分:0)
如果你正在读取一个文件,你需要告诉python如何将文件中的字节(文件只能包含字节)解释为你理解的字符。
最基本的方法是使用codecs.open
而不是内置的open
函数打开文件。当您以这种方式从文件中提取数据时,它将被解码:
import codecs
with codecs.open("something.txt", encoding="utf-8") as myfile:
# do something with the file.
请注意,您必须告诉python该文件的编码。