来自input()读取和转换

时间:2011-12-26 14:47:59

标签: python

我有一个dict作为utf-8文件并从命令行读取该单词并在字典键中搜索它。但我的文件有土耳其和阿拉伯语的字符

word ='şüyûh'

mydictionary [字]

我的程序给了我'şüyûh'这个词作为KeyError这个'şüyûh'回来。我该怎么办呢。

2 个答案:

答案 0 :(得分:0)

将所有内容处理为unicode

Unicode in Python, Completely Demystified"

答案 1 :(得分:0)

如果你正在读取一个文件,你需要告诉python如何将文件中的字节(文件只能包含字节)解释为你理解的字符。

最基本的方法是使用codecs.open而不是内置的open函数打开文件。当您以这种方式从文件中提取数据时,它将被解码:

import codecs
with codecs.open("something.txt", encoding="utf-8") as myfile:
    # do something with the file.

请注意,您必须告诉python该文件的编码。