解码文本文件中的字符串

时间:2018-08-08 08:11:57

标签: python string unicode encoding

我有一个文本文件正在另一个应用程序的脚本中读取。 在记事本中的外观如下:

Одинцовская РЭС: М.О., Одинцовский район
Климовская РЭС: М.О., г.о. Подольск
Кульшовская РЭС: М.О., г.о. Подольск

此文件需要两件事: 1.创建值的字典,以“:”分隔。我在脚本的另一部分中使用了这个字典 2.允许用户选择所需的值

enter image description here

这是用户启动脚本时看到的内容。 选择某个值后,我必须在字典中使用它。但是问题在于选择是unicode格式的(由于ArcGIS中脚本构建的功能),而字典的键是str。 所以我需要字典中的值看起来像 '\xce\xe4\xe8\xed\xf6\xee\xe2\xf1\xea\xe0\xff \xd0\xdd\xd1'转换为unicode。但是当我做出.encode('utf-8')时会抛出错误

UnicodeDecodeError: 'ascii' codec can't decode byte 0xce in position 0: ordinal not in range(128)

1 个答案:

答案 0 :(得分:1)

这应该有效

{{1}}

b''前缀表示8位字节的序列。

看看SO read russian characters