在python中的俄语字符解码

时间:2016-09-06 10:31:18

标签: python

这个问题仅适用于python:

我在俄语字符串中有一个城市名称,其格式为Unicode格式,

  

\u041C\u043E\u0441\u043A\u0432\u0430

表示

  

Москва

如何获取原始文本而不是unicode字符?

注意:请勿使用任何导入模块

2 个答案:

答案 0 :(得分:5)

>>> a=u"\u041C\u043E\u0441\u043A\u0432\u0430"
>>> print a
Москва

你的字符串是一个unicode字符串,因为每个带有\ u的字符/代码点只能从unicode字符串中使用,你应该在字符串前加上u。否则是一个常规字符串,每个\ u都算作常规的ascii字符:

>>> len(a)
6
>>> b="\u041C\u043E\u0441\u043A\u0432\u0430"
>>> len(b)
36

答案 1 :(得分:2)

除了v​​z0回答:注意脚本的编码。

这个文件非常有效:

# coding: utf-8
s = u"\u041C\u043E\u0441\u043A\u0432\u0430"
print(s)

但是这个会导致UnicodeEncodeError:

# coding: ASCII
s = u"\u041C\u043E\u0441\u043A\u0432\u0430"
print(s)