这个问题仅适用于python:
我在俄语字符串中有一个城市名称,其格式为Unicode格式,
\u041C\u043E\u0441\u043A\u0432\u0430
表示
Москва
如何获取原始文本而不是unicode字符?
注意:请勿使用任何导入模块
答案 0 :(得分:5)
>>> a=u"\u041C\u043E\u0441\u043A\u0432\u0430"
>>> print a
Москва
你的字符串是一个unicode字符串,因为每个带有\ u的字符/代码点只能从unicode字符串中使用,你应该在字符串前加上u。否则是一个常规字符串,每个\ u都算作常规的ascii字符:
>>> len(a)
6
>>> b="\u041C\u043E\u0441\u043A\u0432\u0430"
>>> len(b)
36
答案 1 :(得分:2)
除了vz0回答:注意脚本的编码。
这个文件非常有效:
# coding: utf-8
s = u"\u041C\u043E\u0441\u043A\u0432\u0430"
print(s)
但是这个会导致UnicodeEncodeError:
# coding: ASCII
s = u"\u041C\u043E\u0441\u043A\u0432\u0430"
print(s)