我有一个pickle文件,当读取时包含转义的unicode字符。
如果我打印字符串,它会将以下输出显示为catu\u1e63\u1e6daya
,并存储为str
类型。
如果我按字符打印相同的字符,我会得到以下内容。
c
a
t
u
\
u
1
e
6
3
\
u
1
e
6
d
a
y
a
我尝试了decode
,encode
和de-encode
方法。我也尝试了unicode
方法。有没有办法检索确切的信息。
答案 0 :(得分:1)
解码使用"unicode-escape"
:
s.decode("unicode-escape")
这给了你:
In [17]: print s.decode("raw_unicode_escape")
catuṣṭaya