Unicode编码/解码

时间:2013-03-26 12:45:39

标签: python unicode encoding utf-8

我有一个看起来像这样的字符串。

st = '/M\xe4rzen'

我想将其转换为unicode。我怎样才能做到这一点?我试过了:

st.decode('utf-8')
unicode(t, 'utf-8')

原始文件是utf-8编码的,但我似乎无法获得字符串的unicode表示。

1 个答案:

答案 0 :(得分:11)

您的数据不是UTF8编码的;更有可能是使用Latin-1编码:

>>> print st.decode('latin1')
/Märzen

调用.decode()就足够了,调用unicode()