我有一个源自电子邮件的字符串。我不确定字符串的原始编码,但是在电子邮件客户端中它显示如下:
'Somebody LastNáme'
我认为这是一个utf-8编码。当我从utf-8解码时,......
'Somebody LastNáme'.decode('utf-8')
...我在python shell中得到以下unicode字符串:
u'Somebody LastN\xe1me'
在浏览unicode上的文档后,我还尝试了latin-1编码,并看到编码为latin-1的急性重音。解码时,它以相同的方式显示,即字节无法表示为ascii而是显示为\xe1
。
我想知道 1)如果有可能让python在我查看终端中的非ascii字符串时显示重音字符(而不是转义),并且 2)当我随后使用它时,是否(或如何确保)字符串将在浏览器中正确呈现。