Question

将'\ xbb'转换为unicode字符串的正确方法是什么？我尝试了以下内容，只得到UnicodeDecodeError：

unicode('\xbb', 'utf-8')

'\xbb'.decode('utf-8')

Answer 1

由于它来自Word，它可能是CP1252。

>>> print '\xbb'.decode('cp1252')
»

Answer 2

它看起来是拉丁文1编码的。你应该使用：

unicode（'\ xbb'，'Latin-1'）

Answer 3

不确定你要做什么。但是在Python3中，默认情况下所有字符串都是unicode。在Python2.X中，您必须使用u'my unicode string \xbb'（或double，tripple quoted）来获取unicode字符串。当您想要打印unicode字符串时，您必须使用输出设备支持的字符集对它们进行编码，例如。终点站。例如u'my unicode string \xbb'.endoce('iso-8859-1')。

Python unicode问题

3 个答案: