Question

我的unicode奇怪错误。我正在处理unicode很好，但是当我今天早上运行它时，一个项目''u'1''给出了错误并给了我

UnicodeError: ASCII encoding error: ordinal not in range(128)

我查了代码，显然是它的utf-32，但当我尝试在解释器中解码时：

c = u'\u201d'
c.decode('utf-32', 'replace')

或任何其他与此有关的操作，它只是在任何编解码器中都没有识别它，但我发现它是“正确的双引号”

我明白了：

Traceback (most recent call last):
File "<pyshell#154>", line 1, in <module>
    c.decode('utf-32')
  File "C:\Python27\lib\encodings\utf_32.py", line 11, in decode
    return codecs.utf_32_decode(input, errors, True)
UnicodeEncodeError: 'ascii' codec can't encode character u'\u201d' in position 0: ordinal not in range(128)

Answer 1

您已经拥有一个unicode字符串，无需再将其解码为unicode字符串。

在这种情况下会发生的事情是python帮助您首先编码它，以便您可以从utf-32解码它。它使用默认编码来执行此操作，恰好是ASCII。这是一个显式编码，向您展示在这种情况下引发的异常：

>>> u'\u201d'.encode('ASCII')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
UnicodeEncodeError: 'ascii' codec can't encode character u'\u201d' in position 0: ordinal not in range(128)

简而言之，当您拥有像u''这样的unicode文字时，无需对其进行解码。

阅读Python Unicode HOWTO中的unicode，编码和默认设置。另一篇关于这个主题的宝贵文章是Joel Spolsky的Minimun Unicode knowledge帖子。

Unicode错误序数不在范围内

1 个答案: