在Python中处理Unicode的最佳方法

时间:2011-09-26 19:19:48

标签: python google-app-engine unicode

任何人都有在python应用程序中处理Unicode字符的链接或最佳实践?或者我们需要在整个地方转换字符串?

[编辑] 目前我们正在将我们在urlencode中发布的所有内容转换为utf-8但我想知道是否有更好的方法来处理它而不是调用encode('UTF-8')

2 个答案:

答案 0 :(得分:2)

您需要做的主要事情是了解 unicode。认识到Python中的str存储字节,而unicode对象存储字符;它们是截然不同的东西,不应该被视为可以互换。您的所有文本字符串应始终为unicode个对象;其他一切都是二进制数据。

有关详情,请查看我在getting Unicode right in Python上的文章。

答案 1 :(得分:1)

请参阅Python documentation on unicode

简而言之:内部仅适用于unicode个对象。如果你需要尽早与外界交谈,.decode()尽可能早地输入,.encode()尽可能晚输出。