任何人都有在python应用程序中处理Unicode字符的链接或最佳实践?或者我们需要在整个地方转换字符串?
[编辑] 目前我们正在将我们在urlencode中发布的所有内容转换为utf-8但我想知道是否有更好的方法来处理它而不是调用encode('UTF-8')
答案 0 :(得分:2)
您需要做的主要事情是了解 unicode。认识到Python中的str
存储字节,而unicode
对象存储字符;它们是截然不同的东西,不应该被视为可以互换。您的所有文本字符串应始终为unicode
个对象;其他一切都是二进制数据。
有关详情,请查看我在getting Unicode right in Python上的文章。
答案 1 :(得分:1)
请参阅Python documentation on unicode。
简而言之:内部仅适用于unicode
个对象。如果你需要尽早与外界交谈,.decode()
尽可能早地输入,.encode()
尽可能晚输出。