我怎么能解码python中的unicode字符串?

时间:2013-07-25 10:24:54

标签: python unicode wikipedia-api

Wikipedia API将字符串编码为unicode格式

"Golden Globe Award for Best Motion Picture \u2013 Drama"

如何将其转换回

"Golden Globe Award for Best Motion Picture – Drama"

1 个答案:

答案 0 :(得分:3)

Wikipedia API返回JSON数据,使用json module解码:

json.loads(inputstring)

演示:

>>> import json
>>> print json.loads('"Golden Globe Award for Best Motion Picture \u2013 Drama"')
Golden Globe Award for Best Motion Picture – Drama

如果您的字符串以u''开头,那么您已经拥有 Python unicode值,并且正在查看该字符串的表示形式:

>>> json.loads('"Golden Globe Award for Best Motion Picture \u2013 Drama"')
u'Golden Globe Award for Best Motion Picture \u2013 Drama'

只需打印该值,让Python将其编码到您的终端编解码器,并以您的终端将理解的格式表示该em-dash字符。

如果您不了解unicode值和字节字符串之间的区别,您可能希望在继续之前阅读有关Python和Unicode以及编码的内容: