将Unicode实体转换为Unicode文本

时间:2015-10-04 07:13:18

标签: python unicode

Python可以将Unicode实体转换为Unicode吗? ex) \u0639\u0631\u0628\u0649 to عربى

我想要完成同样的事情in this website

这将帮助我解析JSON unicode实体以生成有效的URL

ex) 'S\\u00f8ren Kierkegaard' -> https://en.wikipedia.org/wiki/Søren_Kierkegaard

仅供参考,如果您使用维基百科API,您将会遇到许多对象,例如'\\u00f8' https://en.wikipedia.org/w/api.php?action=query&titles=Søren_Kierkegaard&prop=revisions&rvprop=content&format=json

2 个答案:

答案 0 :(得分:4)

Python支持名为unicode-escape的编码,它将在这里提供帮助:

>>> br'\u0639\u0631\u0628\u0649'.decode('unicode-escape')
'عربى'

答案 1 :(得分:0)

$ python
Python 2.7.6 (default, Jun 22 2015, 17:58:13) 
[GCC 4.8.2] on linux2
Type "help", "copyright", "credits" or "license" for more information.
>>> a = u'\u0639\u0631\u0628\u0649'
>>> print a
عربى
>>>