使用urllib2从服务器获取非ascii字符串

时间:2016-05-31 06:28:20

标签: python string unicode ascii urllib2

我使用urllib2从服务器获取字符串。 我希望字符串应该是这样的:

Bouteflika veut croire qu'il est un dirigeant hors du commun aimé de son peuple.

然而,当我打印它时,它喜欢这个:

Bouteflika veut croire qu'il est un dirigeant hors du commun aim\\u00E9 de son peuple.

这是获取字符串的代码:

import urllib2

response = urllib2.urlopen(url)

page_source = response.read()

print page_source.decode('utf-8')

我的问题是如何按预期获得字符串?

1 个答案:

答案 0 :(得分:0)

这取决于服务器如何发送响应。

如果响应是JSON,那么它周围会有双引号并转义字符。

解码您需要的

 import json
 result = json.loads(response_text)

,结果将直接成为unicode字符串。