使用urlencode为梵文文本

时间:2011-12-29 18:50:09

标签: python urllib

以下代码:

import simplejson,urllib,urllib2  

query=[u'नेपाल']
urlbase="http://search.twitter.com/search.json"
values={'q':query[0]}
data=urllib.urlencode(values)
req=urllib2.Request(urlbase,data)
response=urllib2.urlopen(req)
json=simplejson.load(response)
print json

抛出异常:

SyntaxError: Non-ASCII character '\xe0' in file ques.py on line 3, but no encoding declared; see http://www.python.org/peps/pep-0263.html for details

如果query包含标准ASCII字符,则代码有效。我尝试查看建议的链接,但无法弄清楚如何为梵文字符指定编码。

1 个答案:

答案 0 :(得分:2)

您需要将UTF-8标头添加到您的文件中,以告诉Python解释器有unicode文字。您还必须将参数编码为UTF-8。这是一个工作版本:

# -*- coding: utf-8 -*-
import simplejson,urllib,urllib2  

query=[u'नेपाल']
urlbase="http://search.twitter.com/search.json"
values={'q':query[0].encode('utf-8')}
data=urllib.urlencode(values)
req=urllib2.Request(urlbase,data)
response=urllib2.urlopen(req)
json=simplejson.load(response)
print json