PYCURL获取带有utf-8编码问题的json文件

时间:2016-09-30 09:07:30

标签: python utf-8 pycurl

我的PYCURL请求遇到问题。 我在服务器上的json文件是用utf-8编码的,如下所示:

{
  "address" : "123 rue de Labège"
}

我使用PYCURL获取此json并将其复制到计算机上的新文件中。 我使用Python 2.7,这是我对PYCURL的设置:

def setup(self, _url, _method, _login, _passwd, _path, *args, **kwargs):
    self.curl = pycurl.Curl()
    self.url = 'https://%s:%d/' % (self.ip, self.port) + _url
    self.method = _method
    self.userpwd = '%s:%s' % (_login, _passwd)
    self.path = _path

    self.curl.setopt(pycurl.URL, self.url)

    curl_method = {
        "GET": pycurl.HTTPGET,
        "POST": pycurl.POST
    }

    if self.method in curl_method:
        self.curl.setopt(curl_method[self.method], 1)
    else:
        self.curl.setopt(pycurl.CUSTOMREQUEST, self.method)

    self.curl.setopt(pycurl.SSL_VERIFYPEER, 0)
    self.curl.setopt(pycurl.SSL_VERIFYHOST, 0)
    self.curl.setopt(pycurl.HTTPAUTH, pycurl.HTTPAUTH_BASIC)
    self.curl.setopt(pycurl.USERPWD, self.userpwd)

    if _url == 'MY_FILE_JSON':
        filename = 'file.json'
        self.file = open(self.path + filename, 'wb')
        self.curl.setopt(pycurl.WRITEDATA, self.file)

问题在于我得到的文件:

{
  "address" : "123 rue de Lab\u00e8uge"
}

我不明白为什么PYCURL将我的“è”编码成\ u00e8。 有没有选择setopt与PYCURL强制它打印好的角色?

1 个答案:

答案 0 :(得分:2)

实际上这是完全正确的,一旦你执行了print变量属性,就可以看出它打印得很好。

这就是Python内部处理Unicode字符串的方式。一旦PycURL收到文件,它将被转换为适合该属性的任何类型。在您的情况下,这是一个Unicode字符串。

请查看this article以获取更多信息。

回顾一下,如果你这样做:

>>> test = u'123 rue de Lab\u00e8uge'
>>> print(test)
123 rue de Labèuge

在这里,您可以看到我创建了一个Unicode字符串(以u开头)。