为什么response.content可以被读取两次并且不能被解码为json

时间:2015-08-26 12:08:58

标签: python json python-requests decoding

我今天发现了一种奇怪的行为。 我通过python请求lib在谷歌云消息中发送了一条消息。 然后我试着像这样解码对json的响应:

response = requests.post(Message_Broker.host, data=json.dumps(payload), headers=headers)
response_results = json.loads(response.content)["results"]

这发生了解码错误:

response_results = json.loads(response.content)["results"]
  File "/usr/local/lib/python2.7/dist-packages/simplejson/__init__.py", line 505, in loads
    return _default_decoder.decode(s)
  File "/usr/local/lib/python2.7/dist-packages/simplejson/decoder.py", line 370, in decode
    obj, end = self.raw_decode(s)
  File "/usr/local/lib/python2.7/dist-packages/simplejson/decoder.py", line 400, in raw_decode
    return self.scan_once(s, idx=_w(s, idx).end())
JSONDecodeError: Expecting value: line 1 column 1 (char 0)

这发生在我的高效系统上,所以我添加了一些调试日志来了解响应的实际内容是这样的:

        logger.info("GCM-Response: " + str(response))
        logger.info("GCM-Response: " + response.content)
        logger.info("GCM-Response: " + str(response.headers))

现在发生了实际的怪异行为。它已正确记录,并且不再抛出解码错误。

有人可以解释一下这种行为吗?

我还检查了response.content究竟是什么:

@property
    def content(self):
        """Content of the response, in bytes."""

        if self._content is False:
            # Read the contents.
            try:
                if self._content_consumed:
                    raise RuntimeError(
                        'The content for this response was already consumed')

                if self.status_code == 0:
                    self._content = None
                else:
                    self._content = bytes().join(self.iter_content(CONTENT_CHUNK_SIZE)) or bytes()

            except AttributeError:
                self._content = None

        self._content_consumed = True
        # don't need to release the connection; that's been handled by urllib3
        # since we exhausted the data.
        return self._content

它是requests模型的一部分。不是实际的属性,但可以通过@property装饰器访问。 根据我的理解,第一次读取内容以进行日志记录时,_content_consumed标志设置为True。因此,第二次,当我为json解码读取它时,它实际上应该引发运行时错误。

是否有解释,我在浏览请求文档时没有找到?

1 个答案:

答案 0 :(得分:2)

  

因此,第二次,当我为json解码读取它时,它实际上应该引发运行时错误。

不,它不会引发RuntimeError。当您第一次访问response.content时,它会将实际数据缓存到self._content。在第二个(第三个,第四个等)访问if self._content is False:是假的,因此您将获得在self._content中缓存的内容。

if self._content_consumed:检查很可能是内部断言,以发现多次尝试从套接字读取数据(这显然是一个错误)。

它无法解码为JSON,因为您在响应正文中未收到JSON或收到空体。也许它是500响应或429.如果没有看到实际的反应,就不可能说。