Question

我正在使用Python请求获得ChunkedEncodingError(e)。我正在使用以下内容来删除JSON：

r = requests.get(url, headers=auth, stream=True)

迭代每一行，使用回车作为分隔符，这就是此API区分不同JSON事件的方式。

for d in r.iter_lines(delimiter="\n"):
    d += "\n"
    sock.send(d)

我正在对回车进行分界，然后将其添加回作为端点我正在推动日志以实际期望在每个事件结束时回车。这似乎适用于大约100k日志文件。当我尝试拨打更大的电话时，我会抛出以下内容：

for d in r.iter_lines(delimiter="\n"):
logs_1           |   File "/usr/local/lib/python2.7/dist-packages/requests/models.py", line 783, in iter_lines
logs_1           |     for chunk in self.iter_content(chunk_size=chunk_size, decode_unicode=decode_unicode):
logs_1           |   File "/usr/local/lib/python2.7/dist-packages/requests/models.py", line 742, in generate
logs_1           |     raise ChunkedEncodingError(e)
logs_1           | requests.exceptions.ChunkedEncodingError: ('Connection broken: IncompleteRead(0 bytes read)', IncompleteRead(0 bytes read))

更新：我发现API也在某个时刻发回NoneType。那么如何在响应中的某处解释这个空字节而不会破坏一切？每个单独的事件都以\n结束，我需要能够单独检查每个事件。我应该将内容分块而不是iter_lines吗？然后确保块中没有NoneType？这样我就不会iter_lines尝试NoneType并且它会爆炸吗？

Answer 1

ChunkedEncodingError由以下原因引起：httplib.IncompletedRead

import httplib

def patch_http_response_read(func):
    def inner(*args):
        try:
            return func(*args)
        except httplib.IncompleteRead, e:
            return e.partial
    return inner

httplib.HTTPResponse.read = patch_http_response_read(httplib.HTTPResponse.read)

我认为这可能是一个补丁。它允许您处理有缺陷的http服务器。

大多数服务器传输所有数据，但是由于实施错误，它们会错误地关闭会话，httplib会引发错误并掩盖你宝贵的字节。

Answer 2

正如我在这里发布的另一个人IncompleteRead所提到的那样，您可以使用“ With”子句来确保您之前的请求已关闭。

 with requests.request("POST", url_base, json=task, headers=headers) as report:
    print('report: ', report)

Python请求 - ChunkedEncodingError（e） - requests.iter_lines

2 个答案: