gevent.http.HTTPServer API建议流式传输,而是缓冲整个请求和响应

时间:2013-02-07 13:50:03

标签: python http asynchronous buffer gevent

gevent.http.HTTPServer提供的API似乎支持两个方向的流式传输。请求对象不提供请求体作为简单字符串,而是提供Python可迭代的.input_buffer属性,而在另一个方向上,响应的数据可以作为具有三个调用的块传递:

request.send_reply_start(200, 'OK')
request.send_reply_chunk(...)  # as many times as you wish
request.send_reply_end()

但我必须有一些错误配置的东西,因为尽管这个奇妙的无缓冲的API,我的请求处理程序不会被调用,直到最后请求POST数据块最终到达,并在另一个方向在服务器到达.send_reply_end()之前,我没有看到任何标头到达我的客户端套接字。是否有一些我必须抛出的开关或一些配置设置,我必须操作以关闭缓冲并查看请求并在响应时发送响应,例如gevent通过其StreamServer支持原始套接字?

我的应用程序需要支持可能比RAM大的单文件上传和下载,这需要关闭此缓冲。

这是一个用gevent编写的简单服务器和客户端,它应该显示这种行为:

# srv.py

import gevent.http

M100 = 100 * 1024 * 1024

def main():
    print 'Serving on 8088...'
    gevent.http.HTTPServer(('0.0.0.0', 8088), handle).serve_forever()

def handle(request):
    print 'Is request chunked?', request.chunked
    for item in request.input_buffer:
        print 'received body segment of length', len(item), 'bytes'
    request.add_output_header('Content-Type', 'application/octet-stream')
    request.send_reply_start(200, 'OK')
    for i in range(5):
        print 'sending chunk', i
        request.send_reply_chunk(M100 * 'x')
    request.send_reply_end()

if __name__ == '__main__':
    main()

# cli.py

import requests
import time

M100 = 100 * 1024 * 1024

def gen():
    for i in range(5):
        print 'sending chunk', i
        yield M100 * 'x'
        time.sleep(1)

if __name__ == '__main__':
    r = requests.post('http://localhost:8088/', data=gen(), stream=True)
    for block in r.iter_content(M100):
        print 'received', len(block), 'bytes from download'

感谢任何指导!

1 个答案:

答案 0 :(得分:0)

对服务器的请求:查看源代码,看起来服务器的处理函数在请求完成之前不会被调用,无论它是否以分块方式发送。所以你在那里运气不好。

服务器响应:服务器响应可以以流方式发送,但您需要在处理程序线程中自愿产生控制才能使其工作(例如,在每个响应后调用gevent.sleep()块)。

不幸的是,gevent似乎没有提供一种方法来等待给定的块在开始下一个块之前完成发送,因此如果生成数据的速度比发送的速度快,则可能会遇到内存问题

请注意,上述信息是指使用gevent<1.0库的libevent,不适用于gevent的更新版本。当前版本的gevent不再包含http模块,因此问题没有实际意义。