我有一个Flask / Gunicorn端点需要几秒钟才能返回并且很难被击中。 Gunicorn似乎排队了很多请求并最终处理它们,但是恰好在队列后面添加的请求最终需要花费很长时间。
该应用以gunicorn -w 4 -b :8080
运行。
有没有办法配置Flask / Gunicorn以便只将X请求保留在队列中?
答案 0 :(得分:1)
可能你现在已经弄明白了,但是自从遇到这个问题后,我不妨回答一下。
你提到的“请求队列”被称为“backlog”,基于docs你可以通过将--backlog
参数传递给你的命令来改变它,所以它看起来像: / p>
gunicorn -w 4 --backlog 1024 -b :8080
请注意,如果请求数量超过您放置的数量,您的客户将开始看到错误。