Flask:后台线程将非空队列视为空

时间:2014-06-07 14:39:44

标签: python multithreading flask uwsgi

当我在uwsgi中运行Flask应用程序时,后台线程和应用程序函数在查询同一队列的大小时会看到不同的值。

部件

  • 带有thread-safe queue
  • 的Flask应用程序
  • GET调用返回队列大小。
  • POST调用会向队列添加元素。
  • 后台线程打印队列大小

问题

当应用程序来自使用python tester.py的shell时,我得到了预期的结果:

2014-06-07 14:20:50.677995 Queue size is: 0
127.0.0.1 - - [07/Jun/2014 14:20:51] "POST /addMessage/X HTTP/1.1" 200 -
2014-06-07 14:20:51.679277 Queue size is: 1
2014-06-07 14:20:52.680425 Queue size is: 1
2014-06-07 14:20:53.681566 Queue size is: 1
2014-06-07 14:20:54.682708 Queue size is: 1
127.0.0.1 - - [07/Jun/2014 14:20:55] "POST /addMessage/Y HTTP/1.1" 200 -
2014-06-07 14:20:55.687755 Queue size is: 2
2014-06-07 14:20:56.688867 Queue size is: 2

但是,当使用uwsgi执行应用时,我会在日志中获得以下内容:

2014-06-07 14:17:42.056863 Queue size is: 0
2014-06-07 14:17:43.057952 Queue size is: 0
[pid: 9879|app: 0|req: 6/6] 127.0.0.1 () {24 vars in 280 bytes} [Sat Jun  7 14:17:43 2014] POST /addMessage/X => generated 16 bytes in 0 msecs (HTTP/1.1 200) 2 headers in 71 bytes (1 switches on core 0)
2014-06-07 14:17:44.059037 Queue size is: 0
2014-06-07 14:17:45.060118 Queue size is: 0
[pid: 9879|app: 0|req: 7/7] 127.0.0.1 () {24 vars in 280 bytes} [Sat Jun  7 14:17:45 2014] POST /addMessage/X => generated 16 bytes in 0 msecs (HTTP/1.1 200) 2 headers in 71 bytes (1 switches on core 0)
2014-06-07 14:17:46.061205 Queue size is: 0
2014-06-07 14:17:47.062286 Queue size is: 0

在uwsgi下运行时,后台线程看不到与应用程序相同的队列。这是为什么?如何让这两个线程看到同一个Queue对象?

更新

  • 即使它作为Python脚本执行,我也会看到不一致的行为:有时它无法记录消息(使用app.logger),我只能看到print。这意味着该线程正在运行,但它无法对app.logger执行任何操作。

uwsgi .ini配置

[uwsgi]
http-socket    = :9002
plugin         = python
wsgi-file      = /home/ubuntu/threadtest-uwsgi.py
enable-threads = true
workers        = 1
chdir          = /home/ubuntu/thread-tester/thread_tester

代码

from flask import Flask, jsonify
import Queue
from threading import Thread
import time
import datetime
import logging
import sys

logging.basicConfig(stream=sys.stderr,
                    format='%(asctime)s %(levelname)s - %(message)s')

app = Flask(__name__)
messages = Queue.Queue()

def print_queue_size():
    while True:
        app.logger.debug("%s Queue size is: %d" % (datetime.datetime.now(),
                                        messages.qsize()))
        time.sleep(1)

t = Thread(target=print_queue_size, args=())
t.setDaemon(True)
t.start()

@app.route("/queueSize", methods=["GET"])
def get_queue_size():
    return jsonify({"qsize": messages.qsize()}), 200

@app.route("/addMessage/<message>", methods=["POST"])
def add_message_to_queue(message):
    messages.put(message)
    return jsonify({"qsize": messages.qsize()}), 200

if __name__ == "__main__":
    app.run(port=6000)

2 个答案:

答案 0 :(得分:12)

来自Things to Know documenation page

  

uWSGI尽可能尝试(ab)使用fork()调用的Copy On Write语义。默认情况下,它会在加载应用程序之后进行分叉,以尽可能多地共享内存。如果出于某种原因不希望出现此行为,请使用lazy选项。这将指示uWSGI在每个worker的fork()之后加载应用程序。延迟模式改变了正常重新加载的工作方式:不是重新加载整个实例,而是在链中重新加载每个工作程序。如果您想要“懒惰的应用程序加载”,但希望保持标准的uWSGI重新加载行为,从1.3开始,您可以使用lazy-apps选项。

您的Flask应用程序在uWSGI启动时启动,然后一个工作进程 forked 。在分叉时,Queue对象为空,不再与原始进程共享。线程没有被带走。

尝试设置lazy-apps option以延迟加载Flask应用,直到工作人员启动。

答案 1 :(得分:1)

@Martijn Pieters答案中的文档链接指出lazy-apps可能比预先消耗更多的内存。如果您对此感到担心,您可能还需要考虑@postfork装饰器,以便更精细地控制分叉后运行的内容。您可以在@postfork - 修饰的函数中创建您的队列,它将在每个工作程序中创建。