当任务结果很大时,我应该如何使用Celery?

时间:2010-11-22 04:09:37

标签: python architecture task celery task-queue

处理Celery中执行结果较大的任务的最佳方法是什么?我正在考虑像表转储之类的东西,我可能会返回数百兆字节的数据。

我认为将消息填入结果数据库的天真方法不会在这里为我服务,更不用说如果我将AMQP用于我的结果后端。但是,我有一些延迟是一个问题;取决于导出的特定实例,有时我必须阻止它直到它返回并直接从任务客户端发出导出数据(导入内容的HTTP请求进入,它不存在,但必须< / em>在对该请求的响应中提供......无论需要多长时间)

那么,为此编写任务的最佳方法是什么?

2 个答案:

答案 0 :(得分:4)

一种选择是在所有工作机器上运行静态HTTP服务器。然后,您的任务可以将大结果转储到静态根中的唯一文件,并返回对该文件的URL引用。接收者可以随意获取结果。

例如。有点模糊的东西:

@task
def dump_db(db):
  # Some code to dump the DB to /srv/http/static/db.sql
  return 'http://%s/%s.sql' % (socket.gethostname(), db)

你当然需要一些收获旧文件的方法,以及保证唯一性,可能还有其他问题,但你会得到一般的想法。

答案 1 :(得分:0)

我通过构建我的应用程序来处理这个问题,将多兆字节的结果写入文件,我将它们存储到内存中,以便在使用该数据的所有进程之间共享...这完全解决了如何获取结果到另一台机器,但如果结果那么大,听起来这些任务是服务器进程之间的内部任务协调。