为什么我的链的返回参数部分地应用于下一个任务?

时间:2017-01-07 21:32:49

标签: python python-3.x asynchronous celery

我正在编写一个链,根据其内容将一些JSON转换为URI,然后将数据POST到该URI。我想与Celery异步执行此操作,并且知道对链进行分组将使我能够轻松完成此操作。

我写了以下任务:

import time    

from celery import group, chain
from celery.utils.log import get_task_logger

from app import celery

logger = get_task_logger(__name__)

@celery.task
def create_uri(obj_json, endpoint):
    uri = "{0}:{1}/{2}".format(
        obj_json["host"],
        obj_json["port"],
        endpoint
    )
    logger.debug("Created host {0} from {1}".format(uri, obj_json))
    return uri

@celery.task
def send_post(uri, data):
    logger.debug("Posting {0} to {1}...".format(data, uri))
    return uri

def send_messages(objs, endpoint, data):
    chains = [
         # The next line is causing problems.
        (create_uri.s(obj, endpoint) | send_post.s(data))
        for obj in objs
    ]
    g = group(*chains)
    res = g.apply_async(queue="default")
    while not res.ready():
       time.sleep(1)
    uris = res.get()
    print("Posted to {0}".format(uris))
    return uris
然而,我发现,当我尝试使用它时,链的create_uri位结束,但send_post从未在我的链中被调用。这很奇怪,因为我following the docs关于链,实际上,我几乎遵循here关于避免同步作业的示例。

我用

来管理我的员工
celery worker -A celery_worker.celery -l debug -c 5 -Q default

其中celery_worker只是推送应用上下文并导入app.celery

我的配置如下:

CELERY_BROKER_URL = 'redis://localhost:6379/0'
CELERY_RESULT_BACKEND = 'redis://localhost:6379/0'
CELERY_ACCEPT_CONTENT = ['application/json']
CELERY_TASK_SERIALIZER = 'json'
CELERY_RESULT_SERIALIZER = 'json'

我的日志中的一行是:

  

[2017-01-09 12:35:59,298:DEBUG / MainProcess] TaskPool:Apply(args:(' app.tasks.create_uri' ,' 197f4836-1cd8-4f7f-adaf-b8cebdb304ef',{' timelimit':[无,无],' group':无,' parent_id':无,'重试':0,' argsrepr':"({' port':8079,' host': ' localhost'},'开始')" ,' lang':' py',' eta':无,'到期':无,' delivery_info':{' routing_key':'默认','优先':0,'重新传递':无,'交换''},' kwargsrepr':' {}','任务':' app.tasks.create_uri',' root_id':' 197f4836-1cd8-4f7f-adaf- b8cebdb304ef',' correlation_id':' 197f4836-1cd8-4f7f-adaf-b8cebdb304ef',' origin':' foobar',& #39; reply_to':' 6559d43e-6cae-3b6f-89be-7b80e2a43098',' id':' 197f4836-1cd8-4f7f- adaf-b8cebdb304ef'},b' [[{" port":8079," host":" localhost"},"启动& #34;],{},{" chord":null," callbacks":null," errbacks":null," chain& #34;:[{" task":" app.tasks.send_post"," subtask_type":null," options":{& #34; group_id":" 60c2c9b2-eb51-457d-b248-b8e5552e0fd8"," task_id":... kwargs:{}

当我打印chains[0].tasks时,我看到了这一点:

(app.tasks.create_uri({'host': 'localhost', 'port': 8079}, 'start'), 
 app.tasks.send_post({'hello': 'world'}))

认识到send_post是链中的下一个任务,但任务永远不会被接受。

为什么我的group在完成链中的第一个任务后会挂起?

1 个答案:

答案 0 :(得分:1)

您正在正确创建链和组。但是,工作人员将无法识别发送到无效队列的任务。当你对它们进行.get()时,它们会永远挂起,因为它永远不会返回结果。

因此,您可以使用默认的celery队列

res = g.apply_async().get()

# explicit
res = g.apply_async(queue="celery").get()

或者正确配置路由,然后使用自定义队列。

res = g.apply_async(queue='foo').get()