我正在编写一个链,根据其内容将一些JSON转换为URI,然后将数据POST到该URI。我想与Celery异步执行此操作,并且知道对链进行分组将使我能够轻松完成此操作。
我写了以下任务:
import time
from celery import group, chain
from celery.utils.log import get_task_logger
from app import celery
logger = get_task_logger(__name__)
@celery.task
def create_uri(obj_json, endpoint):
uri = "{0}:{1}/{2}".format(
obj_json["host"],
obj_json["port"],
endpoint
)
logger.debug("Created host {0} from {1}".format(uri, obj_json))
return uri
@celery.task
def send_post(uri, data):
logger.debug("Posting {0} to {1}...".format(data, uri))
return uri
def send_messages(objs, endpoint, data):
chains = [
# The next line is causing problems.
(create_uri.s(obj, endpoint) | send_post.s(data))
for obj in objs
]
g = group(*chains)
res = g.apply_async(queue="default")
while not res.ready():
time.sleep(1)
uris = res.get()
print("Posted to {0}".format(uris))
return uris
然而,我发现,当我尝试使用它时,链的create_uri
位结束,但send_post
从未在我的链中被调用。这很奇怪,因为我following the docs关于链,实际上,我几乎遵循here关于避免同步作业的示例。
我用
来管理我的员工celery worker -A celery_worker.celery -l debug -c 5 -Q default
其中celery_worker
只是推送应用上下文并导入app.celery
。
我的配置如下:
CELERY_BROKER_URL = 'redis://localhost:6379/0'
CELERY_RESULT_BACKEND = 'redis://localhost:6379/0'
CELERY_ACCEPT_CONTENT = ['application/json']
CELERY_TASK_SERIALIZER = 'json'
CELERY_RESULT_SERIALIZER = 'json'
我的日志中的一行是:
[2017-01-09 12:35:59,298:DEBUG / MainProcess] TaskPool:Apply(args:(' app.tasks.create_uri' ,' 197f4836-1cd8-4f7f-adaf-b8cebdb304ef',{' timelimit':[无,无],' group':无,' parent_id':无,'重试':0,' argsrepr':"({' port':8079,' host': ' localhost'},'开始')" ,' lang':' py',' eta':无,'到期':无,' delivery_info':{' routing_key':'默认','优先':0,'重新传递':无,'交换''},' kwargsrepr':' {}','任务':' app.tasks.create_uri',' root_id':' 197f4836-1cd8-4f7f-adaf- b8cebdb304ef',' correlation_id':' 197f4836-1cd8-4f7f-adaf-b8cebdb304ef',' origin':' foobar',& #39; reply_to':' 6559d43e-6cae-3b6f-89be-7b80e2a43098',' id':' 197f4836-1cd8-4f7f- adaf-b8cebdb304ef'},b' [[{" port":8079," host":" localhost"},"启动& #34;],{},{" chord":null," callbacks":null," errbacks":null," chain& #34;:[{" task":" app.tasks.send_post"," subtask_type":null," options":{& #34; group_id":" 60c2c9b2-eb51-457d-b248-b8e5552e0fd8"," task_id":... kwargs:{} )
当我打印chains[0].tasks
时,我看到了这一点:
(app.tasks.create_uri({'host': 'localhost', 'port': 8079}, 'start'),
app.tasks.send_post({'hello': 'world'}))
认识到send_post
是链中的下一个任务,但任务永远不会被接受。
为什么我的group
在完成链中的第一个任务后会挂起?
答案 0 :(得分:1)
您正在正确创建链和组。但是,工作人员将无法识别发送到无效队列的任务。当你对它们进行.get()
时,它们会永远挂起,因为它永远不会返回结果。
因此,您可以使用默认的celery
队列
res = g.apply_async().get()
# explicit
res = g.apply_async(queue="celery").get()
或者正确配置路由,然后使用自定义队列。
res = g.apply_async(queue='foo').get()