@celery.task
def my_task(my_object):
do_something_to_my_object(my_object)
#in the code somewhere
tasks = celery.group([my_task.s(obj) for obj in MyModel.objects.all()])
group_task = tasks.apply_async()
问题:芹菜有什么东西可以检测小组任务的进度吗?我可以计算出那里有多少任务以及已处理了多少任务?
答案 0 :(得分:4)
在shell上修补(ipython的选项卡自动完成)我发现group_task
(这是一个celery.result.ResultSet
对象)有一个名为completed_count
的方法,它给出了我所需要的。
答案 1 :(得分:1)
这是一个基于@dalore答案的完整工作示例。
第一个tasks.py
。
import time
from celery import Celery, group
app = Celery('tasks', broker='pyamqp://guest@127.0.0.1//', backend='redis://localhost')
@app.task
def add(x, y, trail=True):
time.sleep(1)
return x + y
@app.task
def group_add(l1, l2, trail=True):
return group(add.s(x1, x2) for x1, x2 in zip(l1, l2))()
使用Docker启动Redis服务器:docker run --name my-redis -p 6379:6379 -d redis
。
使用Docker启动docker run -d --hostname my-rabbit --name my-rabbit -p 5672:5672 rabbitmq:alpine
。
在单独的外壳程序celery -A tasks worker --loglevel=info -c 1
中启动一个过程celery worker。
然后运行下面的测试脚本。
from tasks import group_add
from tqdm import tqdm
total = 10
l1 = range(total)
l2 = range(total)
delayed_results = group_add.delay(l1, l2)
delayed_results.get() # Wait for parent task to be ready.
results = []
for result in tqdm(delayed_results.children[0], total=total):
results.append(result.get())
print(results)
您应该看到类似以下的内容,进度条每秒增加10%。
50%|##### | 5/10 [00:05<00:05, 1.01s/it
[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]
最后,清理您的redis和rabbitmq容器。
docker stop my-rabbit my-redis
docker rm my-rabbit my-redis
答案 2 :(得分:0)
阅读AsyncResult
的文档,有一个collect
方法可以收集结果。
from celery import group
from proj.celery import app
@app.task(trail=True)
def A(how_many):
return group(B.s(i) for i in range(how_many))()
@app.task(trail=True)
def B(i):
return pow2.delay(i)
@app.task(trail=True)
def pow2(i):
return i ** 2
示例输出:
>>> from celery.result import ResultBase
>>> from proj.tasks import A
>>> result = A.delay(10)
>>> [v for v in result.collect()
... if not isinstance(v, (ResultBase, tuple))]
[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
注意:
必须启用Task.trail
选项,以便将子项列表存储在result.children
中。这是默认设置,但已明确启用以进行说明。
编辑:
经过进一步测试后发现,虽然收集状态会收集结果,但仍会等待。我发现要获得孩子们得到结果所需的进展,如下:
group_result = mygrouptask.delay().get()
for result in tqdm(group_result.children, total=count):
yield result.get()
tqdm在控制台中显示进度
mygrouptask是一个像这样的芹菜组:
return group(mytask.s(arg) for arg in args)()