芹菜 - 完成任务的召唤功能

时间:2012-03-06 00:20:24

标签: python django rabbitmq celery

我使用芹菜与django和rabbitmq创建一个消息队列。我也有一个工人,它来自不同的机器。在django视图中,我开始这样的过程:

def processtask(request, name):
  args = ["ls", "-l"]
  MyTask.delay(args)
  return HttpResponse("Task set to execute.")

我的任务配置如下:

class MyTask(Task):
  def run(self, args):
    p = subprocess.Popen(args, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
    (out, err) = p.communicate()
    return out

我现在的问题是,经纪人(我的django项目)现在如何收到来自" ls -l"命令工人在他的计算机上执行。我想最好的事情是,只要工作人员准备好从执行的命令发送输出,就可以在代理中调用函数。

我想异步接收worker的输出,然后用输出更新网页,但这又是另一次。现在我只想收到工人的输出。

更新

现在我已经添加了一个HTTP GET请求,该请求在任务结束时触发,通知Web应用程序任务已完成 - 我还在http GET中发送task_id。 http GET方法调用django视图,它创建AsyncResult并获取结果,但问题是当调用 result.get()时出现以下错误:

/usr/lib64/python2.6/site-packages/django_celery-2.5.1-py2.6.egg/djcelery/managers.py:178: TxIsolationWarning: Polling results with transaction isolation level repeatable-read within the same transaction may give outdated results. Be sure to commit the transaction for each poll iteration.
  "Polling results with transaction isolation level"

任何想法为什么?我没有使用数据库,因为我正在使用带有AMQP的rabbitmq。

更新

我非常希望使用第三个选项,这似乎是最佳选择 - 适用于小型和大型返回值。我的整个任务看起来像这样:

class MyTask(Task):
  def __call__(self, *args, **kwargs):
    return self.run(*args, **kwargs)

  def after_return(self, status, retval, task_id, args, kwargs, einfo):
    if self.webhost is not None:
      conn = httplib.HTTPConnection(self.webhost, self.webport)
      conn.request("HEAD", "/vuln/task/output/"+task_id)

  def run(self, args, webhost=None, webport=None):
    self.webhost = webhost
    self.webport = webport
    r = "This is a basic result string used for code clarity"
    return r

所以我已经覆盖了after_return函数,该函数也应该释放对我的任务的锁定,因为任务的run()函数已经返回了一个值。在HEAD请求中,我基本上调用了一个django函数,它在task_id上调用AsyncResult,它应该提供任务的结果。在我的情况下,我已将任意结果用于测试目的,因为它仅用于测试。

我想知道为什么上面的代码不起作用。我可以使用on_success,但我认为它不会有所作为 - 或者会不会?

1 个答案:

答案 0 :(得分:15)

如果你看here,你会发现以下内容:

Django-celery使用MySQL来跟踪所有任务/结果,rabbit-mq基本上用作通信总线。

真正发生的是您在任务仍在运行时尝试获取工作程序的ASyncResult(该任务调用了对您的服务器的HTTP请求,因为它还没有返回,db来自worker的锁定会话仍处于活动状态,结果行仍处于锁定状态。当Django尝试读取任务结果(其状态和运行函数的实际返回值)时,它会发现行被锁定并向您发出警告。

有几种方法可以解决这个问题:

  1. 设置另一个芹菜任务以获得结果并将其链接到您的处理任务。这样原始任务就会完成,释放对db的锁定,新的将获取它,在django中读取结果并做任何你需要它做的事情。查看芹菜文档。

  2. 根本不打扰,只需对Django进行POST,并将完整的处理结果作为有效负载附加,而不是尝试通过db获取它。

  3. 覆盖任务类中的on_success并将您的通知请求POST到Django,然后在db表上释放锁。

  4. 请注意,在返回run方法(可能是pickle)时,您需要存储整个处理结果(无论它有多大)。你没有提到结果有多大,所以实际上只做上面的场景#2(这就是我要做的)可能是有意义的。或者我会选择#3。另外,不要忘记在任务中处理on_failure方法。