芹菜工作者运行的任务,而主管的datetime.date.today()值不正确

时间:2019-04-24 20:34:14

标签: django python-3.x celery supervisord celerybeat

我有一个任务是使用芹菜拍子定期运行。芹菜节拍和芹菜工作者(在单独的队列中)都使用主管运行。

任务是使用python的datetime.date.today()函数存储运行日期。 问题在于,重新启动工作程序时datetime.date.today()返回正确的日期,但是在接下来的几天中使用celery beat调用同一任务时,datetime.date.today()函数会在工作程序重新启动时返回相同的日期,而不是当前日期。

任务在utc时区运行,我交叉检查了执行日期。当我尝试使用celery beat传递运行日期作为args时,也会发生同样的情况(在这种情况下,它返回的是celery beat的开始/重新开始日期,而不是当前日期)。 我仍然不知道为什么会这样。服务器系统日期/时间似乎工作正常。

这是芹菜节拍和芹菜工人队列的主管配置(这不是完整的配置,只是相关的块)

[supervisord]
logfile=/dir/supervisord.log ; (main log file;default $CWD/supervisord.log)
logfile_maxbytes=50MB        ; (max main logfile bytes b4 rotation;default 50MB)
logfile_backups=10           ; (num of main logfile rotation backups;default 10)
loglevel=info                ; (log level;default info; others: debug,warn,trac
pidfile=supervisord.pid ; (supervisord pidfile;default supervisord.pid)
nodaemon=false               ; (start in foreground if true;default false)
minfds=1024                  ; (min. avail startup file descriptors;default 1024
minprocs=200                 ; (min. avail process descriptors;default 200)


[program:celery_worker_custom_queue]
environment =
    LC_ALL=en_US.UTF-8,
    LANG=en_US.UTF-8

command = /usr/local/bin/celery  --concurrency=5  -A config worker -l info -Q custom_queue -n workername@%%h
directory = /path/to/dir
priority = 2
user = user
numprocs = numprocs
stderr_logfile = log_file_path
stdout_logfile = log_file_path
autostart = true
autorestart = true


[program:celery_beat]
environment =
    LC_ALL=en_US.UTF-8,
    LANG=en_US.UTF-8

command = /usr/local/bin/celery -A config beat -l info
directory = /path/to/dir
priority = 3
user = user
numprocs = numprocs
stderr_logfile = log_file_path
stdout_logfile = log_file_path
autostart = true
autorestart = true

我检查时在网上找不到任何类似的问题。另外,我无力罢免主管。

在配置中我能做些什么?另外,我是第一次使用这种设置,是否在概念上缺少东西?请帮助

编辑: 我已经在本地计算机上对此进行了测试,它可以在没有管理员的情况下正常运行。任务代码如下(未使用运行日期的已删除代码)

 import datetime as dt

 run_date = (dt.date.today()).strftime('%Y-%m-%d')

 @celeryApp.task(bind=True, name="api_task",queue="custom_queue")
 def api_task(self, start_date=run_date):
   api_run_date = start_date
   #api calls and object calculations; api_run_date is not used anywhere..
   task_status(obj=status_obj, status=True, run_date=api_run_date)

 def task_status(obj, status=False, run_date=run_date):
    is_done = status
    # print(obj,' - ',run_date,' - ',is_done)
    done, created = ModelName.objects.update_or_create(date=run_date, defaults={'is_done': is_done}, obj_inst=obj)
    done.save()

1 个答案:

答案 0 :(得分:1)

我认为问题在于您处理日期的方式。您将datetime.date.today()值存储在run_date全局变量中,然后将其用作任务的start_date自变量的默认值。但是,在Python中定义函数时,默认参数值仅被评估一次。因此,除非在调用start_date时实际为api_task提供了一个值,否则您始终使用相同的值。该值是run_date全局变量的值,而该变量在首次导入模块时仅被评估一次。

正确的处理方式如下:

def api_task(self, start_date=None):
   # use `start_date` if given or current date
   api_run_date = start_date or dt.date.today().strftime('%Y-%m-%d')
   #api calls and object calculations; api_run_date is not used anywhere..
   task_status(obj=status_obj, status=True, run_date=api_run_date)