我有一个任务是使用芹菜拍子定期运行。芹菜节拍和芹菜工作者(在单独的队列中)都使用主管运行。
任务是使用python的datetime.date.today()
函数存储运行日期。
问题在于,重新启动工作程序时datetime.date.today()
返回正确的日期,但是在接下来的几天中使用celery beat调用同一任务时,datetime.date.today()
函数会在工作程序重新启动时返回相同的日期,而不是当前日期。
任务在utc时区运行,我交叉检查了执行日期。当我尝试使用celery beat传递运行日期作为args
时,也会发生同样的情况(在这种情况下,它返回的是celery beat的开始/重新开始日期,而不是当前日期)。
我仍然不知道为什么会这样。服务器系统日期/时间似乎工作正常。
这是芹菜节拍和芹菜工人队列的主管配置(这不是完整的配置,只是相关的块)
[supervisord]
logfile=/dir/supervisord.log ; (main log file;default $CWD/supervisord.log)
logfile_maxbytes=50MB ; (max main logfile bytes b4 rotation;default 50MB)
logfile_backups=10 ; (num of main logfile rotation backups;default 10)
loglevel=info ; (log level;default info; others: debug,warn,trac
pidfile=supervisord.pid ; (supervisord pidfile;default supervisord.pid)
nodaemon=false ; (start in foreground if true;default false)
minfds=1024 ; (min. avail startup file descriptors;default 1024
minprocs=200 ; (min. avail process descriptors;default 200)
[program:celery_worker_custom_queue]
environment =
LC_ALL=en_US.UTF-8,
LANG=en_US.UTF-8
command = /usr/local/bin/celery --concurrency=5 -A config worker -l info -Q custom_queue -n workername@%%h
directory = /path/to/dir
priority = 2
user = user
numprocs = numprocs
stderr_logfile = log_file_path
stdout_logfile = log_file_path
autostart = true
autorestart = true
[program:celery_beat]
environment =
LC_ALL=en_US.UTF-8,
LANG=en_US.UTF-8
command = /usr/local/bin/celery -A config beat -l info
directory = /path/to/dir
priority = 3
user = user
numprocs = numprocs
stderr_logfile = log_file_path
stdout_logfile = log_file_path
autostart = true
autorestart = true
我检查时在网上找不到任何类似的问题。另外,我无力罢免主管。
在配置中我能做些什么?另外,我是第一次使用这种设置,是否在概念上缺少东西?请帮助
编辑: 我已经在本地计算机上对此进行了测试,它可以在没有管理员的情况下正常运行。任务代码如下(未使用运行日期的已删除代码)
import datetime as dt
run_date = (dt.date.today()).strftime('%Y-%m-%d')
@celeryApp.task(bind=True, name="api_task",queue="custom_queue")
def api_task(self, start_date=run_date):
api_run_date = start_date
#api calls and object calculations; api_run_date is not used anywhere..
task_status(obj=status_obj, status=True, run_date=api_run_date)
def task_status(obj, status=False, run_date=run_date):
is_done = status
# print(obj,' - ',run_date,' - ',is_done)
done, created = ModelName.objects.update_or_create(date=run_date, defaults={'is_done': is_done}, obj_inst=obj)
done.save()
答案 0 :(得分:1)
我认为问题在于您处理日期的方式。您将datetime.date.today()
值存储在run_date
全局变量中,然后将其用作任务的start_date
自变量的默认值。但是,在Python中定义函数时,默认参数值仅被评估一次。因此,除非在调用start_date
时实际为api_task
提供了一个值,否则您始终使用相同的值。该值是run_date
全局变量的值,而该变量在首次导入模块时仅被评估一次。
正确的处理方式如下:
def api_task(self, start_date=None):
# use `start_date` if given or current date
api_run_date = start_date or dt.date.today().strftime('%Y-%m-%d')
#api calls and object calculations; api_run_date is not used anywhere..
task_status(obj=status_obj, status=True, run_date=api_run_date)