我正在尝试为经常性工作设置气流集群,例如每小时每小时在第5分钟运行一次每小时工作。作业已运行,但开始时间始终比计划时间(执行时间)晚一小时。
dag = DAG(dag_id="dag_id",
description=d'some jobs',
schedule_interval="5 * * * *",
default_args=default_args,
start_date=datetime(2019, 7, 24), catchup=True)
任务实例属性:
执行日期:2019-08-08T16:05:00 + 00:00
开始日期:2019-08-08 17:05:19.007417 + 00:00
结束日期:2019-08-08 17:05:28.065114 + 00:00
答案 0 :(得分:1)
计划程序在每个期间的结束运行。想法是直到5:05才能处理5:05到6:05的数据。
我所看到的最好的地方是在其中一位气流提交者的幻灯片上。参见幻灯片11-13:https://drive.google.com/file/d/1DVN4HXtOC-HXvv00sEkoB90mxLDnCIKc/view