气流任务运行延迟按计划

时间:2019-08-08 18:30:54

标签: airflow airflow-scheduler

我正在尝试为经常性工作设置气流集群,例如每小时每小时在第5分钟运行一次每小时工作。作业已运行,但开始时间始终比计划时间(执行时间)晚一小时。

dag = DAG(dag_id="dag_id",
          description=d'some jobs',
          schedule_interval="5 * * * *",
          default_args=default_args,
          start_date=datetime(2019, 7, 24), catchup=True)

任务实例属性:

执行日期:2019-08-08T16:05:00 + 00:00

开始日期:2019-08-08 17:05:19.007417 + 00:00

结束日期:2019-08-08 17:05:28.065114 + 00:00

1 个答案:

答案 0 :(得分:1)

计划程序在每个期间的结束运行。想法是直到5:05才能处理5:05到6:05的数据。

我所看到的最好的地方是在其中一位气流提交者的幻灯片上。参见幻灯片11-13:https://drive.google.com/file/d/1DVN4HXtOC-HXvv00sEkoB90mxLDnCIKc/view