为什么我的所有Airflow dags都落后了?

时间:2018-02-19 15:53:59

标签: etl airflow airflow-scheduler

我现在正在设置Airflow,并且喜欢它,除了我的dag永远在后面跑。见下图 - 这是在2月19日15:50 UTC拍摄的,你可以看到,对于每个骰子,它们应该在它们最后一次运行和当前时间之间再运行一次(有一对夫妇,这是不正确的 - 那些目前已被关闭)。我错过了一些配置吗?

my dags!

1 个答案:

答案 0 :(得分:4)

误报!气流只标记执行时间与我的预期不同。结果是在15:00运行的每小时工作是标签" 14:00"并包括最高14:00 + 1:00的数据。

来自https://airflow.apache.org/scheduler.html

  

请注意,如果您在一天的schedule_interval上运行DAG,则会在2016-01-01T23:59之后不久触发标记为2016-01-01的运行。换句话说,作业实例一旦它所涵盖的时间段结束就会启动。

     

让我们重复一遍调度程序在开始日期之后,在期间结束时运行您的作业一个schedule_interval。