通过我最近的研究,我发现schedule_interval
气流有一些怪癖,我已尽力尝试解释它可能如何影响我的工作,但还没有还是设法解决了。
我正在使用以下默认参数:
default_args = {
'owner': 'airflow',
'depends_on_past': False,
'start_date': datetime(2019, 1, 12),
'email': ['email@domain.com'],
'email_on_failure': True,
'email_on_retry': False,
'retries': 0,
'retry_delay': timedelta(minutes=5),
'schedule_interval': '0 0,12 * * *'
}
我希望DAG在午夜和中午运行。
当前它仅在午夜运行,我不明白为什么。如果有任何不同,我将在Google Cloud Composer中运行它。
* edit-固定错字
答案 0 :(得分:1)
我将使用“每十二小时” cron表达式,而不是“在我们的0和12上”。您可能已经读过,Airflow的工作原理是创建间隔并在每个间隔结束时安排任务。通过将cron表达式描述的时间段添加到Dag的开始日期来创建间隔。
尝试'schedule_interval': '0 */12 * * *'
,因为您的开始日期是午夜,所以它将与您的表达式相同。