我使用以下配置进行了DAG:
default_args = {
'owner': 'airflow',
'depends_on_past': False,
'start_date': airflow.utils.dates.days_ago(0, 0, minute=1),
'email': ['francisco.salazar.12@sansano.usm.cl'],
'email_on_failure': False,
'email_on_retry': False,
'max_active_runs': 1,
'retries': 1,
'retry_delay': timedelta(minutes=1),
'provide_context': True
}
dag = DAG(
'terralink_environmetal_darksky',
default_args=default_args,
description='Extract Data from Darksky API',
catchup=False,
schedule_interval='31 * * * *',
)
问题是scheduler
可以正常工作,并在午夜或一天的最后一次执行(按计划)在schedule_inverval
中定义的每个小时(每小时的31分钟)执行DAG运行,但在第二天的00:31:00)DAG执行未触发。
我认为这是一个基于start_date
的问题,但我还不知道如何定义此参数以避免该问题。
答案 0 :(得分:0)
Airflow建议为DAG声明一个固定的开始start_date
。 start_date主要用于指定您何时希望DAG首次开始运行。 schedule_interval
将是start_date达到目的或(如果不需要回填或重置dag)之后最相关的一个。