气流在午夜不执行DAG

时间:2020-03-24 19:36:26

标签: airflow airflow-scheduler

我使用以下配置进行了DAG:

default_args = {
    'owner': 'airflow',
    'depends_on_past': False,
    'start_date': airflow.utils.dates.days_ago(0, 0, minute=1),
    'email': ['francisco.salazar.12@sansano.usm.cl'],
    'email_on_failure': False,
    'email_on_retry': False,
    'max_active_runs': 1, 
    'retries': 1,
    'retry_delay': timedelta(minutes=1),
    'provide_context': True 
}

dag = DAG(
    'terralink_environmetal_darksky',
    default_args=default_args,
    description='Extract Data from Darksky API',
    catchup=False,
    schedule_interval='31 * * * *',
)

问题是scheduler可以正常工作,并在午夜或一天的最后一次执行(按计划)在schedule_inverval中定义的每个小时(每小时的31分钟)执行DAG运行,但在第二天的00:31:00)DAG执行未触发。

我认为这是一个基于start_date的问题,但我还不知道如何定义此参数以避免该问题。

1 个答案:

答案 0 :(得分:0)

Airflow建议为DAG声明一个固定的开始start_date。 start_date主要用于指定您何时希望DAG首次开始运行。 schedule_interval将是start_date达到目的或(如果不需要回填或重置dag)之后最相关的一个。