我使用以下默认参数创建了Apache Airflow DAG。我希望此DAG每天在世界标准时间10PM运行,但是它始终在世界标准时间12AM运行,并且忽略了我在start_date中设置的日期时间。这不是正确的方法吗?谢谢。
# devtools::install_github("moodymudskipper/cutr")
library(cutr)
df$quartile <- smart_cut(df$salePrice, 4, "g", output = "numeric")
# idNum binaryVariable salePrice quartile
# 1 2 1 55.56 3
# 2 4 0 88.33 4
# 3 15 0 4.45 1
# 4 87 1 35.77 2
答案 0 :(得分:0)
您还可以在schedule interval
参数中使用cron format,如下所示:
# DAG
dag = DAG('Test',
default_args=default_args,
description='Initial setup',
schedule_interval='0 22 * * *')
答案 1 :(得分:0)
关于schedule_interval
,您至少有三个选择:
datetime.timedelta
dateutil.relativedelta
cron样式字符串
schedule_interval
定义DAG运行的频率。此timedelta对象已添加到最新任务实例的execute_date中,以计算下一个计划。并且请记住:start_date
用于任务,确定第一个任务实例的execute_date。