我正在尝试在一天中的特定时间进行气流冲击。
我知道气流调度程序会在一段时间结束时运行。 但这已成为时间表的噩梦,我需要一些指导。
本质上,我想在1:30
,7:45
上运行dag,然后在下午某个地方说。让我们将其设置为14:00
,以便每次运行之间恰好有6h 15m。
到英国时间也很重要。它需要与英国的夏/冬时间切换
这是我想出的:
dag_timezone = pendulum.timezone("Europe/London")
dt_now = datetime.now(tz=dag_timezone)
schedule_interval = timedelta(hours=6, minutes=15)
start_date = datetime(dt_now.year, dt_now.month, dt_now.day, 1, 30, 0, 0, dag_timezone) - schedule_interval
自catchup=True
以来,我希望它立即开始运行(至少在1:30和7:45运行)
A,没有成功。
在界面中,起始日期为2020-07-30 6:30:00
几乎看起来schedule_interval
被添加到start_date而不是被减去
我希望2020-07-30 01:30:00 - 6h15m => 2020-07-29 19:15:00 =UTC> 2020-07-29 18:15:00
还:调度程序是否有调试模式才能查看“原因”?
答案 0 :(得分:0)
在安排DAG时,在Apache气流中,实际上是start_data + schedule_interval
。例如,假设我已经通过start_date=datetime(2020, 7, 30)
和我的schedule_interval=@daily
,那么实际上我的第一个任务将在7月31日(而不是7月30日)运行/开始