我必须每月更新一个表Foo
,然后每天更新另一个表Bar
,然后每天将这两个表连接起来,然后将结果插入第三个表Bazz
。
是否可以配置Foo
在某天(例如5日)进行更新,而Bar
每天在同一DAG中进行更新?
答案 0 :(得分:2)
可以使用以下任一替代方法在单个DAG中实现此行为
基本上,您的DAG仍将每天运行(schedule_interval='@daily'
),但
Bar
任务会运行,而Foo
会被跳过(或短路); 您当然也可以将它们建模为单独的DAG和chain them together(而不是单个DAG中的单个任务)。这种选择might be better直到链接在一起的DAG数量很小为止。