我正在尝试使用气流变量来确定是否执行任务。我已经试过了,但它不起作用:
if '{{ params.year }}' == '{{ params.message }}':
run_this = DummyOperator (
task_id = 'dummy_dag'
)
我希望能得到一些帮助,让它发挥作用。还有没有更好的方法可以在气流中做这样的事情?
答案 0 :(得分:1)
我认为解决这个问题的一个好方法是使用 BranchPythonOperator
根据提供的 DAG 参数动态分支。考虑这个例子:
使用 params
向 DAG 提供参数(也可以从 UI 完成),在此示例中:{"enabled": True}
from airflow.decorators import dag, task
from airflow.utils.dates import days_ago
from airflow.operators.python import get_current_context, BranchPythonOperator
@dag(
default_args=default_args,
schedule_interval=None,
start_date=days_ago(1),
catchup=False,
tags=["example"],
params={"enabled": True},
)
def branch_from_dag_params():
def _print_enabled():
context = get_current_context()
enabled = context["params"].get("enabled", False)
print(f"Task id: {context['ti'].task_id}")
print(f"Enabled is: {enabled}")
@task
def task_a():
_print_enabled()
@task
def task_b():
_print_enabled()
定义 BranchPythonOperator
的可调用对象,您将在其中执行条件并返回要执行的下一个任务。您可以从 **kwargs
访问执行上下文变量。另请记住,此运算符应返回单个 task_id 或 task_ids 列表 以跟随下游。这些由此产生的任务应该总是直接在它的下游。
def _get_task_run(ti, **kwargs):
custom_param = kwargs["params"].get("enabled", False)
if custom_param:
return "task_a"
else:
return "task_b"
branch_task = BranchPythonOperator(
task_id="branch_task",
python_callable=_get_task_run,
)
task_a_exec = task_a()
task_b_exec = task_b()
branch_task >> [task_a_exec, task_b_exec]
结果是 task_a 被执行而 task_b 被跳过 :
AIRFLOW_CTX_DAG_OWNER=airflow
AIRFLOW_CTX_DAG_ID=branch_from_dag_params
AIRFLOW_CTX_TASK_ID=task_a
Task id: task_a
Enabled is: True
如果这对您有用,请告诉我。