通过遍历列表和传递参数在Airflow中创建任务

时间:2019-02-13 23:13:02

标签: airflow airflow-scheduler

编辑: 这将起作用,我定义了导致问题的ex_func_airflow(var_1 = i)

我想通过在列表上循环来在气流中创建任务。

tabs = [1,2,3,4,5]
for i in tabs:
    task = PythonOperator(
    task_id = name,
    provide_context=False,
    op_args  = [i],
    python_callable=ex_func_airflow,
    dag=dag)
    task_0 >> task >> task_1

在气流中运行时,传递的参数始终是该列表中的最后一个元素。

所以我实际上正在运行:

ex_func_airflow(6) 

五次而不是运行

ex_func_airflow(1)
ex_func_airflow(2)
ex_func_airflow(3)

.. etc。

如何为每个任务传递正确的参数?

1 个答案:

答案 0 :(得分:0)

以下代码对我有用。

def print_context(ds, **kwargs):
    print("hello")


def ex_func_airflow(i):
    print(i)


dag = DAG(
    dag_id="loop_dag",
    schedule_interval=None,
    start_date=datetime(2018, 12, 31),
)

task_0 = PythonOperator(
    task_id='task_0',
    provide_context=True,
    python_callable=print_context,
    dag=dag)

task_1 = PythonOperator(
    task_id='task_1',
    provide_context=True,
    python_callable=print_context,
    dag=dag)

tabs = [1, 2, 3, 4, 5]
for i in tabs:
    task_id = f'task_tab_{i}'
    task = PythonOperator(
        task_id=task_id,
        provide_context=False,
        op_args=[i],
        python_callable=ex_func_airflow,
        dag=dag)
    task_0 >> task >> task_1