使用代码,如何更新气流变量?

时间:2019-01-04 19:40:19

标签: airflow

我需要以编程方式更新在Airflow中创建的变量,但是找不到如何使用代码来解决问题的答案。

我已使用以下代码检索了变量:

column_number = Variable.get('column_number')

在函数结束时,我想将column_number加1

我已经尝试过了: Variable.set_val("column_number", int(column_number) + 1)

它不起作用。

以下是完整的代码供参考:

import airflow
from datetime import datetime, timedelta
from random import randint
from airflow import DAG
from airflow.hooks.postgres_hook import PostgresHook
from airflow.models import Variable
from airflow.operators.python_operator import PythonOperator

args = {
    'owner': 'besteman',
    'start_date': datetime.utcnow(),
    'retries': 1,
    'retry_delay': timedelta(minutes=30)
}

dag = DAG(dag_id='test-postgres', default_args=args, schedule_interval='@hourly')

def add_columns_and_values():

    column_number = Variable.get('column_number')

    pg_hook = PostgresHook(postgres_conn_id='airflow-test')

    add_columns = f'ALTER TABLE students ADD COLUMN test{column_number} smallint;'

    pg_hook.run(add_columns) 

    for i in range(8):
        add_values = f"UPDATE students SET test{column_number} = '{randint(50, 100)}' WHERE id = {i+1};"
        pg_hook.run(add_values)

    Variable.set_val("column_number", int(column_number) + 1)


t1 = PythonOperator(task_id='add_columns_values',
    python_callable=add_columns_and_values,
    dag=dag)

1 个答案:

答案 0 :(得分:4)

使用Variable.set代替Variable.set_valset_val()val属性的设置方法,不适合在外部使用。这应该做您想要的:

Variable.set("column_number", int(column_number) + 1)

它将对数据库进行实际更新,并在需要时为您处理会话和序列化。

参考:https://github.com/apache/incubator-airflow/blob/1.10.1/airflow/models.py#L4558-L4569