我正在学习Apache Airflow以便在工作场所实施它, 当尝试将参数传递给这样的函数时,我偶然发现了一个问题(我遵循了文档)
from airflow import DAG
import pendulum
from datetime import datetime, timedelta
from airflow.operators.python_operator import PythonOperator
args = {
"owner": "airflow",
"start_date": pendulum.datetime(year=2020, month=10, day=5, tzinfo='Asia/Shanghai'),
"retries": 5,
"retry_delay": timedelta(minutes=3)
}
dag = DAG(
"example_dag_v2",
schedule_interval="@daily",
default_args=args
)
def my_mult_function(number):
return number*number
mult_task = PythonOperator(
task_id = 'mult_task',
provide_context=True,
python_callable=my_mult_function,
op_kwargs={'number': 5},
dag = dag
)
mult_task
我不断收到此错误
TypeError:my_mult_function()得到了意外的关键字参数'conf'
我在哪里做错了?
解决方案:
所以我找到了解决方案,但仍然不明白为什么 解决方案是
def my_mult_function(number, **kwargs):
return number*number
我在参数上传递了** kwargs,并且有效!但我仍然不明白为什么我需要通过** kwargs?
答案 0 :(得分:6)
您已设置provide_context=True
,因此PythonOperator
会将execute context发送到您的python_callable
。因此,通用捕获所有关键字参数,**kwargs
解决了该问题。
https://github.com/apache/airflow/blob/v1-10-stable/airflow/operators/python_operator.py#L108。
如果您不打算使用上下文中的任何内容,请设置provide_context=False
。