我是Airflow的新手。
我有一个DAG,其中包含一个应该在特定机器上运行的任务(在我的情况下是EMR集群)。如何告诉气流在哪里运行特定任务,以便每次运行它只会在该机器上执行此操作?
答案 0 :(得分:16)
使用队列名称在该计算机上运行您的worker。在气流cli中你可以做类似的事情:
airflow worker -q my_queue
然后定义该任务以使用该队列:
task = PythonOperator(
task_id='task',
python_callable=my_callable,
queue='my_queue',
dag=dag)