标签: pyspark jupyter-notebook airflow
我在AWS上具有以下架构:
因此,我需要拖长Jupyter笔记本才能在EMR群集中运行,但我不能这样做。
我尝试过造纸厂,但是在气流实例中本地运行。 我尝试过使用livysparkoperator,并且papermill调用已进入运行emr群集的.py中,但不起作用。