如何通过气流在火花群集中运行Jupyter笔记本电脑

时间:2019-10-17 19:04:24

标签: pyspark jupyter-notebook airflow

我在AWS上具有以下架构:

  • EC2运行气流
  • EMR集群(livy,jupyterhub,spark,hive ...)

因此,我需要拖长Jupyter笔记本才能在EMR群集中运行,但我不能这样做。

我尝试过造纸厂,但是在气流实例中本地运行。 我尝试过使用livysparkoperator,并且papermill调用已进入运行emr群集的.py中,但不起作用。

0 个答案:

没有答案