使用Spark 1.61在AWS上进行Ipython

时间:2016-05-30 21:11:53

标签: amazon-web-services ipython pyspark emr

我正在尝试使用Spark 1.6.1在我的AWS EMR Spark群集上运行Ipython。这个guide是一个很好的,但似乎只适用于火花1.3.1。有没有人有任何想法?

1 个答案:

答案 0 :(得分:0)

经过一番挖掘,我自己找到了答案。我经历了几个步骤:

  1. 使用spark
  2. 启动AWS EMR群集
  3. pip install jupyter
  4. 生成jupyter笔记本配置文件:jupyter notebook --generate-config
  5. 修改该配置文件以包含: c.Notebook.ip = '*' c.Notebook.open_browser=False
  6. 使用iptyhon选项启动笔记本:IPYTHON_OPTS="notebook" pyspark
  7. 按照这些instructions
  8. 设置到主节点的SSH隧道
  9. 转到localhost:
  10. 就是这样!