我在使用Zepplin笔记本的EMR上使用spark集群
我在webbroswer中打开了Zepplin笔记本并创建了一个输入
的笔记本<console>:26: error: not found: value % %pyspark
得到错误
Catalyst
如何在Zepplin中使用pyspark?我在这做错了什么?
答案 0 :(得分:0)
尝试检查zeppelin.python属性。也许你的默认系统python和Zeppelins&#39; Python的版本存在冲突。
尝试将此行添加到.bashrc
export PYSPARK_PYTHON=/home/$USER/path/to/your/default/system/python
答案 1 :(得分:0)
您可能错过了settig SPARK_HOME,但如果不是这样,您可以使用findspark库 https://github.com/minrk/findspark/blob/master/README.md
导入findspark findspark.find(spark文件夹的路径)
或者如果您打算使用pyspark 2.2,您可以直接使用 pip install pyspark
如果以上行抛出错误,请尝试使用sudo
答案 2 :(得分:0)
export PYSPARK_PYTHON=/home/user/anaconda3/bin/python
export PYSPARK_DRIVER_PYTHON=jupyter
export PYSPARK_DRIVER_PYTHON_OPTS='notebook'
答案 3 :(得分:0)
在IDE或系统变量中设置这些环境变量
SPARK_HOME = <path to spark home>
PYSPARK_SUBMIT_ARGS = "--master local[2] pyspark-shell"
PYTHONPATH = %SPARK_HOME%\python;%SPARK_HOME%\python\build;%PYTHONPATH%;
答案 4 :(得分:0)
该注释中可能未设置spark的解释器绑定。锁和键盘图标旁边的右侧有一个齿轮图标。
单击该图标,将显示口译员列表。确保火花绑定为蓝色。
如果未列出火花绑定,请使用其他一些答案来了解为什么齐柏林飞艇没有可用的火花绑定。