zeppelin无法导入大熊猫,numpy,scipy

时间:2016-08-30 08:01:38

标签: pyspark apache-zeppelin

用zeppelin编写的代码,当我在那里启动pyspark时它的工作和导入很好,但是在zeppelin中没有相同的代码。

 %pyspark
import pandas

Traceback (most recent call last):
  File "/tmp/zeppelin_pyspark-4245945050627073162.py", line 239, in <module>
    eval(compiledCode)
  File "<string>", line 1, in <module>
ImportError: No module named pandas

1 个答案:

答案 0 :(得分:1)

这是因为机器上没有安装pandas。

如果未安装pip,请先安装pip。

sudo curl --silent --show-error https://bootstrap.pypa.io/get-pip.py | python

然后安装pandas

sudo pip install pandas

或者像这样使用[docker]。

docker run -d -p 8080:8080 -t knockdata/zeppelin-highcharts
  

zeppelin-highcharts图片包含pandas和Highcharts功能。