用zeppelin编写的代码,当我在那里启动pyspark时它的工作和导入很好,但是在zeppelin中没有相同的代码。
%pyspark
import pandas
Traceback (most recent call last):
File "/tmp/zeppelin_pyspark-4245945050627073162.py", line 239, in <module>
eval(compiledCode)
File "<string>", line 1, in <module>
ImportError: No module named pandas
答案 0 :(得分:1)
这是因为机器上没有安装pandas。
如果未安装pip,请先安装pip。
sudo curl --silent --show-error https://bootstrap.pypa.io/get-pip.py | python
然后安装pandas
sudo pip install pandas
或者像这样使用[docker]。
docker run -d -p 8080:8080 -t knockdata/zeppelin-highcharts
zeppelin-highcharts图片包含pandas和Highcharts功能。