这个问题可以真正适用于任何Python包。我有一个在我的Spark作业之前运行的引导脚本,我假设我需要在该脚本中安装pandas。我尝试过很多不同的东西,但似乎没什么用(pip install,easy_install,yum install等)。无法导入Spark pandas时,作业全部失败。我正在运行EMR v5.12.1和Python 3.4。
答案 0 :(得分:2)
sudo python3 -m pip install pandas
这是我们在bootstarp.sh
安装pandas
时所写的内容。