我正在尝试在DigitalOcean中设置一个Spark集群,并在那里创建了一个主节点和两个从节点。即使有未使用的执行程序和大量RAM可用,我也无法从pyspark方法setMaster()连接到主服务器。
我得到的错误是: 最初的工作没有接受任何资源;检查您的集群用户界面,以确保工作人员已注册并拥有足够的资源。
我在master中的spark-env.sh文件如下:
export SPARK_MASTER_HOST='<MASTER IP ADDRESS>'
export JAVA_HOME='/usr/lib/jvm/java-8-oracle'
export SPARK_LOCAL_IP='<MASTER IP ADDRESS>'
slave中的spark-env.sh文件如下所示:
export SPARK_MASTER_HOST='<MASTER IP ADDRESS>'
export JAVA_HOME='/usr/lib/jvm/java-8-oracle'
export SPARK_LOCAL_IP='<SLAVE IP ADDRESS>'
我尝试对SPARK_MASTER_HOST以及SPARK_LOCAL_IP使用专用IP,但错误拒绝消失。我究竟做错了什么?
答案 0 :(得分:0)
可能您已修复它。但是下面是我遵循并为我工作的步骤。
我希望这会对您有所帮助。如果您已经找到了自己的解决方案,请忽略。
编码愉快。 干杯!