强制Spark Master分发代码(不是提交者)

时间:2015-08-12 09:18:29

标签: apache-spark

我试图从笔记本上向远程主人提交火花作业。我有一个本地火花装置,所以我可以运行

./bin/spark-submit --class "a.b.C" --master spark://198.51.100.1:7077 app.jar (...)

由于防火墙政策,nat等,我可以从笔记本电脑(192.168.0.1)到达火花大师(198.51.100.1),但不是相反。

问题是我的本地spark安装尝试将代码分发给worker

SparkContext: Added JAR file:/path/to/app.jar at http://192.168.0.1:52605/jars/app.jar with timestamp 1439369933876

必须失败,因为工人没有通往笔记本的路线

WARN Remoting: Tried to associate with unreachable remote address [akka.tcp://sparkDriver@192.168.0.1:7077]. Address is now gated for 5000 ms, all messages to this address will be delivered to dead letters.

那么,我如何将我的应用程序提交给主人强制主人将我的代码分发给工人?

或者我是否认为这一切都错了,我的问题还有其他原因在哪里?

1 个答案:

答案 0 :(得分:1)

您可以将app.jar上传到群集中可见的位置(例如HDFS),并在启动应用时使用群集部署模式:

./bin/spark-submit --deploy-mode cluster .... hdfs://path/to.jar

有关详细信息,请参阅Submitting Applications