如何在Mesos上使用Spark运行Spark shell?

时间:2014-12-03 23:04:16

标签: submit apache-spark jobs mesos

有没有办法从Spark shell运行一个示例(SparkPi)?或者通过shell将Spark作业提交到Mesos集群? spark-submit目前不支持部署到Mesos,但我希望实现类似的功能,也可以将驱动程序放置到执行程序中。

1 个答案:

答案 0 :(得分:0)

1)您可以将spark-shell和spark-submit连接到Mesos集群:

./bin/spark-shell -h

Usage: ./bin/spark-shell [options]
Options:
  --master MASTER_URL         spark://host:port, mesos://host:port,     yarn, or local.
  --deploy-mode DEPLOY_MODE   Whether to launch the driver program locally ("client") or
                          on one of the worker machines inside the cluster ("cluster")
                          (Default: client).
...

2)有没有办法从Spark shell运行一个示例(SparkPi)?

简而言之 - 是的。但它可能只适用于Spark 2.0。

在Spark 1.6中实现SparkPi示例尝试创建新的Spark上下文(虽然spark-shell已经创建了一个 - 它会导致问题)。

https://github.com/apache/spark/blob/branch-1.6/examples/src/main/scala/org/apache/spark/examples/SparkPi.scala

val conf = new SparkConf().setAppName("Spark Pi")
val spark = new SparkContext(conf)

Spark 2.0中的实现尝试重用现有的Spark Context: https://github.com/apache/spark/blob/branch-2.0/examples/src/main/scala/org/apache/spark/examples/SparkPi.scala

val spark = SparkSession
  .builder
  .appName("Spark Pi")
  .getOrCreate()

那么如何从shell启动SparkPi?你去了:

./bin/spark-shell --jars ./examples/jars/spark-examples_2.11-2.0.0.jar 
scala> org.apache.spark.examples.SparkPi.main(Array("100"))
Pi is roughly 3.1413147141314712