如何在同一AWS EMR集群中同时运行Spark作业?

时间:2018-05-09 05:13:45

标签: amazon-web-services apache-spark yarn amazon-emr livy

是否可以在同一个AWS EMR集群中同时提交和运行Spark作业?如果是,那么请你详细说明一下吗?

2 个答案:

答案 0 :(得分:4)

您应该使用标记--deploy-mode cluster,它允许您将多个执行部署到您的群集。这将使纱线为您处理资源和队列。

完整的例子:

spark-submit \
  --class org.apache.spark.examples.SparkPi \
  --master yarn \
  --deploy-mode cluster \  # can be client for client mode
  --executor-memory 20G \
  --num-executors 50 \
  /path/to/examples.jar \
  1000

更多详情here

答案 1 :(得分:2)

目前,EMR不支持并行运行多个步骤。据我所知,这些实验性功能已经实施但由于某些问题尚未发布。