如何在Slurm群集上运行Spark?我很感兴趣在我的程序中定义SparkContext并设置我想要使用的节点数,但如果我必须为它编写一些bash脚本,那也没关系。
答案 0 :(得分:7)
Magpie(https://github.com/llnl/magpie)是一个shell脚本包,用于在传统HPC集群(例如由SLURM管理的集群)之上运行大数据应用程序(例如Spark)。它为您管理排队作业的大部分复杂性,但您可能仍需要修改提交脚本以适合您自己的Spark应用程序 - 有关详细信息,请参阅文件submission-scripts/script-sbatch/magpie.sbatch-spark
。
答案 1 :(得分:1)
您有两种选择。