具有相同spark.local.dir的多个spark执行器

时间:2016-10-13 13:06:03

标签: apache-spark mesos

我通过设置以下属性在Mesos Docker容器上运行Spark应用程序。

--conf 'spark.local.dir=/var/lib/spark'
--conf 'spark.mesos.executor.docker.image=my_spark_docker_image'
--conf 'spark.mesos.executor.docker.volumes=/var/data/x-spark:/var/lib/spark,/opt/local/mesos:/opt/local/mesos:ro'
--conf 'spark.executorEnv.MESOS_NATIVE_JAVA_LIBRARY=/opt/local/mesos/lib/libmesos.so'
  • 所有Spark执行程序都是docker容器(由mesos docker启动)。
  • 一个或多个Spark执行程序可以在同一主机上运行。
  • spark.local.dir属性为/var/lib/spark,由docker主机挂载。

即,主机上的所有Spark执行程序共享相同的本地目录(/ var / data / x-spark)。

似乎一切正常,我担心文件损坏。这样安全吗?

1 个答案:

答案 0 :(得分:1)

这很安全。每个作业都会创建自己的子目录。