标签: hadoop apache-spark yarn cloudera
我有一个集群设置,其中包含一个主服务器和两个服务器(通过cloudera管理器管理)。每当我提交一个带有master作为yarn的spark代码并在部署模式下作为集群提交时,它确实可以正确执行,但是当在Spark历史服务器中查看详细信息时,它会显示它只在一个执行程序/ worker中执行。
但这不是同一个执行者,每次新的/不同的运行,主人似乎都会选择两个工人中的一个。 可能是什么问题?
我也试过给出--num-executors 2,但结果相同。