标签: hadoop apache-spark yarn hadoop2
我在spark-1.6中使用client mode与独立资源管理器。现在,因为它支持在spark中运行多个executors每worker个。谁能告诉我运行哪一个应该是生产环境首选的优缺点?
spark-1.6
client mode
executors
worker
此外,当spark带有hadoop-2.x的预先构建的二进制文件时,为什么我们需要设置另一个hadoop群集以在yarn模式下运行它。在火花中包装这些罐子有什么意义。当在独立模式下给出每个工作人员的多个执行程序的灵活性时,使用yarn的重点是什么
hadoop
yarn