Apache Spark独立调度程序-为什么驱动程序在“群集”模式下需要整个核心?

时间:2019-06-26 23:00:49

标签: apache-spark hadoop pyspark apache-spark-standalone

在spark的“客户端”部署模式下,spark驱动程序不使用内核,仅使用spark应用程序。但是,为什么在“集群”模式下,火花驱动程序本身需要一个内核?

2 个答案:

答案 0 :(得分:0)

在客户端模式下,提交作业的计算机是驱动程序。

答案 1 :(得分:0)

Spark上下文中的核心与CPU核心不同。它只是具有一定数量RAM的计算单位。运行任何进程都需要一个核心。驱动程序需要协调集群上的Spark任务。实际上,它很可能只消耗一小部分CPU和大约1-2 GB的内存。