在群集模式下没有HDFS的Spark:哪些数据存储在哪里?

时间:2015-11-27 10:59:11

标签: apache-spark apache-spark-sql

我在集群模式下使用没有HDFS的Spark 1.5来构建应用程序。我想知道,在进行保存操作时,例如,

df.write.parquet("...")

哪些数据存储在哪里?是所有数据都存储在主服务器上,还是每个工作人员都存储其本地数据?

1 个答案:

答案 0 :(得分:2)

一般来说,所有工作节点都会对其本地文件系统执行写操作,驱动程序只编写_SUCCESS文件。