如何知道保存数据帧后创建的文件数量

时间:2016-08-29 06:20:35

标签: apache-spark pyspark pyspark-sql

我有一个数据框,并使用databricks.spark.csv使用数据框上的save函数将其保存到csv文件。我怎么知道创建了多少个文件(Spark自动划分文件)

1 个答案:

答案 0 :(得分:1)

+1 for anshul的评论,您可以使用getNumPartitions来获取此rdd的分区数,这将是文件编号。

是的,为什么你需要知道保存的文件号?