标签: apache-spark
我正在使用自定义partitioner对RDD进行分区,然后我使用saveAsTextFile保存它。保存后是否始终保证分区的订购?特别是:订购自己和1个分区到1个文件匹配?所以它看起来像这样:
partitioner
RDD
saveAsTextFile
part-00000 - 1 partition part-00001 - 2 partition even if it's empty part-00002 - 3 partition ...
或者可能会有所不同?
我正在使用Spark 1.6