我想为saveAsTextFile
生成的每个零件文件添加头。我可以想到的一种方法是使用mapPartitionsWithIndex
而不是saveAsTextFile
并自己将内容写入每个零件文件,同时将标头附加到每个文件中。但是,有没有更优雅的方法呢?
答案 0 :(得分:2)
类似的事情,如果您还需要分区索引,则可以改用mapPartitionsWithIndex
:
rdd
.mapPartitions(it => Iterator(Iterator("my header"), it).flatten)
.saveAsTextFile