Spark中的saveAsTextFile在每个零件文件上都有标题吗?

时间:2019-03-13 11:36:28

标签: scala apache-spark

我想为saveAsTextFile生成的每个零件文件添加头。我可以想到的一种方法是使用mapPartitionsWithIndex而不是saveAsTextFile并自己将内容写入每个零件文件,同时将标头附加到每个文件中。但是,有没有更优雅的方法呢?

1 个答案:

答案 0 :(得分:2)

类似的事情,如果您还需要分区索引,则可以改用mapPartitionsWithIndex

rdd
  .mapPartitions(it => Iterator(Iterator("my header"), it).flatten)
  .saveAsTextFile