应用错误收集

我想在使用Apache Spark（Scala API）将DataFrame写入csv文件时从第2行编写

时间：2018-04-20 07:11:51

标签： csv apache-spark spark-dataframe

使用类似以下内容将DataFrame写入csv文件时

df.write.format("com.databricks.spark.csv").option("header", "true").save("file.csv")

总是从第一行写，但我想从第二行写。我怎样才能从第二行写出来？

1 个答案:

答案 0 :(得分：0)

您可以执行以下步骤来实现这一目标。

使用df.first()获取第一行对象。
使用filter方法根据此行过滤原始数据框。
您可以使用代码将过滤后的数据框保存为CSV格式。

希望这有帮助！