关于数据框,如何将标头添加到输出csv文件

时间:2017-08-24 06:22:01

标签: apache-spark

我有一个如下数据框:

+---+-----+-------------------+
|  x|    y|                  z|
+---+-----+-------------------+
|xyz|12223|A,123@B,456@C,98765|
|abc|12456|              A,123|
+---+-----+-------------------+

我把它保存为csv:

index.write.csv("D:\\spark\\tmp\\dd2")

这里有两个问题:

  1. 您想告诉我如何将列名x,y,z保存到csv的标题中 请?
  2. 如何将输出保存到单个文件中?

1 个答案:

答案 0 :(得分:4)

  

您想告诉我如何将列名x,y,z保存到csv的标题中吗?

您必须使用header选项:

index.write.option("header", "true").write(path)
  

如何将输出保存到单个文件中?

Write single CSV file using spark-csv