Question

我有一个像贝娄那样的Json对象

{"Event":"xyz","Name":"test","Prog":0,"AId":"367","CId":"11522"}

使用波纹管火花脚本，我已转换为csv

 val sqlContext = new org.apache.spark.sql.SQLContext(sc)
 val df = sqlContext.load("org.apache.spark.sql.json", Map("path" -> "test1.json"))
 df.save("com.databricks.spark.csv", SaveMode.ErrorIfExists, Map("path" -> "datascv", "header" -> "true"))

我可以转换为CSV文件，我的输出是

AId,CId,Event,Name,Prog
367,11522,xyz,test,0

但是这里csv的标题是按升序排列的，但是我想用自定义格式维护我的csv文件头，比如我的json命令。

Event,Name,Prog,AId,CIdEvent,Name,Prog,AId,CId

请帮助我。

提前致谢。

Answer 1

您可以尝试以下操作。

val selectedData = df.select("Event", "Name", "Prog", "AId", "CId")
selectedData.save("com.databricks.spark.csv", SaveMode.ErrorIfExists,
                  Map("path" -> "datascv", "header" -> "true"))

在Spark Json到Csv的转换？

1 个答案: