如何读取CSV文件,然后在Spark Scala中将其另存为JSON?

时间:2018-11-22 08:58:18

标签: scala apache-spark apache-spark-sql

我正在尝试读取一个大约有700万行和22列的CSV文件。

在读取Spark Dataframe中的CSV后如何将其另存为JSON文件?

1 个答案:

答案 0 :(得分:0)

读取CSV文件作为数据框

val spark = SparkSession.builder().master("local[2]").appname("test").getOrCreate
val df = spark.read.csv("path to csv")

现在您可以对df进行一些操作并另存为JSON

df.write.json("output path")

希望这会有所帮助!