如何将包含大量对象的RDD转换为json文件?

时间:2018-04-16 10:59:26

标签: json apache-spark

case class VoyageObj(val id:String, val type: String)

我的问题是如何将RDD[VoyageObj]转换为json文件,其格式如下:

[{
  "id":"111111",
  "type":"Voyage"
},
{
  "id":"111112",
  "type":"Voyage"
}]

我知道如何在list[VoyageObj]方面做到这一点。然而,我不知道如何进行转换为RDD[VoyageObj]超过200G。

1 个答案:

答案 0 :(得分:0)

val rdd = sc.parrallelize(List(“[”+ urjsonRDD.collect()+“]”))