将Scala对象加载到RDD中

时间:2016-01-28 10:55:54

标签: apache-spark

Scala类代表User。该类有一个伴侣对象。

该类本身包含toXml()函数,并且伴随对象具有fromXml()函数。

class User(val firstname:String, val lastname:String, val age:Int, val profession:String){
   def toXml(){...}
}

XML文件包含用户列表,由Scala类建模。

需要从XML文件创建或加载Spark RDD,以便它包含我们类的Scala对象的集合,即RDD[User]

这样做的最佳方式是什么?

由于

0 个答案:

没有答案