如何使用scala读取RC文件

时间:2015-06-01 07:27:41

标签: scala apache-spark

如何使用scala读取RC文件(在HDFS中)的内容?我能够阅读文本文件以及avro。但不是RC文件。

1 个答案:

答案 0 :(得分:2)

val inputRDD = sc.hadoopFile[LongWritable, BytesRefArrayWritable, RCFileInputFormat[LongWritable, BytesRefArrayWritable]](path)

在此RDD上,您可以应用地图和读取数据。