标签: scala apache-spark
如何使用scala读取RC文件(在HDFS中)的内容?我能够阅读文本文件以及avro。但不是RC文件。
答案 0 :(得分:2)
val inputRDD = sc.hadoopFile[LongWritable, BytesRefArrayWritable, RCFileInputFormat[LongWritable, BytesRefArrayWritable]](path)
在此RDD上,您可以应用地图和读取数据。