Spark支持哪些不同的输入和输出格式?
Map Reduce支持其中的一些,但我在Spark中只看到textFile和objectFile。
另外,如何在Spark中利用Hadoop输入/输出格式?
答案 0 :(得分:1)
您可以通过在大多数RDD类型上调用saveAsNewAPIHadoopFile
来将RDD保存为任何传统的Hadoop文件格式,例如: PairRDDFunctions,并通过致电SparkContext上的newAPIHadoopFile
来阅读它们。
答案 1 :(得分:0)