我想将JavaRDD存储为序列文件而不是文本文件。但我没有看到任何Java API。有办法吗?请告诉我。谢谢!
答案 0 :(得分:4)
如果不是JavaPairRDD
方法.saveAsSequenceFile
,我认为您可以使用.saveAsHadoopFile
并使用SequenceFileOutputFormat.class
作为格式参数。这似乎有点解释:http://apache-spark-user-list.1001560.n3.nabble.com/Spark-SequenceFile-Java-API-Repeat-Key-Values-td353.html