MapReduce处理GZip压缩的RCFile

时间:2013-10-12 10:44:56

标签: java hadoop mapreduce gzip

我想使用MapReduce程序访问HDFS中的文件,这些文件是GZip压缩RCFiles(使用HIVE存储)。

我想处理这些文件并使用相同的MapReduce程序以相同的格式(RCFile + GZip)将它们写回来。

您能否分享一下您的经验/想法/ MapReduce java片段/链接或与这些相关的任何指针?

提前致谢!

0 个答案:

没有答案