标签: java hadoop mapreduce gzip
我想使用MapReduce程序访问HDFS中的文件,这些文件是GZip压缩RCFiles(使用HIVE存储)。
我想处理这些文件并使用相同的MapReduce程序以相同的格式(RCFile + GZip)将它们写回来。
您能否分享一下您的经验/想法/ MapReduce java片段/链接或与这些相关的任何指针?
提前致谢!