处理Hadoop映射中的Zip文件

时间:2014-03-14 07:01:28

标签: hadoop

我是Hadoop和Mapreduce的新手。

现在我需要使用Mapreduce在myproject中处理一个zip文件,输入必须是一个zip文件,输出可能是zip或文本文件。

任何人都可以给我样品或建议我链接。

谢谢, varadhan.S

1 个答案:

答案 0 :(得分:0)

我目前也在研究Hadoop和Mapreduce。没有必要为Zip文件专门指定任何内容。 hadoop自动解压缩并处理它们。但是,输出是Text我正在使用的。我正在处理大量压缩文件,其中每个tar.gz文件都包含一个文本文件。

此致 巴拉拉姆