在hadoop中处理小文件的zip

时间:2013-07-23 10:39:22

标签: hadoop

我有一个包含大约10万个小文件的1 gb zip文件。 是否足够使用ZipInputStream导入zip文件,或者我仍然会面对 “Hadoop小文件问题”。

另外请提及解决此问题的更好方法。基本上我想解析每个小文件的内容并对其进行一些处理。

由于

0 个答案:

没有答案