标签: hadoop
我有一个包含大约10万个小文件的1 gb zip文件。 是否足够使用ZipInputStream导入zip文件,或者我仍然会面对 “Hadoop小文件问题”。
另外请提及解决此问题的更好方法。基本上我想解析每个小文件的内容并对其进行一些处理。
由于