标签: hadoop
我有一个包含大约20个拉克拉斯输入文件的文件夹。每个压缩文件包含2到4个文件。我有一个5号的MapR集群。 我正在使用hadoop MapReduce来处理这些文件。我希望在映射器中处理之前一次组合N个输入文件。 关于如何组合一些输入文件以获得由单个映射器处理的多个文件的任何建议?