应用错误收集

我有9 GB的数据，其中包含大量小于64 MB块大小的小文件。我的集群级别块设置为512 MB。但我已经使用64 MB块设置单独复制了此数据。当我运行我的猪脚本，其作业级别的hadoop块大小为64 MB时，它为此作业分配了20个映射器。我还验证了job.xml的块大小设置为64 MB。当我重新执行我的猪脚本集群级别设置为64 MB时，它分配160个映射器。

我担心的是，当我在工作级别设置它时，它只分配20个映射器。有什么想法吗？

9 GB数据的映射器数量非常少

0 个答案: