标签: mapreduce apache-pig yarn hadoop2
我有9 GB的数据,其中包含大量小于64 MB块大小的小文件。我的集群级别块设置为512 MB。但我已经使用64 MB块设置单独复制了此数据。当我运行我的猪脚本,其作业级别的hadoop块大小为64 MB时,它为此作业分配了20个映射器。我还验证了job.xml的块大小设置为64 MB。当我重新执行我的猪脚本集群级别设置为64 MB时,它分配160个映射器。
我担心的是,当我在工作级别设置它时,它只分配20个映射器。有什么想法吗?