标签: java hadoop mapreduce
假设我想从mapreduce程序中只生成1000条记录。 我有多个映射器进入一个reducer,因此限制来自mapper的记录数量不是一种选择。
mapreduce有一些内置功能,我可以做一些像
HCatOutputFormat.setOutput(job, OutputJobInfo.create(dbName, tbName, partitionValues)).limit(1000);
或类似的东西?
答案 0 :(得分:0)
您可以使用内置的MAP_OUTPUT_RECORDS计数器。 Here就是示例