有没有办法限制我的mapreduce(JAVA)作业产生的记录数量?

时间:2016-04-29 21:22:31

标签: java hadoop mapreduce

假设我想从mapreduce程序中只生成1000条记录。 我有多个映射器进入一个reducer,因此限制来自mapper的记录数量不是一种选择。

mapreduce有一些内置功能,我可以做一些像

这样的事情
HCatOutputFormat.setOutput(job, OutputJobInfo.create(dbName, tbName, partitionValues)).limit(1000);

或类似的东西?

1 个答案:

答案 0 :(得分:0)

您可以使用内置的MAP_OUTPUT_RECORDS计数器。 Here就是示例