我目前正在使用Cloudera上的计数器进行MapReduce地图程序。 Mapper类将递增一个特定的Counter,我想在MapReduce作业完成后显示每个Counter的最终值。下面是我的Mapper类代码:
public class MyMapper extends Mapper<LongWritable, Text, Text, IntWritable> {
public static enum MY_COUNTER {
C1,
C2
}
//mapper logic that produces String variable 'final'
if (final.equals("Foo")) context.getCounter(MY_COUNTER.C1).increment(1);
else context.getCounter(MY_COUNTER.C2).increment(1);
//context.write() method
}
以下是我的Driver类代码:
public class MyDriver extends Configured implements Tool {
public static void main(String[] args) throws Exception {
int exitCode = ToolRunner.run(new MyDriver(), args);
System.exit(exitCode);
}
public int run(String[] args) throws Exception {
Job job = Job.getInstance(getConf(), "My MapReduce");
//Job configuration:
//Sets mapper to MyMapper class
//Sets num of Reduce tasks to 0
//Other necessary job config
boolean success = job.waitForCompletion(true);
if (success) {
Counter counter1 = job.getCounters().findCounter("MY_COUNTER", "C1");
System.out.println(counter1.getDisplayName() + ": " + counter1.getValue());
Counter counter2 = job.getCounters().findCounter("MY_COUNTER", "C2");
System.out.println(counter2.getDisplayName() + ": " + counter2.getValue());
return 0;
}
else return 1;
}
}
当我运行jar文件时,作业成功执行。因为我将job.waitForCompletion()
参数设置为true,所以它会将所有MapReduce进度打印到终端。我可以从那里看到我的计数器的价值。
18/03/27 09:59:58 INFO mapreduceJob: Counters: 35
//all built-in counters
MyMapper$MY_COUNTER
C1=837
C2=119
但是,当我在作业完成后(从MyDriver类的if(success)
部分)打印计数器的值时,打印的值都是零。
C1: 0
C2: 0
关于我可能出错的地方的任何建议?
注意:我正在使用Hadoop 2.6.0-cdh5.12.0
答案 0 :(得分:0)
发现问题。我应该使用字符串参数而不是枚举来增加计数器。增量过程如下:
context.getCounter("MY_COUNTER","C1").increment(1);
有了这个,我甚至不需要在我的Mapper类中为我的计数器声明一个枚举。感谢Amita帮助我。