InputFormat中的Giraph聚合器

时间:2014-06-12 11:30:49

标签: java hadoop giraph

我正在使用Giraph运行一些基本示例,我想验证我的EdgeInputFormat正在读取的数据。在经典的MapReduce作业中,我可以使用Counters和Giraph为此使用聚合器。 (https://giraph.apache.org/aggregators.html

网站上说聚合器应该在主站上注册。我编写的唯一代码是扩展BasicComputation并实现compute()方法的类。有人可以指出我应该在哪里注册它们以及如何在读取数据时使用它们?

1 个答案:

答案 0 :(得分:0)

我已经想出了怎么做。

我已经实现了一个扩展MasterCompute的类,并且在initialize()方法中我注册了一个持久聚合器。我使用了IntSumAggregator

之后,在EdgeInputFormat我可以使用aggregate("myAggregator", new IntWritable(1));

MasterCompute是使用-mc行参数设置的。