hadoop将int数组从map传递给reducer并作为输出

时间:2013-11-27 08:02:41

标签: java arrays hadoop int cloudera

我正在学习使用hadoop并遇到以下问题: 我需要将一个int数组从map函数传递给reducer,然后作为输出。

所以它看起来像这样:

public void map(LongWritable key,Text value,OutputCollector<Text, IntWritable> output,Reporter reporter) throws IOException{
..snip..
int[] output={0,0,1,1}; //or something like it
output.collect(word,output);
}

and 

public static class reduce exteds mapReduceBase implements reducer<Text,IntWritable,Text, Intwriteable>{
  int[] sum={0,0,0,0}
  while(values.hasNext()){
   int[] numbers=values.next().get
    for(int i=0;i<numbers.length;i++)
       sum[i]=sum[i]+numbers[i]; 
  }
}

如果您知道如何解决此问题,请发布。 感谢。

1 个答案:

答案 0 :(得分:1)

研究编写自己的自定义Writable(它应该很容易扩展ArrayAritable - 实际上这个类的JavaDoc有一个IntWritable数组的例子。)