使用hadoop的自定义Java单词计数mapreduce程序

时间:2019-05-13 07:03:01

标签: java hadoop mapreduce

Hadoop的新手!例如,我试图将wordcount程序的代码修改为仅输出以“ a”开头的单词。

我已经修改了映射器方法代码,但是由于未知原因,它仍然在输入文件中输出所有单词。其余代码未更改,可以在enter image description here上找到。

public void map(Object key, Text value, Context context
                    ) throws IOException, InterruptedException {
        Text word = new Text();
        StringTokenizer itr = new StringTokenizer(value.toString());
        while (itr.hasMoreTokens()) {
            String currentWord = itr.nextToken();
            if(currentWord.startsWith("a")) {
                word.set(currentWord);
                context.write(word, new IntWritable(1));
            }
        }
}

输出文件仍然包含所有单词。我只希望字母开头的单词-a。

任何帮助将不胜感激。预先感谢。

0 个答案:

没有答案