Hadoop的新手!例如,我试图将wordcount程序的代码修改为仅输出以“ a”开头的单词。
我已经修改了映射器方法代码,但是由于未知原因,它仍然在输入文件中输出所有单词。其余代码未更改,可以在enter image description here上找到。
public void map(Object key, Text value, Context context
) throws IOException, InterruptedException {
Text word = new Text();
StringTokenizer itr = new StringTokenizer(value.toString());
while (itr.hasMoreTokens()) {
String currentWord = itr.nextToken();
if(currentWord.startsWith("a")) {
word.set(currentWord);
context.write(word, new IntWritable(1));
}
}
}
输出文件仍然包含所有单词。我只希望字母开头的单词-a。
任何帮助将不胜感激。预先感谢。