代码没有在wordcount程序中跳过两个单词

时间:2016-01-20 11:17:12

标签: hadoop mapreduce

此代码统计单词并跳过两个给定单词(in& of)形成一个文件: - 请帮助为什么不跳过这些词。

driver.find_element_by_css_selector('[id*="treeview-2234"]');

1 个答案:

答案 0 :(得分:0)

使用equals方法比较字符串,如:

if (!"in".equals(key.toString()) && !"of".equals(key.toString())) 

如果你在mapper而不是reducer中跳过/ in会有好处,因为在排序和洗牌阶段之前删除数据会很有效,所以你可以避免额外的IO。