map根据列减少计数

时间:2016-07-06 00:51:55

标签: java hadoop mapreduce

我目前正在学习mapreduce编程,并且能够使用可写接口执行单键单值,多键单值。 我对如何为以下场景或数据集选择适当的键和值感到困惑

  

主题MaleName女性名称

     化学Mike Hillary

     

物理学Gerald Hillary

     社交Mike Amber

预期输出

  

化学Mike Hillary 2 2

     

物理学Gerald Hillary 1 2

     社交Mike Amber 2 1

第4列将显示整个数据集中的男性姓名数量,第5列应显示数据集中女性姓名的数量。

感谢您的帮助。

0 个答案:

没有答案