标签: java hadoop mapreduce
我目前正在学习mapreduce编程,并且能够使用可写接口执行单键单值,多键单值。 我对如何为以下场景或数据集选择适当的键和值感到困惑
主题MaleName女性名称 化学Mike Hillary 物理学Gerald Hillary 社交Mike Amber
主题MaleName女性名称
物理学Gerald Hillary
预期输出
化学Mike Hillary 2 2 物理学Gerald Hillary 1 2 社交Mike Amber 2 1
化学Mike Hillary 2 2
物理学Gerald Hillary 1 2
第4列将显示整个数据集中的男性姓名数量,第5列应显示数据集中女性姓名的数量。
感谢您的帮助。