有两个HBase表(table1,table2)作为输入源,使用MapReduce比较table1中的一列和table2中的一列,如果table1中的一个与table2中的一个相同,则将它们输出到table3。
我们如何使用MapReduce解决问题? (Hadoop2.2.0 + Hbase0.96.0)
答案 0 :(得分:0)
第一步 - 浏览此链接,了解Hbase表如何成为映射器的来源:Hbase Table as Mapper source
下一步针对您的具体问题: 每个表有一个Mappers(即2个输入)。 您可以根据表中的值进行缩减。您可能需要一个复杂的键或值来指定哪个表值来自Reducer。在reducer中,如果值/键来自两个表,即两个映射器,那么你可以使用Hbase API(上面的链接解释了它的机器人)来写入表。