我想编写一个mapreduce作业来执行以下操作:
上述过程将每天重复。
问题:
答案 0 :(得分:1)
不仅仅是一种方法可以做你想要的。 是的,你可以在蜂巢中完成整个事情。 Hive有一些允许您访问Hbase的SerDes,因此您也可以从配置单元中使用它。
你的MR工作只由完成工作的地图工作者组成;无论如何,既然蜂巢可以做到,我认为写一份MR工作并不是一个好主意。 也许构建MR作业的快速方法是使用实用程序流,您可以用您喜欢的任何语言编写映射器。
如果两种情况,使用配置单元或小型MR工作,您可以将工作置于oozie下并使其每天运行。