我是Hbase和Hadoop的新手。我对MapReduce概念感到困惑,我想知道Mapreduce F / w中的执行流程。我尝试在google中搜索从文件中读取数据的方法,并使用reducer使用Put
类将数据加载到Htable中。我有一个HDFS文件,我需要从Hbase Mapreducer中读取并将数据加载到Htable中。
任何人都可以告诉我哪里出错了吗?
答案 0 :(得分:0)
请勿使用reduce步骤。在地图类中,当您获得记录时,直接将其插入HBase。在将它们发送到HBase之前,不需要对它们进行洗牌/排序。这意味着您所要做的就是为HTable创建一个实例变量并在setup方法中初始化它;然后在map方法中,为您的记录创建一个put,并将其添加到您的HTable中。最后,在清理方法中,确保刷新HTable。
答案 1 :(得分:0)
您可以将Mapper与reducer一起使用。由于reducer可用于排序,您只需要将文件数据直接存储在Hbase中。