情景:
我分析数TB的数据并在其上进行一些文本挖掘并将数据存储到HDFS文件中。然后,为了查询数据,我们将这些数据导入Hive。
但是,我们还需要对增量数据执行一些更新操作。例如,如果新旧数据中存在相同的rowkey,则更新数据而不是插入。
目前我正在使用HDFS进行上述操作。现在我想通过读/写操作进入HBase。
我想知道这种方法的性能优缺点 与HDFS相比,使用HBase读/写MapReduce。
答案 0 :(得分:0)
优点(使用HBase作为数据存储):
缺点(使用HBase作为数据存储):
我希望我已经回答了你的问题。 如果我错了,请纠正我