应用错误收集

时间：2016-05-30 13:21:48

标签： hadoop mapreduce hbase hdfs

情景：

我分析数TB的数据并在其上进行一些文本挖掘并将数据存储到HDFS文件中。然后，为了查询数据，我们将这些数据导入Hive。

但是，我们还需要对增量数据执行一些更新操作。例如，如果新旧数据中存在相同的rowkey，则更新数据而不是插入。

目前我正在使用HDFS进行上述操作。现在我想通过读/写操作进入HBase。

我想知道这种方法的性能优缺点与HDFS相比，使用HBase读/写MapReduce。

答案 0 :(得分：0)

优点（使用HBase作为数据存储）：

缺点（使用HBase作为数据存储）：

我希望我已经回答了你的问题。如果我错了，请纠正我