HIF超过HBase与Hive超过HDFS

时间:2012-07-28 23:45:15

标签: hadoop mapreduce hbase hive

我的数据不需要实时加载,因此我不必使用HBASE,但我想知道在MR作业中使用HBASE是否有任何性能优势,不应该因为索引数据?

有人有任何基准吗?

3 个答案:

答案 0 :(得分:2)

一般来说,hive / hdfs会比HBase快得多。 HBase位于HDFS之上,因此它增加了另一层。如果您查找单个记录,HBase会更快,但您不会使用MR作业。

答案 1 :(得分:2)

HBase与Hive的表现:

基于Hase上HBase,Hive和Hive的结果:两种方法之间的表现似乎相当。

Hive on HBase Performance

enter image description here

答案 2 :(得分:0)

尊重:)我想告诉你,如果你的数据不真实而且你也在考虑mapreduce工作,那么只能通过hdfs进行配置,因为Weblog可以由Hadoop MapReduce程序处理并存储在HDFS中。同时,Hive支持快速读取HDFS位置中的数据,基本SQL,连接和批量数据加载到Hive数据库。
蜂巢也为我们提供了 批量处理/实时(如果可能)
以及类似SQL的界面
内置优化的map-reduce
大型数据的分区,与hdfs更兼容,有助于减少层数HBase否则如果你在这里添加HBase那么它将是你的多余功能:)