HBase中的复制与快照

时间:2016-01-28 00:48:59

标签: hadoop mapreduce hbase cloudera

我们有两个系统 - 一个离线系统(性能在这里并不重要),其中MapReduce作业在HBase群集上运行。其他是在线系统(Performace在这里非常关键),其中API从同一HBase集群读取。但是,由于MapReduce作业在同一个集群上运行,因此在线系统存在性能问题。因此,我们尝试为脱机系统设置单独的HBase集群,这是从源集群中复制少数族名。 所以在源码上繁重的MapReduce作业运行。在复制的集群上,只有在线系统运行才能提供最佳性能。 我的问题是::我们不能在HBase中使用Snap shot功能来做同样的事情吗?我也想知道它们之间有什么区别?

1 个答案:

答案 0 :(得分:1)

如果对mapreduce使用快照功能,它也会在live hbase集群节点上使用cpu,memory和disk io。因此,如果disk io或cpu是你的瓶颈,那么mapreduce作业的单独集群就是更好的解决方案。