HBase和缩放读取

时间:2012-02-29 23:40:29

标签: load-balancing scaling hbase replicate

我有一个复制因子为3的HBase集群。我正在尝试提高读取性能,因此我可以获得更多的“每秒获取”。

当我标记为获取(读取)时,我使用htable池建立了与HBase的连接并连接到表。然后我以更快的间隔反复读取同一行并监视集群负载。群集中的所有节点都具有相同的硬件。我注意到的是单个节点上的CPU负载。鉴于我已经将复制因子配置为3,我会假设读取将在任何数据副本上执行,而不是在单个节点上的单个副本上执行(我希望看到3的负载增加)服务器,而不仅仅是一个。)

如何提高读取性能,以便我的Get查询在3个复制数据集之间更好地平衡,而不是从单个节点读取。

由于

1 个答案:

答案 0 :(得分:1)

复制因子3意味着底层HDFS块被复制3次,但每个HBase区域由单个HRegionServer提供,因此一行只能从一个位置提供。