我们正在设置1个主节点和2个从节点。数据在postgres和hbase中设置,并且它是一个类似的数据集(相同的行数)--6500万行。然而,对于相同的查询,我们没有发现HBase的性能可测量的显着增加。
我的第一个想法是 - HBase是否使用所有节点的计算容量来分析查询?也许这就是为什么表现不会好得多。
为什么Postgres和HBase之间的表现大致相同?要查找的任何特定配置项?
编辑:我在研究这个问题时找到的东西:http://www.flurry.com/2012/06/12/137492485#.VaQP_5QpBpg
答案 0 :(得分:3)
这是一个肯定而且没有答案。根据您对“查询”和区域分布所做的操作,您可能会也可能不会使用所有节点。例如,如果您在表中运行扫描,它将按顺序针对每个区域(假设多于一个)运行。但是,如果您对不同区域中的键使用多重获取,则它将并行运行。
随着区域数量的增加以及您开始并行化请求(多个客户端),真正的好处将会来临。区域将由区域服务器分布在区域服务器上,因为区域是分开的。