应用错误收集

时间：2015-07-09 14:58:59

标签： hadoop hbase

我们正在设置1个主节点和2个从节点。数据在postgres和hbase中设置，并且它是一个类似的数据集（相同的行数）--6500万行。然而，对于相同的查询，我们没有发现HBase的性能可测量的显着增加。

我的第一个想法是 - HBase是否使用所有节点的计算容量来分析查询？也许这就是为什么表现不会好得多。

为什么Postgres和HBase之间的表现大致相同？要查找的任何特定配置项？

答案 0 :(得分：3)

这是一个肯定而且没有答案。根据您对“查询”和区域分布所做的操作，您可能会也可能不会使用所有节点。例如，如果您在表中运行扫描，它将按顺序针对每个区域（假设多于一个）运行。但是，如果您对不同区域中的键使用多重获取，则它将并行运行。

随着区域数量的增加以及您开始并行化请求（多个客户端），真正的好处将会来临。区域将由区域服务器分布在区域服务器上，因为区域是分开的。