Hbase区域在它们不应该

时间:2015-07-14 22:27:21

标签: hadoop hbase

我们有一些表配置了DelimitedKeyPrefixRegionSplitPolicy(继承自IncreaseToUpperBoundRegionSplitPolicy),memstore刷新大小为128M,表MAX_FILESIZE为~20GB。

根据我们的计算,我们不应该为每个服务器获得超过5个区域,直到区域大小达到20GB(4 ^ 3 * 256M = 16GB),但每个区域服务器有7-15个区域。

我们之前已将它们组合起来以获得正确的数字,但之后它们又分开了。我们使用的是hbase 0.98.4,表格描述显示{TABLE_ATTRIBUTES => {MAX_FILESIZE => ' 21474836480' ...默认区域max filesize为1 GB,许多区域都大于此区域。

尽管我们尽最大努力保持区域数量的减少,但我们无法弄清楚为什么他们会继续分裂。有什么想法吗?

1 个答案:

答案 0 :(得分:0)

您应该更改拆分政策

METADATA => {'SPLIT_POLICY' => 'org.apache.hadoop.hbase.regionserver.ConstantSizeRegionSplitPolicy'}