我知道HBase系统由许多地区组成。
第一个区域是[null,endKey]
第二个区域是[startKey,endKey]
...
最后一个区域是[startKey,null]
所有的startKey& endKey按升序排列!
这是我的问题:
如果表中有2个区域:
[0 - 100),
[100,null]
当我插入一个rowkey 2000000时,系统会创建一个新区域还是只将该rowkey分配给第二个区域(最后一个)?
如果将rowkey分配给第二个区域。是否意味着第二区域的范围是[100,2000000+)。那么第二个区域将非常大,也许非常热。
否则,如果创建了一个新区域,第二个区域的结束键是什么?
非常感谢!
在线等待!
答案 0 :(得分:0)
区域太大时会被拆分。或者,如果您手动拆分它们。该地区的范围无关紧要。在您的示例中,第二个区域与第一个区域的大小相同,加上一个额外的条目,因此HBase没有理由自动拆分它。