我们生产中的hbase架构有5个表。我们有N个客户,其中只有10%的客户在任何特定时刻都处于活跃状态。所以对我来说,看起来浪费资源来保持剩下的90%客户的数据活跃。我在考虑为每个客户端创建5个表,以便我可以启用活动客户端表并禁用其余客户端表。根据我所读到的,如果我们每个区域服务器超过1000个区域,那么性能开始降低。但我肯定不会达到这个限度。我的问题
答案 0 :(得分:0)
您对表演的期望是什么?
您如何确定哪些客户是活跃的/不活跃的?
如何为非活动客户端禁用自动未使用的表?
那么读取的访问模式是什么?您的客户只会在其单一表中读取数据吗?
处理大量表会导致以下几个问题: