是否有任何关于设计良好性能Hbase架构的好建议。例如:不要使用太多的columnFamily,因为太多的columnFamily会导致读/写速度变慢?在不同的columnFamily中用小尺寸列分隔大柱?我非常感谢任何建议。
答案 0 :(得分:1)
HBase表由列族组成,列族是列的逻辑和物理分组。一个系列中的列与另一个系列中的列分开存储。如果您有不经常查询的数据,请将该数据分配给单独的列族。
每行重复列族和列限定符名称。因此,请尽可能缩短名称,以减少HBase存储和读取的数据量。例如,使用f:q而不是mycolumnfamily:mycolumnqualifier。
由于列族存储在单独的HFile中,因此请尽可能减少列族数。您还希望减少列族数,以减少MemStore刷新的频率以及压缩的频率。并且,通过使用尽可能少的列系列,您可以改善LOAD时间并减少磁盘消耗。