nosql - Hbase架构设计 - 需要建议

请考虑阅读Hbase书中的这一章：6.2. On the number of column families

“HBase目前不适用于两个或三个列系列以上的任何内容，因此请保持模式中列系列的数量较少。目前，刷新和压缩是基于每个区域完成的，因此如果一个列族携带大量的数据带来了冲洗，相邻的系列也会被刷新，虽然它们携带的数据量很小。当许多列系列冲洗和压缩交互可以产生一堆不必要的i / o加载（由改变冲洗和压实以按列系列工作。“

“如果你可以在你的模式中尝试使用一个列系列。在数据访问通常是列作用域的情况下，只引入第二和第三列系列;即你查询一个列族或另一个但通常不是两者都是“

现在，请记住，在物理上，所有列族成员都存储在文件系统中。由于调整和存储规范是在列族级别完成的，因此建议所有列族成员具有相同的通用访问模式和大小特征。如果所有数据都是同时处理的，那么您可能需要考虑只有一个列族的表。你最好不要使用多个系列，除非它们几乎一直是单独使用的。

Hbase架构设计 - 需要建议

1 个答案: