有关HBase的大多数文档和文章建议,HBase中的架构应具有不超过2个或3个列族。列族的数量如何影响HBase性能?为什么太多的列族会导致不良的架构设计?
何时创建多个表而不是多个列族来存储数据?
我已经阅读了here的说明,但并没有完全理解。
答案 0 :(得分:1)
实际上,问题是:为什么需要多个列族?列族并非旨在根据某些业务考虑来组织数据,而是根据某些技术约束来组织数据。 例如,您可能有一个列族来存储所有字段值,并且有一个列族来存储偶尔访问的二进制对象(PDF,图像)。 一个或几个HBase表取决于您的用例,但是如果行键相同,则单个表就足够了