hbase create table是轻量级的吗?

时间:2017-09-04 08:04:57

标签: hbase

我想重新设计一个包含两列uuidconsumerId的存在表。在这个阶段,不同的uuid有50个金额,而且每个uuid的消费者ID都超过100k 那么,是否合理创建50个表并使用uuid命名,例如consumerId_{uuid001}以避免uuid列导致的冗余?

1 个答案:

答案 0 :(得分:0)

首先,您需要考虑如何使用此数据库的用例。 您是否需要查找特定uuid的每个consumerId? 使用你提出的设计意味着你需要查询50个不同的表,然后统一结果,这根本不是一件容易的事。

我会选择以下选项之一:

  1. 保持原样 - 这是最灵活的方式,您可以轻松地通过uuid查询所有consumerId,反之亦然。我没有看到额外100k整数的问题,只有几千字节。
  2. 修改结构,以便consumerId存储在每个uuid的列表中。伪代码:table(uuid: String, consumerId: List<String>)这肯定是紧凑的表示,但您可能很难构建某种类型的查询(其中consumerId是参数之一)。