HBase版本控制:使用内置系统或自定义时间戳管理?

时间:2018-01-27 13:26:42

标签: hbase versioning

我正在使用HBase规划版本化数据存储。在这种情况下"版本化"表示旧数据从不被删除并保留无限期,以便进行审核和分析。大多数读取仍将在最新版本上发生。

HBase本身提供了一种版本控制机制,但默认情况下它只保留最后的X版本并丢弃其他所有版本。

我有几个问题:

  1. 将HBase中的最大版本数增加到Integer.MAX_VALUE会有什么影响,特别是在性能方面? HBase是否准备好处理这种情况,还是不鼓励?
  2. 威尔(主要)压缩是否尊重max_versions设置,或者在使用HBase内部版本控制系统时,主要压缩是否会丢弃较旧的行版本?这里的文档不是很具体。
  3. 鉴于给定密钥的版本数量可以增长到非常大的数量,忽略内置版本控制系统并通过组合的行密钥实现它会更好吗?

0 个答案:

没有答案