我正在使用HBase规划版本化数据存储。在这种情况下"版本化"表示旧数据从不被删除并保留无限期,以便进行审核和分析。大多数读取仍将在最新版本上发生。
HBase本身提供了一种版本控制机制,但默认情况下它只保留最后的X版本并丢弃其他所有版本。
我有几个问题:
Integer.MAX_VALUE
会有什么影响,特别是在性能方面? HBase是否准备好处理这种情况,还是不鼓励?max_versions
设置,或者在使用HBase内部版本控制系统时,主要压缩是否会丢弃较旧的行版本?这里的文档不是很具体。