我正在使用TTL参与我参与的项目。 我明白这一功能,当我执行扫描时,我不会得到过期的数据。 我只是想知道过期数据的性能影响是什么(主要压缩之间)。 我们有10分钟的TTL和收集(和过期)的大量数据,所以我想知道使用TTL是正确的方法还是使用时间戳作为密钥的一部分并进行实际上不包含的扫描过期范围。
答案 0 :(得分:0)
您可以在扫描中使用HBase过滤器来过滤掉HBase服务器端过期的行。从内存中,我不记得单元格时间戳是否可以作为过滤器表达式的一部分使用。
您绝对不应该选择的一件事是使用看起来像"{timestamp}{other data}"
的行键。这将使你的HBase表像一个庞大的队列一样工作,这会破坏性能。