我需要从HBase表中读取最新插入/更新的行,该表的总行数约为1500万。
我在这个论坛上看到很少的答案,建议在Scan中使用TIMERANGE,但是在Scan中使用TIMERANGE,我们只能在某个时间点获得记录的“最新”状态。
请您告知我们如何检索最后插入/更新的记录。谢谢!
答案 0 :(得分:-1)
要检索最后插入的行,请将reverse_time_stamp放在rowkey的前缀中。因此,最新记录将排在您的扫描之首。如果是更新,请删除旧行,并使用新的reverse_time_stamp插入新行。在更新的情况下,如果可以删除和插入的开销,这将对您有用,因为这使您的获取非常高效。您将只扫描必要的记录。