我认为,为避免混淆,hbase扫描应该不扫描已经开始执行后创建的行。但是我找不到任何明确说明这一点的文档。
答案 0 :(得分:0)
请考虑一种情况,其中行键以a到z之间的任何字母开头。给定表中有百万行。您必须已经知道HBase按字典顺序对行进行排序。假设您开始扫描整个表,请考虑您的扫描指针位于以“ e”开头的行键处。现在考虑同时插入带有行键“ bbbbb”和“ hhhh”的两个条目。如果您分析结果集,则将获得带有rowKey'hhhh'的行。您将不会获得带有rowKey'bbbbb'的行。我实际上是通过扫描包含大量数据的表并在两者之间插入记录来进行检查的。