我有一个HBase表,大约有5000万行,每行有几列。我的目标是从表中检索在给定列中具有给定值的行,例如列'col_1'的值为'val_1'的行。
我有两个选择:
- 从头到尾扫描表格,检查每一行,看看是否应该检索;
- 为此表构建索引(例如,列'col_1'中值的索引),然后对于给定列值'val_1',获取与此索引'val_1'关联的所有行键,然后通过这些行键并检索相应的行。在我看来,这将涉及对原始hbase表的随机访问。
醇>
有没有人给我一些关于哪个选项运行得更快的建议,或者你有另一个更好的选择?
非常感谢!