Hbase如何计算非常大的列

时间:2016-01-26 15:13:14

标签: hbase

我在Hbase中有一个非常大的专栏,例如:columnfamilyName:sampleRaw。列sampleRaw数据大小可能是20MB,甚至每行50MB。现在我想计算表中有多少sampleRaw行。命令count不正常,它无法知道该行是否包含列sampleRaw。命令scan太慢,因为它试图打印出sampleRaw列,但它非常大。

例如,我尝试了这个命令:

scan 'bigRaw',{COLUMNS=>['rawf':'sample']}

1 个答案:

答案 0 :(得分:1)

如果你可以使用java客户端,你可以在列基础as you can see here上尝试KeyOnlyFilter这样一来,数据就不会通过网络传输给你了,它会像shell一样快速计算"计数"命令。