我在Hbase中有一个非常大的专栏,例如:columnfamilyName:sampleRaw
。列sampleRaw
数据大小可能是20MB,甚至每行50MB。现在我想计算表中有多少sampleRaw
行。命令count
不正常,它无法知道该行是否包含列sampleRaw
。命令scan
太慢,因为它试图打印出sampleRaw
列,但它非常大。
例如,我尝试了这个命令:
scan 'bigRaw',{COLUMNS=>['rawf':'sample']}
答案 0 :(得分:1)
如果你可以使用java客户端,你可以在列基础as you can see here上尝试KeyOnlyFilter这样一来,数据就不会通过网络传输给你了,它会像shell一样快速计算"计数"命令。