如何从hbase加载数据时过滤rowkey

时间:2014-11-19 17:42:56

标签: hbase apache-pig

我在这里有一个小问题,关于如何在从hbase加载数据时过滤rowkey, 现在我一直这样做

pigServer.registerQuery("$result = LOAD 'hbase://reach.${campaign.appId}' "
    + "USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('data:queued data:dropped', "
    + "'-loadKey -gte=key1 -lte=key20') "

但是这只允许我获得一系列键,从key1到key20,我想要的是能够精确键,而不是键的范围,例如我只想要key3,key5,key7 .. ..

是否有类似“过滤器......”或者我们可以使用的东西?谢谢 !

1 个答案:

答案 0 :(得分:1)

HBaseStorage目前无法做到这一点,但请查看http://phoenix.apache.org。您可以执行IN查询,该查询使用跳过扫描来非常有效地返回单个键的列表。