我在这里有一个小问题,关于如何在从hbase加载数据时过滤rowkey, 现在我一直这样做
pigServer.registerQuery("$result = LOAD 'hbase://reach.${campaign.appId}' "
+ "USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('data:queued data:dropped', "
+ "'-loadKey -gte=key1 -lte=key20') "
但是这只允许我获得一系列键,从key1到key20,我想要的是能够精确键,而不是键的范围,例如我只想要key3,key5,key7 .. ..
是否有类似“过滤器......”或者我们可以使用的东西?谢谢 !
答案 0 :(得分:1)
HBaseStorage目前无法做到这一点,但请查看http://phoenix.apache.org。您可以执行IN查询,该查询使用跳过扫描来非常有效地返回单个键的列表。