猪 - 在同一过滤器中过滤两次色谱柱

时间:2014-12-18 18:27:13

标签: filter apache-pig

我正在尝试两次过滤同一列。我基本上只希望得到一列在其他2列的值之间的记录。

想象一下:

(id,year_min,year_max,year)
(4470,1999,2001,2011)
(4471,2006,2013,2013)

所以这样过滤它不起作用:

filter1 = filter set by (year_min <= year and year_max >= year)

是否有另一种过滤方法,而不是将过滤器分成几个? 此外,所有列都是bytearray。

PS:这不是整套,但基本上我想要实现的目标。

感谢。

1 个答案:

答案 0 :(得分:0)

我猜您的架构中交换了 year_max 。它应该是这样的吗? id, year_min, year, year_max,但您的架构显示为id, year_min, year_max, year。我修改了架构,它对我来说很好。你能检查一下吗?