PIG field_name MATCHES字符串

时间:2013-11-13 07:24:51

标签: parsing apache-pig arrays

说field_1 MATCHES'a_string' 我想选择任何带有field_1 CONTAINING(如果存在)'string'的条目,以便包含带有'a_string'的field_1。

例如

输入Field_1

  1. '此处a_string'

  2. '字符串'

  3. '斯特朗'

  4. 将选择条目1和2。

    我可以知道最优雅的方法是什么?

    我正在处理的实际字符串(chararray)是具有不同深度的网址,即www.abc.com/depth1/depth2 /...

    我打算用'/'作为分隔符解析chararray,但它太丑了。如果内部深度出现,我将需要更改列的数量。

    非常感谢您的协助!!

1 个答案:

答案 0 :(得分:1)

我不确定我是否正确理解了您的问题,但我认为您可以使用匹配的过滤器操作。第二个参数是正则表达式。

X = FILTER A BY(field_1匹配'。* a_string。*');

有关详细信息,请参阅Docs