在猪中使用正则表达式获取必填字段的问题

时间:2016-07-02 10:04:15

标签: apache-pig

日志文件如下:

$ 4:processName =“ManageBillingAccountAssociations_V1.getSharedAccountDetails”

l = foreach b生成REGEX_EXTRACT($ 4,'(。* [^ a-z])',1);

我正在尝试获取“ManageBillingAccountAssociations_V1.getSharedAccountDetails”

但我得到的输出为: processName = “ManageBillingAccountAssociations_V1.getSharedAccountDetails”

请帮帮我..

1 个答案:

答案 0 :(得分:0)

完整字符串满足正则表达式,您可以改为执行a,

 B = FOREACH a GENERATE REGEX_EXTRACT(col,'=.*$',0);

你可以对输出进行子串,以便在

开始时删除=
 B = FOREACH a GENERATE SUBSTRING(REGEX_EXTRACT(col,'=.*$',0),1,(int)SIZE(REGEX_EXTRACT(col,'=.*$',0)));