Apache Pig。获得一个特定记录

时间:2016-05-02 17:44:54

标签: apache-pig

鉴于此9记录文件:

START-OF-FIELDS
FUND_TAX_STATUS
EQY_SH_OUT
FUND_REDEMP_DT
FUND_MIN_INVEST_CRNCY
ID_EXCH_SYMBOL
FUNDSERV_IDENTIFIER
TIMESTARTED=Wed Apr 13 02:01:27 JST 2016
START-OF-DATA

我想获得TIMESTARTED记录。

我怎样才能做到这一点?

非常感谢!

1 个答案:

答案 0 :(得分:0)

将记录加载为数据类型chararray的一个字段并对其进行过滤。

A = LOAD 'data.txt' USING PigStorage(' ') as (f1:chararray);
B = FILTER A BY (f1 matches '.*TIMESTARTED.*');
DUMP B;