鉴于此9记录文件:
START-OF-FIELDS
FUND_TAX_STATUS
EQY_SH_OUT
FUND_REDEMP_DT
FUND_MIN_INVEST_CRNCY
ID_EXCH_SYMBOL
FUNDSERV_IDENTIFIER
TIMESTARTED=Wed Apr 13 02:01:27 JST 2016
START-OF-DATA
我想获得TIMESTARTED
记录。
我怎样才能做到这一点?
非常感谢!
答案 0 :(得分:0)
将记录加载为数据类型chararray的一个字段并对其进行过滤。
A = LOAD 'data.txt' USING PigStorage(' ') as (f1:chararray);
B = FILTER A BY (f1 matches '.*TIMESTARTED.*');
DUMP B;