我有以下输入记录: 0029029070999991901010106004 + 64333 + 023450FM-12 + 000599999V0202701N015919999999N0000001N9-00781 + 99999102001ADDGF108991999999999999999999
没有'或空格分隔的字段。可以使用位置识别列。像1901年一样是c16-c19栏。 Unix / Linux我使用cut -c16-19 filename。
如何在猪拉丁语中获得相同的(切割-c16-19当量)?
答案 0 :(得分:0)
你应该看一下SUBSTRING function。例如:
A = LOAD '/user/hue/file.txt' USING PigStorage;
B = FOREACH A GENERATE SUBSTRING($0, 15, 19);
DUMP B;
Result
(1901)