猪拉丁相当于$ cut -c16-19 <filename> </filename>

时间:2014-08-18 12:53:21

标签: hadoop apache-pig

我有以下输入记录: 0029029070999991901010106004 + 64333 + 023450FM-12 + 000599999V0202701N015919999999N0000001N9-00781 + 99999102001ADDGF108991999999999999999999

没有'或空格分隔的字段。可以使用位置识别列。像1901年一样是c16-c19栏。 Unix / Linux我使用cut -c16-19 filename。

如何在猪拉丁语中获得相同的(切割-c16-19当量)?

1 个答案:

答案 0 :(得分:0)

你应该看一下SUBSTRING function。例如:

A = LOAD '/user/hue/file.txt' USING PigStorage;
B = FOREACH A GENERATE SUBSTRING($0, 15, 19);
DUMP B;

Result
(1901)