我有一个目录,其中的文件包含一些邮件格式的日志(NEWLINE分隔),我想在每一行中选择特定的位置并将其用作目录/文件名
下面的代码只是文件并且做了我期望的,问题是子字符串现在在新文件中,有没有办法在文件中存储B $ 1使用B $ 0作为文件名意味着保留原始文件文件内容是什么?
REGISTER /lib/pig/piggybank.jar;
A = LOAD '/raw/*' USING PigStorage('\n') AS (mytext:chararray);
B = FOREACH A GENERATE SUBSTRING(mytext,5,7), mytext;
STORE B INTO '/output' USING org.apache.pig.piggybank.storage.MultiStorage('/output', '0', 'none', ' ') ;