猪有条件地分组记录

时间:2016-06-28 20:02:51

标签: hadoop apache-pig

我有一个文件,它有2列作为Column1和Column2,并保存如下记录 -

File in HDFS

记录1 A是主记录和记录2列2保存与A链接的信息,类似地分别包含B C和D的信息。我正在寻找的是收集这些信息并获得以下所需的输出。

Desired output look like 我无法在HDFS文件,hadoop环境中的任何内容和任何内容中进行任何修改。 如何实现这一目标?任何帮助!!

1 个答案:

答案 0 :(得分:0)

加载数据后

A = load '' as col1,col2;

B =  FOREACH A GENERATE (col1 is null?substr(col2,1):col1),col2;