我有一个文件,它有2列作为Column1和Column2,并保存如下记录 -
记录1 A是主记录和记录2列2保存与A链接的信息,类似地分别包含B C和D的信息。我正在寻找的是收集这些信息并获得以下所需的输出。
Desired output look like 我无法在HDFS文件,hadoop环境中的任何内容和任何内容中进行任何修改。 如何实现这一目标?任何帮助!!
答案 0 :(得分:0)
加载数据后
A = load '' as col1,col2;
B = FOREACH A GENERATE (col1 is null?substr(col2,1):col1),col2;