Apache Pig是否支持UNGROUP操作?我想是的。所以任何人都可以帮我解决这个问题吗? 我有一行表格
1,a-b-c
2,d-e-f
3,g-h
我想将其扩展为
形式1,a
1,b
1,c
2,d
2,e
2,f
3,g
3,h
任何帮助表示感谢。
答案 0 :(得分:4)
您应该使用内置STRSPLIT
将第二个字段拆分为多个标记,然后应用FLATTEN
为每个元素创建一行。像这样:
A = LOAD 'input.txt' as (id, data);
B = FOREACH A GENERATE id, FLATTEN(STRSPLIT(data,'-'));