标签: hadoop apache-pig
假设我的数据如下: (XXX,{(1),(2),(3)})
我需要给出包里面的元组之间的区别。 (可以有n个元组。)
我期待的输出: (XXX,2)
不使用UDF是否可行? 提前谢谢。
答案 0 :(得分:0)
您需要展平行李,然后在展平数据集上应用过滤器以选择适当的