我有一个传入的数据集
(str,[[40,74],[50,75],[60,73],[70,43]])
我需要能够使用pig:
在输出变量中得到它str, 40, 74
str , 50, 75
str, 60, 73
str, 70, 43
这可能是一组可变元素。
尝试使用令牌化然后展平,但这没有用,因为它使用逗号创建令牌。并最终成为这样..
str , {([[40), (74]), ... }
如果我可以使用内置函数或为此编写UDF,是否有任何建议。
非常感谢, 安娜答案 0 :(得分:0)
您需要编写一个自定义UDF来解析它。假设您的数据没有比这更复杂,您可以使用带有分隔符String.split
的{{1}}快速,浅薄的解析方法。