在猪中处理可变大小的地图

时间:2013-09-11 21:52:17

标签: parsing map apache-pig

我有一个传入的数据集

(str,[[40,74],[50,75],[60,73],[70,43]])

我需要能够使用pig:

在输出变量中得到它
str, 40, 74

str , 50, 75

str, 60, 73

str, 70, 43

这可能是一组可变元素。

尝试使用令牌化然后展平,但这没有用,因为它使用逗号创建令牌。并最终成为这样..

str , {([[40), (74]), ... }

如果我可以使用内置函数或为此编写UDF,是否有任何建议。

非常感谢, 安娜

1 个答案:

答案 0 :(得分:0)

您需要编写一个自定义UDF来解析它。假设您的数据没有比这更复杂,您可以使用带有分隔符String.split的{​​{1}}快速,浅薄的解析方法。