改革猪拉丁语结果

时间:2014-05-30 09:56:45

标签: hadoop apache-pig latin

我想改革猪拉丁结果。
对于一些猪拉丁,让我们说'转储表1 ',给我以下结果 (测试1,1.0,Link1 Link2 Link3)在Link1,Link2,Link3之间存在'\ t'。
我想改革看起来像的结果 (测试1,Link1)
(测试1,Link2)
(测试1,Link3)

有谁知道我怎么能创造这个?

提前致谢。

1 个答案:

答案 0 :(得分:0)

您可以使用TOKENIZE内置UDF,它会在您的字符串中为您提供一包不同的令牌。如果您拥有的唯一非字母数字字符是tab,那么这将正常工作。只需FLATTEN生成的包,您就可以根据需要在不同的行中使用不同的令牌。

如果您的字符串比您显示的更复杂,并且您需要精确控制它们的拆分方式,您可以使用STRSPLIT,但这会返回一个元组,因此您需要将此元组转换为在FLATTEN之前的一个包。