猪代数与字符串

时间:2013-03-13 16:31:42

标签: java user-defined-functions apache-pig bag

我需要编写一个界面,将包中的单个项目折叠为字符串。示例:{(a),(b)}到ab。

首先,可以使用代数接口来返回字符串,还是仅限于整数(Long)。

其次,是否有一个地方可以访问使用代数的一些例子(除了我到处看到的COUNT例子)。

如果代数可用于处理字符串,请回答我是否知道是否有一个好地方我可以看到一些现有的UDF代码(而不是那些能完全解决我的问题的代码)。

这些是我尝试过的事情:

  1. 在Google上搜索任何 UDF代码。除了到处张贴的COUNT示例之外没有任何其他内容
  2. 在Pig中尝试不同的选项。显然你不能在一个无足轻重的行李箱内取消个别物品。

1 个答案:

答案 0 :(得分:0)

最后这就是我想到的:

  1. 如果您的问题可以像GROUP一样有效地解决,那么您应该这样做。 GROUPs创造了更难处理的行李。

  2. 您没有义务使用ALGEBRAIC来处理行李。相反,你可以写一个EVAL UDF。但是如果你的行李尺寸很大,它会慢得多。