Pig传递关系作为UDF的参数

时间:2015-01-19 11:26:08

标签: java hadoop apache-pig

我需要将关系传递给PIG中的UDF

 articles = load x using ...;
 groupedArticles = udfs.MyUDF(articles);

这样的事情可能吗?任何解决方法?

感谢

1 个答案:

答案 0 :(得分:2)

我猜你的意思是将关系的所有字段传递给UDF?传递这种关系是没有意义的。在任何情况下,这取决于您的加载语句的样子。如果你将每个条目作为元组load x using ... as (entry:(a:int, b:chararray, ...))加载,而不是像groupedArticles = foreach articles generate udfs.MyUDF(entry)那样将它传递给UDF。将整行作为元组传递可能是最通用的方法,你必须处理一个通用元组你的UDF。