如果我在Pig中有一系列东西,就像这样:
datas = load './data.txt' using PigStorage( '\t');
list = load './frobdata.txt' using PigStorage();
我想将这些传递给UDF,就像这样:
register './enfrobinate.js' using javascript as frob;
frobbed = foreach datas generate flatten( frob.enfrobinate( list, $0 ) );
我似乎无法找到适用于将列表传递给javascript的原型,并且Pig文档在Javascript UDF的数据类型上并不是很清楚。
我知道猪的cross
。这不是我需要的东西(它给了我一个笛卡尔积。这是好的,除非我们开始获得非常大的列表。在这种情况下'列表'是几千个项目,数据是数百万个项目。)< / p>