我想将一个袋子传递给UDF。
我有这个数据结构,其所有元素都是两个包(arg
和x
)的元组(y
):
data:{arg: (x: {(a: int,b: int,)},y: {(a: int,b: int)})}
然后,我写了一个UDF:
public class MyUDF extends EvalFunc<String> {
public String exec(Tuple input) throws IOException {
if(input == null || input.size() == 0)
return "empty";
try{
DataBag ref_regions = (DataBag)input.get(0);
return "OK";
}catch(Exception e){
System.err.println(e.getMessage());
return null;
}
}
}
我在PigLatin脚本中调用它,如下所示:
res = foreach data generate MyUDF(arg);
不幸的是我收到了这个错误:
org.apache.pig.data.BinSedesTuple cannot be cast to org.apache.pig.data.DataBag
由catch
语句打印。
你可以帮我解决这个问题吗?
答案 0 :(得分:0)
你在跑什么版本的猪? 这是0.8.1 https://issues.apache.org/jira/browse/PIG-1895之前的问题 通常在从您创建的测试文件中读取时调用BinSedes - 我建议将元组输入更改为UDF中的DataBag输入。