生成新元组时,Pig UDF抛出NullPointerException

时间:2016-11-01 03:21:12

标签: java nullpointerexception apache-pig udf pig-udf

我有一个Pig UDF,它会摄取一些数据,然后尝试以最小的方式转换这些数据。

my_data = LOAD 'path/to/data' USING SomeCustomLoader();
my_other_data = FOREACH my_data GENERATE MyUDF(COL_1, COL_2, $param1, $param2) as output;
my_final_data = FOREACH my_other_data GENERATE output.NEW_COL1, output.NEW_COL2, output.NEW_COL3;

但是,我一直收到以下错误:

  

错误0:执行时出现异常[POUserFunc(名称:POUserFUnc(udf.MyUDF)[tuple] - scope-38运算符键:scope-38)children:[]处的null:java.lang.NullPointerException

我的UDF获取数据并对其进行转换:

public class MyUDF extends EvalFunc<Tuple> {
    public Tuple exec(Tuple input) throws IOException {
        if (input == null || input.size() == 0)
            return null;

        TupleFactory _factory;

        Long fieldOne;
        String fieldTwo;
        String fieldThree;

        _factory.getInstance();

        try {
            fieldOne = Long.valueOf(input.get(0).toString());
            fieldTwo = input.get(1).toString();
            fieldThree = input.get(2).toString();

            fieldOne = doSomething(fieldOne);
            fieldTwo = doSomething(fieldTwo);
            fieldThree = doSomething(fieldThree);

            return _factory.newTuple(Arrays.asList(fieldOne, fieldTwo, fieldThree));

        } catch (Exception ex) {
            return _factory.newTuple(Arrays.asList("ParseException", "", "", ""));
        }
    }
}

在调用元组工厂之前,我已经调试并确认fieldOne,fieldTwo和fieldThree 确实存在。它还清楚表明异常被抛出,因为代码到达catch块然后抛出此NullPointerException错误。

目前尚不清楚为什么会发生这种情况。

根据Pig文档(Pig 0.14.0 API),我应该可以使用相关项目致电newTuple(java.util.List c)

我还定义了自己的Schema,以确保在返回pig脚本时类型是正确的。

1 个答案:

答案 0 :(得分:0)

有问题的代码没有实例化你的元组实例,因此你不能在不存在的对象上调用该方法。

public class ... {
    TupleFactory _factory;
    public Tuple exec(Tuple input) {
        _factory = TupleFactory.getInstance();
        ...
    }
}