自动增量UDF在配置单元中工作但在Impala中返回null

时间:2015-04-06 20:09:38

标签: java impala udf

我创建了一个创建自动增量值的java函数,我还基于这个函数创建了一个hive UDF,它在hive中运行得很好。我基于此函数创建了一个Impala UDF,它返回'null'而不是auto incremental integer。

这是java UDF代码:

import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.hive.ql.udf.UDFType;

@UDFType(stateful = true)
public class AutoIncrementUDF extends UDF {

    int ctr;

    public int evaluate() {
        ctr++;
        return ctr;
    }
}

创建Hive UDF:

create function autoincr as 'AutoIncrementUDF';

创建Impala UDF:

create function autoincr() returns int LOCATION '/user/acombs/AutoIncrementUDF.jar' symbol='AutoIncrementUDF';

在Hive和Impala中使用它:

select  autoincr() as testkey, * from mapfund 

非常感谢任何帮助! 谢谢 , 安娜

1 个答案:

答案 0 :(得分:2)

不幸的是,Impala不支持@UDFType注释或有状态Hive UDF的概念。我们将在文档中添加注释以使此限制已知。

但是,如果您尝试返回行号,则可以使用ROW_NUMBER()等分析窗口函数。

例如,

> select ROW_NUMBER() over (order by int_col) as testkey, int_col, float_col from alltypestiny;
+---------+---------+-------------------+
| testkey | int_col | float_col         |
+---------+---------+-------------------+
| 1       | 0       | 0                 |
| 2       | 0       | 0                 |
| 3       | 0       | 0                 |
| 4       | 0       | 0                 |
| 5       | 1       | 1.100000023841858 |
| 6       | 1       | 1.100000023841858 |
| 7       | 1       | 1.100000023841858 |
| 8       | 1       | 1.100000023841858 |
+---------+---------+-------------------+
Fetched 8 row(s) in 0.12s

有关详细信息,请参阅Impala Analytic Functions