我创建了一个创建自动增量值的java函数,我还基于这个函数创建了一个hive UDF,它在hive中运行得很好。我基于此函数创建了一个Impala UDF,它返回'null'而不是auto incremental integer。
这是java UDF代码:
import org.apache.hadoop.hive.ql.exec.UDF;
import org.apache.hadoop.hive.ql.udf.UDFType;
@UDFType(stateful = true)
public class AutoIncrementUDF extends UDF {
int ctr;
public int evaluate() {
ctr++;
return ctr;
}
}
创建Hive UDF:
create function autoincr as 'AutoIncrementUDF';
创建Impala UDF:
create function autoincr() returns int LOCATION '/user/acombs/AutoIncrementUDF.jar' symbol='AutoIncrementUDF';
在Hive和Impala中使用它:
select autoincr() as testkey, * from mapfund
非常感谢任何帮助! 谢谢 , 安娜
答案 0 :(得分:2)
不幸的是,Impala不支持@UDFType
注释或有状态Hive UDF的概念。我们将在文档中添加注释以使此限制已知。
但是,如果您尝试返回行号,则可以使用ROW_NUMBER()
等分析窗口函数。
例如,
> select ROW_NUMBER() over (order by int_col) as testkey, int_col, float_col from alltypestiny;
+---------+---------+-------------------+
| testkey | int_col | float_col |
+---------+---------+-------------------+
| 1 | 0 | 0 |
| 2 | 0 | 0 |
| 3 | 0 | 0 |
| 4 | 0 | 0 |
| 5 | 1 | 1.100000023841858 |
| 6 | 1 | 1.100000023841858 |
| 7 | 1 | 1.100000023841858 |
| 8 | 1 | 1.100000023841858 |
+---------+---------+-------------------+
Fetched 8 row(s) in 0.12s
有关详细信息,请参阅Impala Analytic Functions。