hadoop hive udf失败了

时间:2014-01-22 17:55:25

标签: hadoop hive user-defined-functions

我写了以下UDF:

ISO8601ToHiveFormat.java:

package hiveudfs;

import org.apache.hadoop.hive.ql.exec.UDF;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;

public class ISO8601ToHiveFormat  extends UDF {

    public String hourFromISO8601(final String d){
        try{
            if( d == null )
                return null;
            SimpleDateFormat sdf1= new SimpleDateFormat("yyyy-MM-dd'T'HH:mm:ss'Z'");
            SimpleDateFormat sdf2 = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
            return sdf2.format(sdf1.parse(d)); 
        } catch (ParseException pe) {
            return null;
        }
    }
}

在我项目的src文件夹中,我运行了以下编译命令来编译它:

javac -cp /usr/lib/hive/lib/hive-exec-0.10.0-cdh4.3.0.jar  ISO8601ToHiveFormat.java

然后我把它装进一个罐子里

jar cf ../../HiveUDFs.jar hiveudfs/ISO8601ToHiveFormat.*

所以,然后我开始了蜂巢并做了:

hive> add jar /home/tom/Java/HiveUDFs.jar;
Added /home/tom/Java/HiveUDFs.jar to class path
Added resource: /home/tom/Java/HiveUDFs.jar
hive> create temporary function hourFromISO8601 as 'hiveudfs.ISO8601ToHiveFormat';
OK
Time taken: 0.083 seconds
hive> SELECT hourFromISO8601(logtimestamp) FROM mytable LIMIT 10;
FAILED: SemanticException [Error 10014]: Line 1:7 Wrong arguments 'logtimestamp': No matching method for class hiveudfs.ISO8601ToHiveFormat with (string). Possible choices: 
hive>

的输出
hive> describe mytable;
OK
...
logtimestamp    string
...

我在这里做错了什么?

2 个答案:

答案 0 :(得分:2)

toom - 你必须覆盖这个(评估)方法。然后只有UDF工作

    public class yourclassname extends UDF {

       public String **evaluate**(your args) {

         // your computation logic

         return your_result;
    }

}

答案 1 :(得分:0)

正如ramisetty.vijay所说,你需要覆盖evaluate()方法。请注意,您可以提供多种使用不同输入参数和返回类型进行求值的实现。