在JAVA

时间:2015-07-09 07:20:00

标签: apache-spark dataframe apache-spark-sql

我是新来的火花。我试图用UDF在spark数据帧上执行select语句,但我不能。我在java中编写代码而不是scala。

我的代码是:

DataFrame kafkaDF = sqlCtx.read().json("D:/Normalized/output_raw7.json");
kafkaDF .select("uid", "udftoconvert2long(bytesin)");

在上面的代码中如何编写我自己的udf,即udftoconvert2long

2 个答案:

答案 0 :(得分:0)

类似

object UDFs {
    def myUdf(bytesIn:String) : Long = ... 


}

然后sqlCtx.udf.register("udftoconvert2long",(bytesIn : String)=> UDFs.myUdf(bytesIn))

答案 1 :(得分:0)