我正在努力优化当前作为UDF传递的自定义函数。我们通过如下所示的格式可配置地进行转换,因此无法按设置显式编码转换逻辑。
transforms: [
{col: "id", expr: """ cast(someCustomFunction(aColumn) as string) """}
{col: "date", expr: """ date_format(cast(unix_timestamp(someColumn, "yyyyMMddHHmmss") as Timestamp), "yyyyMMdd") """}
],
我已经注册了someCustomFunction,但是由于Spark黑盒UDF,我想通过某种方式不将其创建为UDF来优化此功能。我想知道实现此目标(然后安静地睡觉)的最佳方法是什么:
我已经努力解决了3天,因此任何帮助(最好是提供代码示例)都将是一个巨大的Karmic果仁巧克力蛋糕。