在SnowFlake中SQL UDF与Javascript UDF的性能

时间:2018-05-21 08:38:08

标签: user-defined-functions snowflake-datawarehouse snowflake

我们正在尝试在Snowflake中实现间隔值的添加。由于Snowflake中不支持间隔数据类型,因此我们尝试使用UDF实现相同的间隔数据类型。我们将间隔转换为秒,在获得总秒数之后,我们将总秒数转换为所需的目标间隔类型。

我们使用SQL UDF和Javascript UDF实现了相同的逻辑。

  

Javascript UDF

    create or replace function js_interval(interval_1 string, interval_sign_1 double, interval_2 string, interval_sign_2 double)
  returns string
  language javascript
  strict
  as '     
  if ((INTERVAL_1.substring(0,1)=="-"))
  {
    var res = INTERVAL_1.split(":");
    var res2=(res[1]*-60+res[0]*3600);
    var res3= -1*res[2];
  }
  else
  {
    var res = INTERVAL_1.split(":");
    var res2=(res[1]*60+res[0]*3600);
    var res3= res[2];
  }
  if ((INTERVAL_2.substring(0,1)=="-"))
  {
     var res11 = INTERVAL_2.split(":");
     var res22=(res11[1]*-60+res11[0]*3600);
     var res33= -1*res11[2];
  }
  else
  {
     var res11 = INTERVAL_2.split(":");
     var res22=(res11[1]*60+res11[0]*3600);
     var res33= res11[2];
  }
  if(INTERVAL_SIGN_1 > 0)
  { 
    var result1= res2*1+res3*1;
  }
  else
  {
    var result1=(res2*1+res3*1)*-1;
  }
  if(INTERVAL_SIGN_2 > 0)
  { 
    var result2= res22*1+res33*1;
  }
  else
  {
    var result2=(res22*1+res33*1)*-1;
  }
  var final_sec= result1+result2;

  if (final_sec < 0 )
  {
    return "-"+String(Math.trunc(Math.abs(final_sec)/3600))+":"+String(Math.trunc(Math.abs(final_sec)/60)%60)+":"+String(Math.abs(final_sec)%60);
  }    
  else
  {
    return String(Math.trunc(Math.abs(final_sec)/3600))+":"+String(Math.trunc(Math.abs(final_sec)/60)%60)+":"+String(Math.abs(final_sec)%60);
  }
';
  

SQL UDF

 create or replace function addIntervalsH2S ( interval_1 varchar, interval_type_1 varchar , interval_sign_1 int, interval_2 varchar, interval_type_2 varchar, interval_sign_2 int )
  returns varchar 
  as
  'select trunc((((split_part(interval_1,\':\',1)*3600+split_part(interval_1,\':\',2)*60+split_part(interval_1,\':\',3))*interval_sign_1)+((split_part(interval_2,\':\',1)*3600+split_part(interval_2,\':\',2)*60+split_part(interval_2,\':\',3))*interval_sign_2))/3600)||\':\'||mod(trunc((((split_part(interval_1,\':\',1)*3600+split_part(interval_1,\':\',2)*60+split_part(interval_1,\':\',3))*interval_sign_1)+((split_part(interval_2,\':\',1)*3600+split_part(interval_2,\':\',2)*60+split_part(interval_2,\':\',3))*interval_sign_2))/60),60)||\':\'||mod((((split_part(interval_1,\':\',1)*3600+split_part(interval_1,\':\',2)*60+split_part(interval_1,\':\',3))*interval_sign_1)+((split_part(interval_2,\':\',1)*3600+split_part(interval_2,\':\',2)*60+split_part(interval_2,\':\',3))*interval_sign_2)),60)
  end';                

基于Javascript的UDF对嵌套级别间隔添加查询的性能优于基于SQL的UDF。

导致巨大性能差异的原因可能是什么?

1 个答案:

答案 0 :(得分:0)

我们已经在SQL中发现了子查询的问题,即使在简单的查询中也是如此,例如

SELECT (SELECT expression1) + (SELECT expression2)

两个子查询都被评估为单独的执行“步骤”(除非expression1/2非常简单)。每个“步骤”就像一个完整的单独查询,使其变慢。

由于SQL UDF在内部展开为子查询,因此每次调用以SELECT开头的SQL UDF都会使用额外的步骤进行评估,从而使其显着变慢。

解决方案?尝试从SQL UDF的开头删除SELECT关键字,这应该会更快。这类似于将上述查询重写为

SELECT (expression1) + (expression2)