如何评估或处理数据中的if语句?

时间:2017-04-25 15:29:32

标签: awk gawk

背景

我编写了一个bash脚本,它从PostgreSQL数据库中提取简单的用户函数,使用awk将pgplsql命令转换为SQL(如PERFORM function()SELECT function(),删除注释--.*等) ,将SQL命令存储到文件(file.sql)并在数据库中读取并执行它们:

$ psql ... -f file.sql db

函数很简单,主要是调用其他用户定义的函数。但是如何“评估”或处理IF声明?:

IF $1 = 'customer1' THEN      -- THESE $1 MEANS ARGUMENT TO PGPL/SQL FUNCTION
  PERFORM subfunction1($1);   -- THAT THIS IF STATEMENT IS IN:
ELSE                          -- SELECT function('customer1'); 
  PERFORM subfunction2($1);   -- $1 = 'customer1'
END IF;

铊; DR:

IF s等不是SQL所以应该使用awk预先评估它们。可以安全地假设上面已经被处理成一条记录并删除了注释:

IF $1 = 'customer1' THEN PERFORM subfunction1($1); ELSE PERFORM subfunction2($1); END IF;

上述“评估”后应替换为:

SELECT subfunction1('customer1');

如果要评估它的awk:

$ awk -v arg1="customer1' -f program.awk file.sql

arg1是否为其他内容,例如customer2

SELECT subfunction2('customer2');

修改

当我醒来时,

expr首先出现在我脑海中:

$ awk -v arg="'customer1'" '
{
    gsub(/\$1/,arg)                                     # replace func arg with string
    n=split($0,a,"(IF|THEN|ELSE|ELSE?IF|END IF;)",seps) # seps to get ready for SQL CASE
    if(seps[1]=="IF") {
        # here should be while for ELSEIF
        c="expr " a[2]; c|getline r; close(c)           # use expr to solve 
        switch (r) {                                    # expr has 4 return values
        case "1":                                       # match
            print a[3]
            break
        case "0":                                       # no match
            print a[4]
            break
        default:                                        # (*) see below
            print r
            exit                                        # TODO
}   }   }' file.sql

(*)expr输出0,1,2或3:

$ expr 1 = 1
1
$ expr 1 = 2
0

但是,如果省略空格:

$ expr 1=1
1=1

1 个答案:

答案 0 :(得分:1)

如果您没有编写完整的语言解析器,如果您正在寻找便宜又开朗的东西,那么这可能是一个不错的起点:

$ cat tst.awk
{ gsub(/\$1/,"\047"arg1"\047") }
match($0,/^IF\s+(\S+)\s+(\S+)\s+(\S+)\s+THEN\s+(\S+)\s+(\S+)\s+ELSE\s+(\S+)\s+(\S+)\s+END\s+IF/,a) {
    lhs = a[1]
    op  = a[2]
    rhs = a[3]
    trueAct  = (a[4] == "PERFORM" ? "SELECT" : a[4]) FS a[5]
    falseAct = (a[6] == "PERFORM" ? "SELECT" : a[6]) FS a[7]

    if (op == "=") {
        print (lhs == rhs ? trueAct : falseAct)
    }
}

$ awk -v arg1='customer1' -f tst.awk file
SELECT subfunction1('customer1');

$ awk -v arg1='bob' -f tst.awk file
SELECT subfunction2('bob');

以上使用GNU awk为第3个arg匹配()。希望它很容易理解你可以根据需要按摩来处理这种结构的其他构造或其他变体。