背景
我编写了一个bash脚本,它从PostgreSQL数据库中提取简单的用户函数,使用awk将pgplsql命令转换为SQL(如PERFORM function()
到SELECT function()
,删除注释--.*
等) ,将SQL命令存储到文件(file.sql
)并在数据库中读取并执行它们:
$ psql ... -f file.sql db
函数很简单,主要是调用其他用户定义的函数。但是如何“评估”或处理IF
声明?:
IF $1 = 'customer1' THEN -- THESE $1 MEANS ARGUMENT TO PGPL/SQL FUNCTION
PERFORM subfunction1($1); -- THAT THIS IF STATEMENT IS IN:
ELSE -- SELECT function('customer1');
PERFORM subfunction2($1); -- $1 = 'customer1'
END IF;
铊; DR:
IF
s等不是SQL所以应该使用awk预先评估它们。可以安全地假设上面已经被处理成一条记录并删除了注释:
IF $1 = 'customer1' THEN PERFORM subfunction1($1); ELSE PERFORM subfunction2($1); END IF;
上述“评估”后应替换为:
SELECT subfunction1('customer1');
如果要评估它的awk:
$ awk -v arg1="customer1' -f program.awk file.sql
或arg1
是否为其他内容,例如customer2
:
SELECT subfunction2('customer2');
修改
当我醒来时, expr
首先出现在我脑海中:
$ awk -v arg="'customer1'" '
{
gsub(/\$1/,arg) # replace func arg with string
n=split($0,a,"(IF|THEN|ELSE|ELSE?IF|END IF;)",seps) # seps to get ready for SQL CASE
if(seps[1]=="IF") {
# here should be while for ELSEIF
c="expr " a[2]; c|getline r; close(c) # use expr to solve
switch (r) { # expr has 4 return values
case "1": # match
print a[3]
break
case "0": # no match
print a[4]
break
default: # (*) see below
print r
exit # TODO
} } }' file.sql
(*)expr
输出0,1,2或3:
$ expr 1 = 1
1
$ expr 1 = 2
0
但是,如果省略空格:
$ expr 1=1
1=1
答案 0 :(得分:1)
如果您没有编写完整的语言解析器,如果您正在寻找便宜又开朗的东西,那么这可能是一个不错的起点:
$ cat tst.awk
{ gsub(/\$1/,"\047"arg1"\047") }
match($0,/^IF\s+(\S+)\s+(\S+)\s+(\S+)\s+THEN\s+(\S+)\s+(\S+)\s+ELSE\s+(\S+)\s+(\S+)\s+END\s+IF/,a) {
lhs = a[1]
op = a[2]
rhs = a[3]
trueAct = (a[4] == "PERFORM" ? "SELECT" : a[4]) FS a[5]
falseAct = (a[6] == "PERFORM" ? "SELECT" : a[6]) FS a[7]
if (op == "=") {
print (lhs == rhs ? trueAct : falseAct)
}
}
$ awk -v arg1='customer1' -f tst.awk file
SELECT subfunction1('customer1');
$ awk -v arg1='bob' -f tst.awk file
SELECT subfunction2('bob');
以上使用GNU awk为第3个arg匹配()。希望它很容易理解你可以根据需要按摩来处理这种结构的其他构造或其他变体。