使用awk-pattern +算术条件进行多重搜索

时间:2017-04-20 12:06:16

标签: linux shell awk

我正在尝试使用awk命令执行多次搜索以从日志文件中获取记录,并在以下两个条件下匹配:

  1. pattern - EXEC_TIME
  2. 最后一列,即具有EXEC_TIME> 5000毫秒。
  3. 我试过并使用下面的命令,但它没有给我正确的输出,不确定是否可以使用相同的方式!

    我只是在学习awk所以任何帮助都会受到赞赏。

    awk -F ':' '/EXEC_TIME/&&$15>="5000"{print $2,$15}' TransactionInfoLogs.log
    
    MP170420.0548.T00003[SERV] 9065 ms
    OC170420.0655.T00001[SERV] 708 ms
    

    以下是示例日志文件:

    [TXN_ID]:MP170420.0548.T00003[SERV][SERV]:BLKSRVREQ[MSISDN]:8028359017[SV_CHRG_ID]:37152[RESP_CODE]:200[START]:Thu Apr 20 12:44:23 WAT 2017 [END]:Thu Apr 20 12:44:23 WAT 2017[EXEC_TIME]:9065 ms
    [TXNID]:XX170420.1244.C01465[TYPE]:SERVICE_CHARGE_PAYER_PAYEE[AMT]:0[PR_MSISDN]:8028359017[PR_MFS]:101[PR_W_TYPE]:12[PR_PREBAL]:0[PR_BAL]:0[PY_MSISDN]:IND03[PY_MFS]:101[PY_W_TYPE]:null[PY_PRE
    BAL]:2782239[PY_BAL]:2782239
    [2017-04-20 12:44:29,552][http-bio-172.24.87.5-7890-exec-7365]- 
    [TXN_ID]:XX170420.1244.C01467[SERV]:null[MSISDN]:8080967233[RESP_CODE]:00066[START]:Thu Apr 20 12:44:29 WAT 2017 [END]:Thu Apr 20 12:44:29 WAT 2017[EXEC_TIME]:9 ms
    [2017-04-20 12:44:36,634][http-bio-172.24.87.5-7890-exec-7364]- 
    [TXN_ID]:OC170420.0655.T00001[SERV]:null[MSISDN]:7016532415[RESP_CODE]:00066[START]:Thu Apr 20 12:44:36 WAT 2017 [END]:Thu Apr 20 12:44:36 WAT 2017[EXEC_TIME]:708 ms
    [2017-04-20 12:44:45,820][http-bio-172.24.87.5-7890-exec-7359]- 
    [TXN_ID]:XX170420.1244.C01471[SERV]:null[MSISDN]:8026136275[RESP_CODE]:00066[START]:Thu Apr 20 12:44:45 WAT 2017 [END]:Thu Apr 20 12:44:45 WAT 2017[EXEC_TIME]:39 ms
    [2017-04-20 12:44:46,010][http-bio-172.24.87.5-7890-exec-7366]- 
    [TXN_ID]:XX170420.1244.C01473[SERV]:BLKSRVREQ[MSISDN]:8127459541[SV_CHRG_ID]:37152[RESP_CODE]:200[START]:Thu Apr 20 12:44:45 WAT 2017 [END]:Thu Apr 20 12:44:46 WAT 2017[EXEC_TIME]:221 ms
    [TXNID]:XX170420.1244.C01473[TYPE]:SERVICE_CHARGE_PAYER_PAYEE[AMT]:0[PR_MSISDN]:8127459541[PR_MFS]:101[PR_W_TYPE]:12[PR_PREBAL]:0[PR_BAL]:0[PY_MSISDN]:IND03[PY_MFS]:101[PY_W_TYPE]:null[PY_PRE
    BAL]:2853870[PY_BAL]:2853870
    [2017-04-20 12:44:49,989][http-bio-172.24.87.5-7890-exec-7371]- 
    [TXN_ID]:XX170420.1244.C01475[SERV]:BLKSRVREQ[MSISDN]:8089138902[SV_CHRG_ID]:37152[RESP_CODE]:200[START]:Thu Apr 20 12:44:49 WAT 2017 [END]:Thu Apr 20 12:44:49 WAT 2017[EXEC_TIME]:57 ms
    [TXNID]:XX170420.1244.C01475[TYPE]:SERVICE_CHARGE_PAYER_PAYEE[AMT]:0[PR_MSISDN]:8089138902[PR_MFS]:101[PR_W_TYPE]:12[PR_PREBAL]:0[PR_BAL]:0[PY_MSISDN]:IND03[PY_MFS]:101[PY_W_TYPE]:null[PY_PRE
    BAL]:3071459[PY_BAL]:3071459
    

1 个答案:

答案 0 :(得分:1)

每当你在输入文件中有name->值映射时,最好首先创建一个映射数组(下面是n2v[]),然后你可以通过它引用每个字段&# 39;的名字而不是它的位置,例如:

$ cat tst.awk
{
    delete n2v
    while ( match($0,/\[[^]]+]:/) ) {
        if ( name != "" ) {
            value = substr($0,1,RSTART-1)
            sub(/\[.*/,"",value)
            n2v[name] = value
        }
        name = substr($0,RSTART+1,RLENGTH-3)
        $0 = substr($0,RSTART+RLENGTH)
    }
    value = $0
    n2v[name] = value

    for (name in n2v) {
        value = n2v[name]
        print name, "->", value
    }
}

$ head -1 file | awk -f tst.awk
EXEC_TIME -> 9065 ms
START -> Thu Apr 20 12:44:23 WAT 2017
RESP_CODE -> 200
SV_CHRG_ID -> 37152
TXN_ID -> MP170420.0548.T00003
END -> Thu Apr 20 12:44:23 WAT 2017
MSISDN -> 8028359017
SERV -> BLKSRVREQ

然后你可以调整上面的内容来做你想做的事情:

$ cat tst.awk
{
    delete n2v
    while ( match($0,/\[[^]]+]:/) ) {
        if ( name != "" ) {
            value = substr($0,1,RSTART-1)
            sub(/\[.*/,"",value)
            n2v[name] = value
        }
        name = substr($0,RSTART+1,RLENGTH-3)
        $0 = substr($0,RSTART+RLENGTH)
    }
    value = $0
    n2v[name] = value
}

n2v["EXEC_TIME"]+0 > 5000 { print n2v["TXN_ID"], n2v["EXEC_TIME"] }

$ awk -f tst.awk file
MP170420.0548.T00003 9065 ms