使用awk进行字符串模式匹配

时间:2013-10-25 10:26:53

标签: regex linux bash awk gawk

(没有更好的标题)

我正在尝试转换许多行,例如:

#define GENERIC_TYPE_METER_PULSE                     0x30 /*Pulse Meter*/
#define SPECIFIC_TYPE_NOT_USED                       0x00 /*Specific Device Class not used*/
......
#define MFG_ID_WAYNE_DALTON                          0x0008   //Wayne Dalton
#define MFG_ID_WILSHINE_HOLDING_CO_LTD               0x012D   //Wilshine Holding Co., Ltd
#define MFG_ID_WIDOM                                 0x0149   //wiDom
......
#define COMMAND_CLASS_ALARM                              0x71
#define COMMAND_CLASS_ALARM_V2                           0x71
#define COMMAND_CLASS_NOTIFICATION_V3                    0x71
#define COMMAND_CLASS_NOTIFICATION_V4                    0x71

在文件(c ++)中类似于这些(对于Java):

SPECIFIC_TYPE_NOT_USED((byte)0x00)             /*Specific Device Class not used*/
MFG_ID_WILSHINE_HOLDING_CO_LTD((byte)0x012D)   //Wilshine Holding Co., Ltd
COMMAND_CLASS_ALARM((byte)0x71)
....

我想出了这个:

gawk '/^#define/ && / [[:xdigit:]]/ { printf "%s((byte)%s)\n",$2,$3 }'

但有两个问题 - 它不适用于awk;需要GNU-awk(gawk),我还需要输出中的行尾注释。我怎样才能做到这一点?我对使用awk特别感兴趣,但也可以使用sed。干杯!!

3 个答案:

答案 0 :(得分:3)

你可以使用这个awk one-liner:

awk '$1=="#define" && $3~/[0-9]+$/{printf "%s((byte)%s)", $2, $3; $1=$2=$3=""; print}' file

编辑:这是一个awk,您可以尝试更好地协调评论:

awk '$1 == "#define" && $3 ~ /[0-9]+$/{s=sprintf("%s((byte)%s)", $2, $3); $1=$2=$3="";
     printf("%-50s\t%s\n", s, $0)}'

<强>输出:

GENERIC_TYPE_METER_PULSE((byte)0x30)                      /*Pulse Meter*/
SPECIFIC_TYPE_NOT_USED((byte)0x00)                        /*Specific Device Class not used*/
MFG_ID_WAYNE_DALTON((byte)0x0008)                         //Wayne Dalton
MFG_ID_WIDOM((byte)0x0149)                                //wiDom
COMMAND_CLASS_ALARM((byte)0x71)                           
COMMAND_CLASS_ALARM_V2((byte)0x71)                        
COMMAND_CLASS_NOTIFICATION_V3((byte)0x71)                 
COMMAND_CLASS_NOTIFICATION_V4((byte)0x71)      

答案 1 :(得分:2)

一个sed解决方案,我刚刚测试了一次,所以首先测试一些案例

[[bash_prompt$]]$ cat log; echo "########";sed -e 's/#define \([^ ]*\)[ ]*\([^ ]*\)/\1((byte)\2)/g' log
#define GENERIC_TYPE_METER_PULSE                     0x30 /*Pulse Meter*/
#define SPECIFIC_TYPE_NOT_USED                       0x00 /*Specific Device Class not used*/
#define MFG_ID_WAYNE_DALTON                          0x0008   //Wayne Dalton
#define MFG_ID_WILSHINE_HOLDING_CO_LTD               0x012D   //Wilshine Holding Co., Ltd
#define MFG_ID_WIDOM                                 0x0149   //wiDom
#define COMMAND_CLASS_ALARM                              0x71
#define COMMAND_CLASS_ALARM_V2                           0x71
#define COMMAND_CLASS_NOTIFICATION_V3                    0x71
#define COMMAND_CLASS_NOTIFICATION_V4                    0x71
########
GENERIC_TYPE_METER_PULSE((byte)0x30) /*Pulse Meter*/
SPECIFIC_TYPE_NOT_USED((byte)0x00) /*Specific Device Class not used*/
MFG_ID_WAYNE_DALTON((byte)0x0008)   //Wayne Dalton
MFG_ID_WILSHINE_HOLDING_CO_LTD((byte)0x012D)   //Wilshine Holding Co., Ltd
MFG_ID_WIDOM((byte)0x0149)   //wiDom
COMMAND_CLASS_ALARM((byte)0x71)
COMMAND_CLASS_ALARM_V2((byte)0x71)
COMMAND_CLASS_NOTIFICATION_V3((byte)0x71)
COMMAND_CLASS_NOTIFICATION_V4((byte)0x71)
[[bash_prompt$]]$

对于正确的格式,(在我看来,它正在对齐评论),我无法提出任何sed解决方案,(我对其感兴趣)这里是{{1}解决方案(看起来有点笨拙,但自我解释..

awk

答案 2 :(得分:2)

$ cat tst.awk
/^#/ {
    hd[++nr] = sprintf("%s((byte)%s)", $2, $3)
    lgth = length(hd[nr])
    maxLgth = (lgth > maxLgth ? lgth : maxLgth)

    sub(/[^/]+/,"")
    tl[nr] = $0
}

END {
    for (i=1; i<=nr; i++)
        printf "%-*s%s\n", maxLgth+2, hd[i], tl[i]
}
$ awk -f tst.awk file
GENERIC_TYPE_METER_PULSE((byte)0x30)          /*Pulse Meter*/
SPECIFIC_TYPE_NOT_USED((byte)0x00)            /*Specific Device Class not used*/
MFG_ID_WAYNE_DALTON((byte)0x0008)             //Wayne Dalton
MFG_ID_WILSHINE_HOLDING_CO_LTD((byte)0x012D)  //Wilshine Holding Co., Ltd
MFG_ID_WIDOM((byte)0x0149)                    //wiDom
COMMAND_CLASS_ALARM((byte)0x71)
COMMAND_CLASS_ALARM_V2((byte)0x71)
COMMAND_CLASS_NOTIFICATION_V3((byte)0x71)
COMMAND_CLASS_NOTIFICATION_V4((byte)0x71)

2中的maxLgth+2更改为您想要的最长值与相关评论之间的间距。