模式匹配和选择打印数字

时间:2015-03-17 05:36:31

标签: awk gawk

我有一个包含许多列的长行文件,每列的标题都是这样的。

BMR_22@O15-BMR_1@O23-H23 BMR_14@O22-BMR_1@O26-H26 BMR_14@O14-BMR_1@O26-H26 BMR_14@O12-BMR_1@O16-H16 BMR_17@O26-BMR_2@O24-H24 BMS_88@O22-BMR_4@O22-H22 BMS_89@O22-BMR_4@O26-H26 BMS_89@O12-BMR_4@O12-H12 BMR_15@O25-BMR_15@O26-H26 BMS_96@O25-BMR_5@O16-H16 BMR_13@O23-BMR_6@O26-H26 BMR_27@O22-BMR_126@O12-H12 BMR_17@O26-BMR_6@O13-H13 BMR_26@O26-BMR_6@O16-H16 BMR_29@O26-BMR_7@O16-H16 BMS_86@O23-BMR_19@O26-H26 BMS_78@O16-BMR_9@O16-H16 BMS_96@O24-BMR_10@O23-H23 BMR_14@O25-BMR_11@O24-H24 BMS_90@O22-BMR_11@O26-H26 BMR_25@O13-BMR_11@O12-H12 BMR_120@O24-BMR_11@O13-H13 BMR_25@O22-BMR_11@O13-H13 BMS_65@O24-BMR_12@O23-H23 BMR_31@O11-BMR_12@O12-H12

我想根据一些标准选择列。 如果使用如下命令:

awk 'NR==1{for (i=1;i<=NF;i++) if ($i~/^BMR_[1-9]@O13-BMR/) print $i } ' inPutFile

我得到类似的东西:

BMR_1@O13-BMR_14@O13-H13
BMR_2@O13-BMR_16@O13-H13
BMR_6@O13-BMR_27@O23-H23
BMR_2@O13-BMR_16@O12-H12
BMR_1@O13-BMR_30@O26-H26
BMR_1@O13-BMR_11@O23-H23
BMR_1@O13-BMR_14@O22-H22
BMR_6@O13-BMR_27@O22-H22

如果我使用如下命令:

awk 'NR==1{for (i=1;i<=NF;i++) if ($i~/^BMR_[1-9][1-9]@O13-BMR/) print $i } ' inPutFile

我得到如下输出:

BMR_25@O13-BMR_11@O12-H12
BMR_26@O13-BMR_25@O12-H12
BMR_17@O13-BMR_27@O13-H13
BMR_64@O13-BMR_39@O12-H12
BMR_58@O13-BMR_44@O16-H16
BMR_36@O13-BMR_61@O12-H12
BMR_36@O13-BMR_61@O13-H13

如果我想同时选择单个和两个数字(例如 BMR_2 @ O13-BMR_16 @ O12-H12和 BMR_26 @ O13-BMR_25,那么该命令可能是什么? @ O12-H12)一次性运行?

1 个答案:

答案 0 :(得分:1)

您可以在单个awk命令中将重复指定为1或2,如下所示:

awk --posix 'NR==1{for (i=1;i<=NF;i++) if ($i~/^BMR_[1-9]{1,2}@O13-BMR/) print $i } ' inPutFile