如果多个模式匹配则打印多个字段

时间:2017-07-17 21:42:25

标签: bash awk grep

我有一个逗号分隔的文件,如下面的

0,category=a,type=b,value=1
1,category=c,type=b,.....,original_value=0
2,category=b,type=c,....,original_value=1,....,corrected_value=3

文件中的一行可以包含 (1)只有'价值' (2)只有'original_value' (3)'原始值'和'correct_value'

值可以在任何列中。

我编写的以下awk命令只能在模式匹配后打印一个字段。

cat file | awk -F, 'BEGIN{OFS=","} /value/ { for (x=1;x<=NF;x++) if ($x~"value") {print $2,$3,$(x)} }' | sort -u

当前输出

category=a,type=b,value=1
category=b,type=c,corrected_value=3
category=b,type=c,original_value=1
category=c,type=b,original_value=0

如果出现两个模式匹配,如何打印一行的两个字段(列)?在这种情况下,如果original_value和corrected_value都存在。

预期输出

category=a,type=b,value=1
category=b,type=c,original_value=1,corrected_value=3
category=c,type=b,original_value=0

Bash版本:4.3.11

2 个答案:

答案 0 :(得分:2)

您可以使用此awk命令:

awk 'BEGIN{FS=OFS=","} {printf "%s%s%s", $2,OFS,$3; for(i=4; i<=NF; i++)
     if ($i ~ /value/) printf "%s%s", OFS,$i; print ""}' file

category=a,type=b,value=1
category=c,type=b,original_value=0
category=b,type=c,original_value=1,corrected_value=3

答案 1 :(得分:2)

与@ anubhava的答案类似,但不依赖于特定列中的类别或类型:

 awk -F, '
    BEGIN { pattern = "^(category|type|value|original_value|corrected_value)" }
    {
        sep = ""
        for (i=1; i<=NF; i++) {
            if ($i ~ pattern) {
                printf "%s%s", sep, $i
                sep = ","
            }
        }
        print ""
    }
' file