打印包含特定字符串的两个模式之间的所有行

时间:2013-06-26 19:45:03

标签: bash shell scripting awk

我试图用这种模式打印两种不同模式之间存在的任何文本。但只有在包含特定字符串的模式之间的文本[使用awk,flag ...]。

我的输入文件:

START 12.5 elephant dasnbjdai adfad
      s = ad cat da 524a das
      da 54e dog dada 455ad7
      da 45d cow 554s7e
END
START fjs 4 rhino das 452 da
      da = cat da gd 
      das_d pig das 
      4524s dda monkey dasdc4
END 
START da dfsdg cow
      bear dac45
      lion bla bla 
      5as4 fox bla fa jsa
END
START dandsk cow  dada
      bla sheep bla
      fsgv turtle fsd
      da dragon da
END
START
      daadas pig fsv45 
      dasd walrus das 52
END

我的输出应该是[只显示START ... END之间的行,但是包含cat]

START 12.5 elephant dasnbjdai adfad
      s = ad **cat** da 524a das
      da 54e dog dada 455ad7
      da 45d cow 554s7e
END
START fjs 4 rhino das 452 da
      da = **cat** da gd 
      das_d pig das 
      4524s dda monkey dasdc4
END 

我怎么打印,即包含龙和海象的所有行;

输出

START dandsk cow  dada
      bla sheep bla
      fsgv turtle fsd
      da dragon da
END
START
      daadas pig fsv45 
      dasd walrus das 52
END

2 个答案:

答案 0 :(得分:2)

awk的一种方式:

awk -v RS="END" '$0~/cat/{print $0 RS}' input 

对于第二种情况:

awk -v RS="END" '$0~/walrus|dragon/{print $0 RS}' input 

如果您之间不想要空行:

awk 'BEGIN{RS="END";ORS=""}$0~/dragon|walrus/{print $0 RS}END{print "\n"}' input

答案 1 :(得分:0)

使用GNU awk(将RS设置为多个字符):

$ gawk 'BEGIN{RS=ORS="\nEND\n"} /dragon|walrus/' file
START dandsk cow  dada
      bla sheep bla
      fsgv turtle fsd
      da dragon da
END
START
      daadas pig fsv45
      dasd walrus das 52
END

或:

$ awk -v re="dragon|walrus" 'BEGIN{RS=ORS="\nEND\n"} $0~re' file
START dandsk cow  dada
      bla sheep bla
      fsgv turtle fsd
      da dragon da
END
START
      daadas pig fsv45
      dasd walrus das 52
END