在模式之间提取两种模式之间的文本

时间:2017-03-09 18:42:23

标签: regex text awk sed grep

考虑java -jar plantuml.jar -language的输出:

;type
;26
abstract
actor

............................

;color
;147
AliceBlue
AntiqueWhite
Aqua
Aquamarine
............................
Wheat
White
WhiteSmoke
Yellow
YellowGreen

;EOF

我需要从文本中提取颜色而不包含字符串。我已经阅读了几篇文章和Q& As并没有找到答案。在这里,我找到了most suitable答案。

$ java -jar plantuml.jar -language | sed -n '/\;color/,/\n\n/{/color/!{/\n\n/!p}}'
;147
AliceBlue
AntiqueWhite
Aqua
Aquamarine
Azure
Beige
Bisque
....................
Teal
Thistle
Tomato
Turquoise
Violet
Wheat
White
WhiteSmoke
Yellow
YellowGreen

;EOF

有一个小的细微差别:;147可以是任何其他值,EOF可以随时更改为其他值。我试过了sed -n '/\;color\s*\;\d*/,/\n\n/,但它没有返回任何内容。请帮助我实现下一个结果:

AliceBlue
AntiqueWhite
Aqua
Aquamarine
Azure
Beige
Bisque
....................
Teal
Thistle
Tomato
Turquoise
Violet
Wheat
White
WhiteSmoke
Yellow
YellowGreen

2 个答案:

答案 0 :(得分:2)

声音就像你需要的一样:

awk '/^;/{if (/[[:alpha:]]/) f=(/color/?1:0); next} f'

答案 1 :(得分:1)

使用sed删除不以;开头的模式之间的所有行:

sed -n '/^;color/,/^;EOF/{/;/d;p}' file

删除最后一个空行:

sed -n '/^;color/,/^;EOF/{/;/d;/^$/d;p}' file

或使用GNU sed:

sed -n '/^;color/,/^;EOF/{/^;\|^$/d;p}' file