如何在AWK中的两个表达式之间找到一个单词?

时间:2012-12-04 23:57:28

标签: regex text awk

我希望使用AWK从这样的html中获取名称:

span class="full-name" span class="given-name" John /span span class="family-name" Doe /span  /span 

所以我想从John之后切割Doe之后的部分以及姓氏来提取... "given-name"/span

你可以帮帮我吗?

1 个答案:

答案 0 :(得分:3)

我不确定您对<>符号的问题是怎么回事。据我了解,你的HTML看起来像这样:

<span class="full-name"><span class="given-name">John</span><span class="family-name">Doe</span></span>

您可以像这样使用GNU grep来获取所需的代码:

grep -oP '(?<=-name">)[^<]*' file

结果:

John
Doe