我希望使用AWK从这样的html中获取名称:
span class="full-name" span class="given-name" John /span span class="family-name" Doe /span /span
所以我想从John
之后切割Doe
之后的部分以及姓氏来提取... "given-name"
和/span
。
你可以帮帮我吗?
答案 0 :(得分:3)
我不确定您对<
和>
符号的问题是怎么回事。据我了解,你的HTML看起来像这样:
<span class="full-name"><span class="given-name">John</span><span class="family-name">Doe</span></span>
您可以像这样使用GNU grep
来获取所需的代码:
grep -oP '(?<=-name">)[^<]*' file
结果:
John
Doe