我需要帮助从文件中提取XML字符串,如下所示:
<line>
<Start_Time>2016-May-18 17.06.17.504</Start_Time>
<Domain>pciereg062</Domain>
<Injected_tags>
before xml started ; AUTOMATIC-REPRODUCTION-stopped on barrier ;
</Injected_tags>
</line>
<line>
<Start_Time>2016-May-18 17.08.53.585</Start_Time>
<Domain>adv191</Domain>
<Injected_tags>port-num-0 ; port-num-0 actual-FW-14.16.0234 ;
</Injected_tags>
</line>
我想提取域名,该名称位于inject_tags(将始终在域之后)字符串停止在屏障上。
是否有一个简单的bash实用程序来执行此操作(grep,awk,sed)?
从上面的示例中,输出应该是pciereg062
而不是adv191
。
答案 0 :(得分:1)
使用GNU awk进行多字符RS:
$ awk -v RS='</[^>]+>' -F'[<>]' '{m[$2]=$3} $2=="Injected_tags" && /stopped on barrier/{print m["Domain"]}' file
pciereg062