使用bash提取XML文件中的数据

时间:2016-05-22 21:24:13

标签: xml bash awk sed grep

我需要帮助从文件中提取XML字符串,如下所示:

<line>
<Start_Time>2016-May-18 17.06.17.504</Start_Time>
<Domain>pciereg062</Domain>
<Injected_tags>
 before xml started ; AUTOMATIC-REPRODUCTION-stopped on barrier ;
</Injected_tags>
</line>

<line>
<Start_Time>2016-May-18 17.08.53.585</Start_Time>
<Domain>adv191</Domain>
<Injected_tags>port-num-0 ; port-num-0 actual-FW-14.16.0234 ;
</Injected_tags>
</line>

我想提取域名,该名称位于inject_tags(将始终在域之后)字符串停止在屏障上。

是否有一个简单的bash实用程序来执行此操作(grep,awk,sed)?

从上面的示例中,输出应该是pciereg062而不是adv191

1 个答案:

答案 0 :(得分:1)

使用GNU awk进行多字符RS:

$ awk -v RS='</[^>]+>' -F'[<>]' '{m[$2]=$3} $2=="Injected_tags" && /stopped on barrier/{print m["Domain"]}' file
pciereg062