使用awk从xml文件中提取值

时间:2013-07-16 09:30:14

标签: sed awk

我有这样的文字流 <device nid="05023CA70900" id="1" fblock="-1" type="switch" name="Appliance Home" brand="Google" active="false" energy_lo="427" />
<device nid="0501C1D82300" id="2" fblock="-1" type="switch" name="TELEVISION Home" brand="Google" active="pending" energy_lo="3272" />

从中我想要输出像 05023CA70900@@1@@-1@@switch@@Appliance Home@@Google@@false@@427 0501C1D82300@@2@@-1@@switch@@TELEVISION Home@@Google@@pending@@3272
输入中有许多行都是不可写的。

我们如何使用awk或sed实现这一目标?

3 个答案:

答案 0 :(得分:1)

以下awk应该可以工作:

awk -F '"' '$1 == "<device nid=" { printf("%s@@%s@@%s@@%s@@%s@@%s@@%s@@%s\n", 
                    $2, $4, $6, $8, $10, $12, $14, $16)}' file

PS:使用awk / sed解析XML并不总是最好的方法。

答案 1 :(得分:1)

perl非常简单。那么为什么不使用perl?

perl -lne 'push @a,/\"([\S]*)\"/g;print join "@@",@a;undef @a' your_file

测试样本:

> cat temp
<device nid="05023CA70900" id="1" fblock="-1" type="switch" name="Appliance Home" brand="Google" active="false"  energy_lo="427" />  
<device nid="0501C1D82300" id="2" fblock="-1" type="switch" name="TELEVISION Home" brand="Google" active="pending"  energy_lo="3272" />  
> perl -lne 'push @a,/\"([\S]*)\"/g;print join "@@",@a;undef @a' temp
05023CA70900@@1@@-1@@switch@@Google@@false@@427
0501C1D82300@@2@@-1@@switch@@Google@@pending@@3272
>

答案 2 :(得分:0)

awk -F\" -v OFS="@@" '/^<device nid=/ { print $2, $4, $6, $8, $10, $12, $14, $16 }' file

或更一般地说:

awk -F\" '/^<device nid=/ {for (i=2;i<=NF;i+=2) printf "%s%s",(i==2?"":"@@"),$i; print ""}' file

在评论中解决您的问题:如果您在<device nid前面有一个标签:

awk -F\" '/^\t?<device nid=// ...'

如果您有其他意思,请更新您的问题并提供更具代表性的意见。