使用带有多个分隔符的awk替换第一列的第二列

时间:2013-11-03 18:05:23

标签: bash awk

我的选项文件有这样的内容:

<option value=Malaysia>xxxxxxxx</option>
<option value=Malawi>yyyyyyyy</option>
<option value=Malta>zzzzzzzz</option>
<option value=Madagascar>hhhhhhhh</option>

使用awk我试图使用:

awk -F ">" '{$2=$1;}1' OFS=\> test.html

但由于&gt;它不会取代xxxxxxxx与马来西亚。分离器正在考虑之前的整个部分>是第一个变量

如何在这种情况下操纵多个分隔符,这样我就可以替换$ 2,我希望它是xxxxxxxx,yyyyyyyy,zzzzzzzz,hhhhhhhh,1美元,上面是国家名称

由于

2 个答案:

答案 0 :(得分:3)

你可以使用这个awk:

awk -F "[<=>]" '{$4=$3; printf "<%s=%s>%s<%s>\n", $2, $3, $4, $5}' test.html

<option value=Malaysia>Malaysia</option>
<option value=Malawi>Malawi</option>
<option value=Malta>Malta</option>
<option value=Madagascar>Madagascar</option>

答案 1 :(得分:0)

使用gnu awk

gensub版本
awk -F"=|>" '{print gensub("(>).*(<)","\\1"$2"\\2","g")}' test.html
<option value=Malaysia>Malaysia</option>
<option value=Malawi>Malawi</option>
<option value=Malta>Malta</option>
<option value=Madagascar>Madagascar</option>