重复正则表达式替换为SED

时间:2013-02-06 08:32:17

标签: regex linux sed

我有以下几行(实际上这些行中约有1M行):

foo|||bar
qux||boo|fzx

请注意,每行包含4个字段,但字符数 可以超过3个。

我想要做的是用||替换每个|nil|

foo|nil|nil|bar
qux|nil|boo|fzx

使用sed做到这一点的方法是什么?

我尝试了但却失败了:

sed 's/||/|nil/g'

1 个答案:

答案 0 :(得分:16)

您需要重复替换,直到它没有改变:

sed ':a; s/||/|nil|/g; ta'

但是,这不会处理开头或结尾的空字段,因为您还需要两个模式:

sed 's/^|/nil|/; s/|$/|nil/; :a; s/||/|nil|/g; ta'

测试

输入:

cat << EOF > infile
foo|||bar
qux||boo|fzx
|||
EOF

运行它:

<infile sed 's/^|/nil|/; s/|$/|nil/; :a; s/||/|nil|/g; ta'

输出:

foo|nil|nil|bar
qux|nil|boo|fzx
nil|nil|nil|nil

一种尴尬的方式

awk '{ for(i=1;i<=NF;i++) if(length($i)==0) $i="nil" } 1' FS='|' OFS='|'