在修改awk
中的特定字段后,输出字段分隔符上的信息是否丢失,总是如此?如果有多个字段分隔符并且我希望它们被恢复会发生什么?
例如,假设我有一个简单的文件example
,其中包含:
a:e:i:o:u
如果我只运行一个考虑输入字段分隔符的awk
脚本,则打印我文件中的每一行,例如运行
awk -F: '{print $0}' example
我会看到原来的一行。但是,如果我直接修改其中一个字段,例如与
awk -F: '{$2=$2"!"; print $0}' example
我没有得到原始行的修改版本,而是看到由默认空格分隔符分隔的字段,即:
a e! i o u
我可以通过指定OFS来获取原始版本的修改版本,例如:
awk -F: 'BEGIN {OFS=":"} {$2=$2"!"; print $0}' example
但是,在这种情况下,有多个潜在的字段分隔符,但在多个分隔符的情况下,有一种简单的方法可以恢复原始分隔符吗?
例如,如果example
同时将:
和;
作为分隔符,我可以使用-F":|;"
来处理文件,但OFS不足以恢复原始文件分离器处于相对位置。
更明确地说,如果我们切换到包含
的example2
a:e;i:o;u
我们可以使用
awk -F":|;" 'BEGIN {OFS=":"} {$2=$2"!"; print $0}' example2
(或-F"[:;]"
)获取
a:e!:i:o:u
但是我们已经失去了:和;如果我们能够恢复,那将会得到维持
a:e!;i:o;u
答案 0 :(得分:5)
你需要使用GNU awk为第4个arg分割()保存分隔符,就像RT对RS一样:
$ awk -F'[:;]' '{split($0,f,FS,s); $2=$2"!"; r=s[0]; for (i=1;i<=NF;i++) r=r $i s[i]; $0=r} 1' file
a:e!;i:o;u
没有自动填充的FS匹配字符串数组,因为每次将记录拆分为字段时,存储与FS匹配的字符串的时间和内存有多昂贵。相反,GNU awk人员为split()提供了第4个arg,这样你就可以在需要的时候自己动手。这是几年前在经验丰富的awk用户和gawk提供商之间的comp.lang.awk新闻组中进行长时间对话的结果,然后才同意这是最好的方法。
在https://www.gnu.org/software/gawk/manual/gawk.html#String-Functions点击split()
。