将第一列的重复值替换为字符“

时间:2019-10-22 15:06:17

标签: unix awk solaris

样本输入:

a:g:h:e:f:n
a:u:r:t:w:r
a:g:r:o:p:q
d:h:t:y:r:o
d:n:t:s:d:f
d:g:h:u:i:m:
d:s:e:r:t:y
n:m:k:s:t:r
n:r:t:y:w:g

预期输出:

a:g:h:e:f:n
":u:r:t:w:r
":g:r:o:p:q
d:h:t:y:r:o
":n:t:s:d:f
":g:h:u:i:m:
":s:e:r:t:y
n:m:k:s:t:r
":r:t:y:w:g

将重复的第一列替换为“,直到找到不同的值。这是我在附近发现的东西,但是整个文件中都存在替换:

awk '{for(i=1;i<=NF;i++){if(x<27&&$i=="old"){x++;sub("old","new",$i)}}}1' input_file

2 个答案:

答案 0 :(得分:1)

使用awk:

$ awk 'BEGIN{FS=OFS=":"}{t=$1;if($1==p)$1="\"";p=t}1' file

输出:

a:g:h:e:f:n
":u:r:t:w:r
":g:r:o:p:q
d:h:t:y:r:o
":n:t:s:d:f
":g:h:u:i:m:
":s:e:r:t:y
n:m:k:s:t:r
":r:t:y:w:g

解释:

$ awk '
BEGIN {
    FS=OFS=":"     # field delimiters
}
{
    t=$1           # 1st field to tmp
    if($1==p)      # if current equals previous
        $1="\""    # replace with "
    p=t            # previous form tmp
}1' file           # output

更新:使用sub

$ awk 'BEGIN{FS=":"}{t=$1;if($1==p)sub(/^[^:]*/,"\"");p=t}1' file

答案 1 :(得分:1)

请您尝试以下操作(由于OP提到OS是Sun操作系统,因此请使用nawk)。

nawk -v var="\"" '
 BEGIN{
   FS=OFS=":"
   }
 {
   $1=++a[$1]>1?var:$1
 }
 1
' Input_file

由于您使用的是上述代码中的nawk,因此在Sun操作系统上。该代码将不依赖于第一个字段的顺序,无论它的顺序如何,这都应该起作用。