样本输入:
a:g:h:e:f:n
a:u:r:t:w:r
a:g:r:o:p:q
d:h:t:y:r:o
d:n:t:s:d:f
d:g:h:u:i:m:
d:s:e:r:t:y
n:m:k:s:t:r
n:r:t:y:w:g
预期输出:
a:g:h:e:f:n
":u:r:t:w:r
":g:r:o:p:q
d:h:t:y:r:o
":n:t:s:d:f
":g:h:u:i:m:
":s:e:r:t:y
n:m:k:s:t:r
":r:t:y:w:g
将重复的第一列替换为“,直到找到不同的值。这是我在附近发现的东西,但是整个文件中都存在替换:
awk '{for(i=1;i<=NF;i++){if(x<27&&$i=="old"){x++;sub("old","new",$i)}}}1' input_file
答案 0 :(得分:1)
使用awk:
$ awk 'BEGIN{FS=OFS=":"}{t=$1;if($1==p)$1="\"";p=t}1' file
输出:
a:g:h:e:f:n
":u:r:t:w:r
":g:r:o:p:q
d:h:t:y:r:o
":n:t:s:d:f
":g:h:u:i:m:
":s:e:r:t:y
n:m:k:s:t:r
":r:t:y:w:g
解释:
$ awk '
BEGIN {
FS=OFS=":" # field delimiters
}
{
t=$1 # 1st field to tmp
if($1==p) # if current equals previous
$1="\"" # replace with "
p=t # previous form tmp
}1' file # output
更新:使用sub
:
$ awk 'BEGIN{FS=":"}{t=$1;if($1==p)sub(/^[^:]*/,"\"");p=t}1' file
答案 1 :(得分:1)
请您尝试以下操作(由于OP提到OS是Sun操作系统,因此请使用nawk
)。
nawk -v var="\"" '
BEGIN{
FS=OFS=":"
}
{
$1=++a[$1]>1?var:$1
}
1
' Input_file
由于您使用的是上述代码中的nawk
,因此在Sun操作系统上。该代码将不依赖于第一个字段的顺序,无论它的顺序如何,这都应该起作用。