轻松解决复杂任务

时间:2012-12-20 16:46:02

标签: regex bash

我很好奇是否有这个看似复杂的任务的简单解决方案:

说我有这个文件:

lineone
linetwo
linethree
linefour

lineone
linetwo
linethree
linefour

lineone
lineone
lineone
linetwo
linethree
linefour

有没有一种简单的方法可以让你想到这个结果:

lineone[1]
linetwo[1]
linethree[1]
linefour[1]

lineone[2]
linetwo[2]
linethree[2]
linefour[2]

lineone[3]
lineone[4]
lineone[5]
linetwo[3]
linethree[3]
linefour[3]

用文字来说,是否有一个简单的bash算法可以让我按照它在文件中出现的顺序对每一行进行编号?如果没有涉及额外存储的复杂解决方案,我无法找到一种方法,而我用于线路替换的常用命令在这里是无用的。 sed只会用相同的值替换所有出现的行,而字符串replace($ {string / substring / replace})对我没用,因为它不会保持行的顺序。

非常感谢。

3 个答案:

答案 0 :(得分:3)

以下awk命令通过保留一系列行及其计数来工作。

awk '{if($0~/./){a[$0]++;print $0"["a[$0]"]";} else print}' file

示例:

$ cat file
lineone
linetwo
linethree
linefour

lineone
linetwo
linethree
linefour

lineone
linetwo
linethree
linefour

lineone
lineone
lineone
linetwo
linethree
linetwo

$ awk '{if($0~/./){a[$0]++;print $0"["a[$0]"]";} else print}' file
lineone[1]
linetwo[1]
linethree[1]
linefour[1]

lineone[2]
linetwo[2]
linethree[2]
linefour[2]

lineone[3]
linetwo[3]
linethree[3]
linefour[3]

lineone[4]
lineone[5]
lineone[6]
linetwo[4]
linethree[4]
linetwo[5]

答案 1 :(得分:2)

快速100%纯粹的bash回答:

#!/bin/bash

declare -A lines=()
while read -r l; do
    if [[ -n "$l" ]]; then
        echo "$l[$((++lines[$l]))]"
    else
        echo "$l"
    fi
done < file.txt

根据需要,这是一个简单bash算法,它允许[你]按照文件中出现的顺序对每个[非空]行进行编号。

这不是最快的方式(awk答案更快更有效,但awk答案不是 bash算法。)

技巧是使用关联数组lines,其关键是文件的行,并在每次读取非空行时递增相应键的值。

或者单行以便给你的祖母留下深刻的印象:

declare -A lines=(); while read -r l; do [[ -n "$l" ]] && echo "$l[$((++lines[$l]))]"; || echo "$l"; done < file.txt

答案 2 :(得分:2)

一个神秘的Perl单线:

perl -00 -lpe 's/$/"[". $. . "]"/gem'

我看到我根据模棱两可的例子误解了这个问题。这是Perl片段,用于对行进行编号,如下所述:

perl -lpe '/\S/ and $_ .= "[" . ++$n{$_} . "]"'