如何在正则表达式中使用awk for循环的索引

时间:2012-03-20 16:40:38

标签: regex for-loop awk redirect

我缩短了问题。实际上我的数据比这长得多。

我有一个类似的文件:

aa, bb, cc, dd, ee, 4
ff, gg, hh, ii, jj, 5
kk, ll, mm, nn, oo, 3
pp, qq, rr, ss, tt, 2
uu, vv, ww, xx, yy, 5
aa, bb, cc, dd, ee, 2

现在我想使用awk选择最后一列中具有相同编号的每一行并将其重定向到一个新文件,这些新文件将根据最后一列中的数字而有所不同。 例如。 t2.txt,t3.txt,t4.txt,t5.txt将分别保留最后一个数字为2,3,4,5的行。

在t2.txt中:

pp, qq, rr, ss, tt, 2
aa, bb, cc, dd, ee, 2

在t3.txt中:

kk, ll, mm, nn, oo, 3

在t4.txt中:

aa, bb, cc, dd, ee, 4

在t5.txt中:

ff, gg, hh, ii, jj, 5
uu, vv, ww, xx, yy, 5

我想我需要这样的东西:

BEGIN   {FS=","}
        {
        for (n=2; n<=5; n++)
        if ($6 ~/\$n/) {print > "t\$n.txt"}
        }       

但我只是不知道如何让它发挥作用。

这个bash文件做我想要的,但问题是,每次它提取具有特定数字的行时,它必须读取所有行。如何仅查看文件的时间并提取所有数字的文件?

#!/bin/bash
for num in {2..5}; do      
gawk --assign FS="," "\$6 ~/${num}/" infile >> t${num}.txt
done

2 个答案:

答案 0 :(得分:5)

尝试使用下一个命令:

awk '{ print $0 > ("t" $NF ".txt") }' infile

无需更改FS,因为它默认为空格字符。并且您可以使用NF变量进行最后一个字段的访问。

注意:文件名字符串连接需要包含在parens中,否则awk会因非法语法而混淆。

答案 1 :(得分:0)

我得到了答案,以下是有效的: 但任何进一步的解释都会受到欢迎。

BEGIN   {FS=","}
        {
        for (n=1; n<=5; n++)
        if ($6 ~/\$n/) {print > "new"$n".txt"}
        }