我有一些名为file1,file2,file3 ......等文件。这些文件位于文件夹f1中。文件内容如下所示。我想计算每个文件中唯一的第一列对。有些文件没有数据。它打印为零。我怎么能用awk做到这一点?您的建议将不胜感激。
文件1
1586-1081 1586 1081 B-A NZ-OD1 3.01273
1586-1081 1586 1081 B-A NZ-OD2 2.69347
1589-1100 1589 1100 B-A NH1-OE1 3.80491
1589-1085 1589 1085 B-A NH2-OE2 2.7109
file2的
43-415 43 415 B-A OE1-NH1 2.84503
43-415 43 415 B-A OE1-NH2 2.99614
期望的输出
file1 3
file2 1
答案 0 :(得分:6)
使用GNU awk
,您可以使用BEGINFILE
和ENDFILE
块。
$ cat file1
1586-1081 1586 1081 B-A NZ-OD1 3.01273
1586-1081 1586 1081 B-A NZ-OD2 2.69347
1589-1100 1589 1100 B-A NH1-OE1 3.80491
1589-1085 1589 1085 B-A NH2-OE2 2.7109
$ cat file2
43-415 43 415 B-A OE1-NH1 2.84503
43-415 43 415 B-A OE1-NH2 2.99614
$ awk 'BEGINFILE{delete a}{!a[$1]++}ENDFILE{print FILENAME, length(a)}' file1 file2
file1 3
file2 1
您不必指定每个文件。如果要对当前目录下的所有文件执行操作,只需使用glob(即*
)来引用所有文件。