我正在尝试从文件中删除重复集(每个条目四行 - 第一行标识集)。我有一个所有uniq第一行的文件(所有第一行中的grep'ed公共符号,已排序并运行uniq)。我以为我可以使用awk基本上只使用唯一条目重建我的文件。我用了这个命令:
awk -F '\t' 'NR==FNR {id[$1]; next} $1 in id' list_uniques.txt file_with_dups.fastq
但是,输出只是list_uniques.txt中的最后一个条目,没有其他行。很明显,我错过了在第一行之后打印下三行的命令,而且我也不知道为什么它会跳到最后。