如何比较头文件(fasta)的一部分并将其与一个文件放在一起?

时间:2016-06-16 13:58:21

标签: awk header compare fasta

我在目录中有更多fasta个文件,这些文件具有相同的开头但结尾不同:

file1abgff
-----------

file2adferr
------------

file3adfr
----------

file1adcef
-----------

如何在目录中比较所有文件的开头并将匹配项放在一个新文件(example >file1abgffadcef)?

1 个答案:

答案 0 :(得分:-1)

此代码似乎可以解决您的问题。

假设您有输入文件:

cat input
>file1abgff
>file2adferr
>file3adfr
>file1adcef

这是我的解决方案:

 sed 's/[0-9]/& /' input | awk  '{a[$1]=($1 in a ? a[$1]"|"$2 : $0)}END{for (i in a){print a[i]}}' | sed 's/ //' | grep  "|" | sed 's/|//'

>file1abgffadcef