我在目录中有更多fasta
个文件,这些文件具有相同的开头但结尾不同:
file1abgff
-----------
file2adferr
------------
file3adfr
----------
file1adcef
-----------
如何在目录中比较所有文件的开头并将匹配项放在一个新文件(example >file1abgffadcef
)?
答案 0 :(得分:-1)
此代码似乎可以解决您的问题。
假设您有输入文件:
cat input
>file1abgff
>file2adferr
>file3adfr
>file1adcef
这是我的解决方案:
sed 's/[0-9]/& /' input | awk '{a[$1]=($1 in a ? a[$1]"|"$2 : $0)}END{for (i in a){print a[i]}}' | sed 's/ //' | grep "|" | sed 's/|//'
>file1abgffadcef