根据AWK中的描述ID排除序列

时间:2017-09-25 14:47:46

标签: awk bioinformatics fasta

我有fasta文件,其中有一些描述ID(isoforms 2,... Isoform 9),我想在fasta文件中排除它们。

我使用此命令行查看哪个文件包含isoform 2到9 ID:

for i in `ls *.fasta`; do l=`grep 'isoform X[2-9]' $i | head -1`; echo $i $l; done | awk '(NF==1){print}' | head

有一种方法可以在我的命令行中包含一些内容来删除它们吗?

感谢。

1 个答案:

答案 0 :(得分:0)

sed 's/isoform [2-9]\{1,1\}//g' *.fasta