从多个BLAST输出中自动提取生物

时间:2019-02-06 22:25:43

标签: linux ubuntu bioinformatics blast

我目前正在寻找一种方法,用于对20个FASTA文件进行爆炸后提取生物匹配的名称。目前,我有一个for循环,可用于提取数据,读取数据,回显文件名并输出。但是,我必须手动进入每个文件才能找到匹配的生物。有什么办法可以让我读取由生物制成的猫文本文件。

for file in ./*.fsa
do 
name = `echo $file | awk -F "[./]" '{print $7}'`
echo $name
blastn -db nt -query $file -out ${name}.out -remote -outfmt "6 stitle"
done

这将满足我的所有需求,因为我只有20个,否则就可以了,但是我希望增加样本量,并且不想读取输出中找到的X个生物的每个文件。

编辑:为了澄清,当我阅读.out文件时,会得到如下结果: BLAST + 2.X.X版本

智人(某些基因)E值%匹配 大肠杆菌(某些基因)E值%匹配 等

序列匹配,查询到数据库。

我要做的只是收集物种的线条,e值和%match。

谢谢。

0 个答案:

没有答案