Question

我目前正在寻找一种方法，用于对20个FASTA文件进行爆炸后提取生物匹配的名称。目前，我有一个for循环，可用于提取数据，读取数据，回显文件名并输出。但是，我必须手动进入每个文件才能找到匹配的生物。有什么办法可以让我读取由生物制成的猫文本文件。

for file in ./*.fsa
do 
name = `echo $file | awk -F "[./]" '{print $7}'`
echo $name
blastn -db nt -query $file -out ${name}.out -remote -outfmt "6 stitle"
done

这将满足我的所有需求，因为我只有20个，否则就可以了，但是我希望增加样本量，并且不想读取输出中找到的X个生物的每个文件。

编辑：为了澄清，当我阅读.out文件时，会得到如下结果： BLAST + 2.X.X版本

智人（某些基因）E值％匹配大肠杆菌（某些基因）E值％匹配等

序列匹配，查询到数据库。

我要做的只是收集物种的线条，e值和％match。

谢谢。

从多个BLAST输出中自动提取生物

0 个答案: