我目前正在寻找一种方法,用于对20个FASTA文件进行爆炸后提取生物匹配的名称。目前,我有一个for循环,可用于提取数据,读取数据,回显文件名并输出。但是,我必须手动进入每个文件才能找到匹配的生物。有什么办法可以让我读取由生物制成的猫文本文件。
for file in ./*.fsa
do
name = `echo $file | awk -F "[./]" '{print $7}'`
echo $name
blastn -db nt -query $file -out ${name}.out -remote -outfmt "6 stitle"
done
这将满足我的所有需求,因为我只有20个,否则就可以了,但是我希望增加样本量,并且不想读取输出中找到的X个生物的每个文件。
编辑:为了澄清,当我阅读.out文件时,会得到如下结果: BLAST + 2.X.X版本
智人(某些基因)E值%匹配 大肠杆菌(某些基因)E值%匹配 等
序列匹配,查询到数据库。
我要做的只是收集物种的线条,e值和%match。
谢谢。