获得BLAST十大结果序列Bio Python

时间:2011-07-05 04:31:43

标签: python sequence biopython blast ncbi

我想获得BLAST结果的前10个序列(只是序列,没有比对或得分或电子价值等)。我正在输入一个包含5个fasta文件的文本文件。所以我的输出应该是每个fasta文件的前10个爆炸命中..因此我的输出文件将有50个序列。

我通过Bio.SeqIO读取每个输入的fasta文件,将其写为temp.faa,然后通过子进程将其传递给命令行BLAST

blastp -db nr -query temp.faa -out out.faa -evalue 0.001 -gapopen 11 -gapextend 1 -matrix BLOSUM62 -remote -outfmt 2

输出有很多其他信息。我现在应该解析这个输出还是有更好的方法。

由于

P.SX XML可能是一种方式,但我没有找到相关的NCBIXML解析器语法。