我想获得BLAST结果的前10个序列(只是序列,没有比对或得分或电子价值等)。我正在输入一个包含5个fasta文件的文本文件。所以我的输出应该是每个fasta文件的前10个爆炸命中..因此我的输出文件将有50个序列。
我通过Bio.SeqIO读取每个输入的fasta文件,将其写为temp.faa,然后通过子进程将其传递给命令行BLAST
blastp -db nr -query temp.faa -out out.faa -evalue 0.001 -gapopen 11 -gapextend 1 -matrix BLOSUM62 -remote -outfmt 2
输出有很多其他信息。我现在应该解析这个输出还是有更好的方法。
由于
P.SX XML可能是一种方式,但我没有找到相关的NCBIXML解析器语法。
答案 0 :(得分:4)