使用python-format解析BLAST.xml需要小写字符串

时间:2018-01-05 13:17:38

标签: python xml blast

返回值错误:searchIO_utils.py的get_processor中第25行所需的格式(小写字符串)。
AtCBL1_CDS.txt是一个包含fasta格式的蛋白质序列的文件 我想知道如何正确访问我的BLAST输出。

from Bio.Blast import NCBIWWW
from Bio.Blast import NCBIXML
from Bio import SearchIO
#open query file as fasta_file
fasta_file= open("AtCBL1_CDS.txt").read()

#set up blast parameters
result = NCBIWWW.qblast ("blastp", "prot", fasta_file)


#run and create my_blast as output file
with open("my_blast.xml", "w") as out_handle:
    out_handle.write(result.read())

#close file
result.close()
out_handle.close()

result_handle=open("my_blast.xml")

blastp_result=SearchIO.read(result_handle)
print(blastp_result)

1 个答案:

答案 0 :(得分:1)

SearchIO.read 的第二个参数应为小写格式参数:

  • format - 表示支持格式之一的小写字符串。例如,用于XML blast格式的 blast-xml

在您的情况下,该行应为:

blastp_result=SearchIO.read(result_handle,'blast-xml')