BLAST通过Biopython NCBIWWW。我在哪里可以找到完整的数据库列表?

时间:2015-02-06 11:39:01

标签: biopython blast ncbi

我正在使用模块Biopython模块NCBIWWW在线爆炸一些序列。我想针对不同的数据库提供我的序列,但是我找不到它们的完整列表。

以下是使用“blastn”算法对Nucleotide收集数据库进行简单查询的示例。

from Bio.Blast import NCBIWWW

result_handle = NCBIWWW.qblast("blastn", "nt", some_sequence)

如您所见,数据库Nucleotide集合被指定为“nt”。 如果我想查询Human GRCh37 / hg19数据库,我应该用什么替代“nt”?如果我想查询其他物种/构建?是否有任何综合列表,我可以在http://blast.ncbi.nlm.nih.gov找到所有可用数据库的简称?

谢谢!

2 个答案:

答案 0 :(得分:2)

通过查看https://github.com/biopython/biopython/blob/master/Bio/Blast/NCBIWWW.py代码中的biopython文档,它似乎在查询此api http://www.ncbi.nlm.nih.gov/BLAST/Doc/urlapi.html

  

(...)此功能不检查参数的有效性       并按原样将值传递给服务器。有关更多帮助,请访问:       http://www.ncbi.nlm.nih.gov/BLAST/Doc/urlapi.html

正如您所看到的,通过biopython可以查询/解析该api的所有方面,包括“DATABASE”条目。现在问题,实际上是你的问题的问题是你的数据库的短名称是什么,以便被api识别。 api的文档不是很好,所以他们没有任何类型的列表与有效的数据库名称(完全是biopython不可知)。

我在ebi找到了这些列表,虽然没有解决问题似乎有帮助

http://www.ebi.ac.uk/Tools/sss/ncbiblast/help/index-nucleotide.html http://www.ebi.ac.uk/Tools/sss/ncbiblast/help/index-protein.html

另一种方法是看看他们如何在公共ftp中命名他们的dbs ftp://ftp.ncbi.nlm.nih.gov/blast/db/

希望这会有所帮助。法比奥

答案 1 :(得分:0)