Biopython本地BLAST数据库错误

时间:2012-05-21 05:10:24

标签: python database path biopython blast

我正在尝试使用Biopython的NcbiblastxCommandline工具在“nr”数据库本地运行blastx但是我总是得到关于蛋白质数据库搜索路径的以下错误:

>>> from Bio.Blast.Applications import NcbiblastxCommandline
>>> nr = "/Users/Priya/Documents/Python/ncbi-blast-2.2.26+/bin/nr.pal"
>>> infile = "/Users/Priya/Documents/Python/Tutorials/opuntia.txt"
>>> blastx = "/Users/Priya/Documents/Python/ncbi-blast-2.2.26+/bin/blastx"
>>> outfile = "/Users/Priya/Documents/Python/Tutorials/opuntia_python_local.xml"
>>> blastx_cline = NcbiblastxCommandline(blastx, query = infile, db = nr, evalue = 0.001, out = outfile)
>>> stdout, stderr = blastx_cline()
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File     "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/Bio/Application/__init__.py", line 443, in __call__
stdout_str, stderr_str)
Bio.Application.ApplicationError: Command '/Users/Priya/Documents/Python/ncbi-blast-2.2.26+/bin/blastx -out /Users/Priya/Documents/Python/Tutorials/opuntia_python_local.xml -query /Users/Priya/Documents/Python/Tutorials/opuntia.txt -db /Users/Priya/Documents/Python/ncbi-blast-2.2.26+/bin/nr.pal -evalue 0.001' returned non-zero exit status 2, 'BLAST Database error: No alias or index file found for protein database [/Users/Priya/Documents/Python/ncbi-blast-2.2.26+/bin/nr.pal] in search path [/Users/Priya::]'

我不知道如何更改指向我下载的nr数据库的路径,但我认为我正确指出它,因为我可以从命令行运行此代码而没有任何问题:

Priyas-iMac:~ Priya$ /Users/priya/Documents/Python/ncbi-blast-2.2.26+/bin/blastx -query /Users/priya/Documents/Python/Tutorials/opuntia.txt -db /Users/priya/Documents/Python/ncbi-blast-2.2.26+/bin/nr -out /Users/priya/Documents/Python/Tutorials/opuntia_local.xml -evalue 0.001 -outfmt 5

上面的命令行代码按照我的预期创建了blast结果的xml文件。

使用Biopython NCBI命令行工具解决此问题的任何帮助都将非常感谢!

2 个答案:

答案 0 :(得分:5)

您的nr变量以nr.pal结尾。 nr(没有.pal)应该没问题。如果删除pal不起作用。您可以尝试在主目录中设置.ncbirc文件,其中包含以下内容:

[BLAST]
BLASTDB=/directory/path/to/blast/databases

它基本上为blast数据库查找设置了一个环境变量。之后,您只需在nr变量中使用nr(无需路径)。

顺便说一句,您可以使用NcbiblastxCommandline检查print blastx_cline构建的命令行。我的猜测是它与你手动输入的那个不一样。

编辑:查看http://www.biostars.org/以了解与StackExchange格式类似的生物信息学特定问题。

答案 1 :(得分:1)

似乎有效的命令列出了与代码示例中调用的数据库不同的数据库:

# In the code
-db /Users/Priya/Documents/Python/ncbi-blast-2.2.26+/bin/nr.pal

VS

# From the command line
-db /Users/priya/Documents/Python/ncbi-blast-2.2.26+/bin/nr

尝试在第2行中将该路径的分配更改为nr,以便它反映您在命令行中使用的没有“.pal”的路径。