我正在尝试使用Biopython的NcbiblastxCommandline工具在“nr”数据库本地运行blastx但是我总是得到关于蛋白质数据库搜索路径的以下错误:
>>> from Bio.Blast.Applications import NcbiblastxCommandline
>>> nr = "/Users/Priya/Documents/Python/ncbi-blast-2.2.26+/bin/nr.pal"
>>> infile = "/Users/Priya/Documents/Python/Tutorials/opuntia.txt"
>>> blastx = "/Users/Priya/Documents/Python/ncbi-blast-2.2.26+/bin/blastx"
>>> outfile = "/Users/Priya/Documents/Python/Tutorials/opuntia_python_local.xml"
>>> blastx_cline = NcbiblastxCommandline(blastx, query = infile, db = nr, evalue = 0.001, out = outfile)
>>> stdout, stderr = blastx_cline()
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "/opt/local/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/site-packages/Bio/Application/__init__.py", line 443, in __call__
stdout_str, stderr_str)
Bio.Application.ApplicationError: Command '/Users/Priya/Documents/Python/ncbi-blast-2.2.26+/bin/blastx -out /Users/Priya/Documents/Python/Tutorials/opuntia_python_local.xml -query /Users/Priya/Documents/Python/Tutorials/opuntia.txt -db /Users/Priya/Documents/Python/ncbi-blast-2.2.26+/bin/nr.pal -evalue 0.001' returned non-zero exit status 2, 'BLAST Database error: No alias or index file found for protein database [/Users/Priya/Documents/Python/ncbi-blast-2.2.26+/bin/nr.pal] in search path [/Users/Priya::]'
我不知道如何更改指向我下载的nr数据库的路径,但我认为我正确指出它,因为我可以从命令行运行此代码而没有任何问题:
Priyas-iMac:~ Priya$ /Users/priya/Documents/Python/ncbi-blast-2.2.26+/bin/blastx -query /Users/priya/Documents/Python/Tutorials/opuntia.txt -db /Users/priya/Documents/Python/ncbi-blast-2.2.26+/bin/nr -out /Users/priya/Documents/Python/Tutorials/opuntia_local.xml -evalue 0.001 -outfmt 5
上面的命令行代码按照我的预期创建了blast结果的xml文件。
使用Biopython NCBI命令行工具解决此问题的任何帮助都将非常感谢!
答案 0 :(得分:5)
您的nr
变量以nr.pal
结尾。 nr
(没有.pal
)应该没问题。如果删除pal
不起作用。您可以尝试在主目录中设置.ncbirc
文件,其中包含以下内容:
[BLAST]
BLASTDB=/directory/path/to/blast/databases
它基本上为blast数据库查找设置了一个环境变量。之后,您只需在nr
变量中使用nr
(无需路径)。
顺便说一句,您可以使用NcbiblastxCommandline
检查print blastx_cline
构建的命令行。我的猜测是它与你手动输入的那个不一样。
编辑:查看http://www.biostars.org/以了解与StackExchange格式类似的生物信息学特定问题。
答案 1 :(得分:1)
似乎有效的命令列出了与代码示例中调用的数据库不同的数据库:
# In the code
-db /Users/Priya/Documents/Python/ncbi-blast-2.2.26+/bin/nr.pal
VS
# From the command line
-db /Users/priya/Documents/Python/ncbi-blast-2.2.26+/bin/nr
尝试在第2行中将该路径的分配更改为nr,以便它反映您在命令行中使用的没有“.pal”的路径。