从蛋白质序列数据库中检索DNA序列?

时间:2014-12-05 16:51:26

标签: bioinformatics fasta genome protein-database

我在FASTA中有1000个蛋白质序列及其登录号。我想回到全基因组鸟枪数据库并检索所有编码与我的初始序列列表中的蛋白质相同的蛋白质的DNA序列。

我尝试运行tBlastn,每个序列的结果为< 10,每个查询1个,电子值低于1e-100或e值为零,我没有得到任何结果。我想自动完成整个过程。

这可以通过从命令行和批处理脚本运行blast来完成吗?

2 个答案:

答案 0 :(得分:0)

你应该得到至少一个结果:编码原始蛋白质的结果。如果我跟着你,其他人,如果有的话,将是假基因。

无论如何,一些编程可能会有所帮助,请查看Biopython。 Bioperl或Bioruby应该具有类似的功能。 特别是你可以BLAST using Biopython

答案 1 :(得分:0)

您可能会发现此链接很有用:

https://www.biostars.org/p/5403/

在那里已经提出了类似的问题,并且已经发布了一些合理的解决方案。