我是Python的新用户,我尝试导入genbank和fasta格式文件。 在他们的文档中,他们提供了一个示例,说明了如何将数据集导入Python。 具体来说,它们在Biopython教程和食谱中提供了以下示例,第16页:
from Bio import SeqIO
for seq_record in SeqIO.parse("ls_orchid.gbk", "genbank"):
print seq_record.id
print repr(seq_record.seq)
print len(seq_record)
现在,他们在第14页提到Biopython源代码包含这个文件是真的。但是,python如何通过Bio import SeqIO知道文件的确切位置? 请注意,我在安装了biopython及其组件之后尝试了上面的代码,但它从未起作用?
另外,我可以只指定genbank文件的路径并以某种方式打开它!
谢谢
答案 0 :(得分:1)
根据http://biopython.org/DIST/docs/tutorial/Tutorial.html#htoc10
您需要将文件复制到本地目录
本教程最初编写时,此搜索仅给我们94 点击,我们保存为FASTA格式的文本文件和GenBank 格式化文本文件(文件ls_orchid.fasta和ls_orchid.gbk,也 包含在Biopython源代码下 文档/教程/实例/).
如果您今天运行搜索,您将获得数百个结果!什么时候 按照教程,如果你想看到相同的基因列表, 只需下载上面的两个文件或从docs / examples / in中复制它们 Biopython源代码。在2.5节中,我们将看看如何做一个 从Python中搜索这样的内容。
答案 1 :(得分:1)
您似乎需要将ls_orchid.gbk文件保存在与python脚本相同的目录中,否则您需要指定文件的完整路径。您也可以从NCBI下载任何genbank文件并将其添加到目录中,或者指定其位置
for seq_record in SeqIO.parse("~/File Location/File Name", "genbank")
答案 2 :(得分:-1)
我把Genbank和FASTA放在C:\ Python27中 我可以解析所有其他文件格式,如Newick,PhyloXML等 你应该联系开发者以获取更多信息