如何从refseq登录号列表中获取基因列表(NM_ <num>和NR_ <num>)

时间:2016-07-21 14:18:06

标签: python bioinformatics biopython

我正在使用python 2.7并尝试使用biopython或pyensembl从refseq登录号列表中获取基因列表。有一种简单的方法可以做到这一点吗?

1 个答案:

答案 0 :(得分:0)

是的,有一种简单的方法。但是你应该总是表现出一些努力,一些你在问之前尝试过的代码。这是您需要的代码:

from Bio import Entrez
Entrez.email = "trouselife@gmail.com"

handle = Entrez.efetch(db="nucleotide", id="NM_123456", retmode="xml")
record = Entrez.read(handle)

for feature in r[0]["GBSeq_feature-table"]:
    for qualifier in feature["GBFeature_quals"]:
        if "gene" in qualifier["GBQualifier_name"]:
            print(qualifier["GBQualifier_value"])

# MHK7.14; MHK7_14

您应该在efetch行中获取一些示例,然后找到要从您获得的处理程序中提取的数据。