Biopython:如何获取蛋白质pdb文件的化合物名称?

时间:2016-06-05 14:38:30

标签: biopython

我一直试图用以下术语来解决它:

structure.header [ '化合物']

但我得到的只是分子id而不是它的名字!

2 个答案:

答案 0 :(得分:1)

为了获得晶体结构的名称,即PDB网站上显示的名称,您可以使用:

print(structure.header['name'])

e.g。 (假设您当前的工作目录中有1iah.pdb

from Bio.PDB import *
parser = PDBParser()
structure = parser.get_structure('1IAH', '1iah.pdb')
print(structure.header['name'])

会给你

  

'trp的非典型蛋白激酶结构域的晶体结构   ca-channel,chak(adp-mg complex)'

与此处显示的名称相同:http://www.rcsb.org/pdb/explore/explore.do?structureId=1IAH

更新以回应评论

为了获得化合物的名称,可以使用:

print(structure.header['compound']['1']['molecule'])

答案 1 :(得分:0)

这可能是一个答案: http://biopython.org/wiki/The_Biopython_Structural_Bioinformatics_FAQ

keywords = structure.header['keywords']
  

可用键是名称,head,deposition_date,release_date,   structure_method,resolution,structure_reference(映射到列表   参考),journal_reference,作者和复合(映射到   关于结晶化合物的各种信息的字典。)