使用Biopython库从PDB中删除残留物

时间:2014-09-17 07:29:17

标签: python biopython protein-database

使用biopython库,我想删除列表中列出的残留,如下所示。该线程(http://pelican.rsvs.ulaval.ca/mediawiki/index.php/Manipulating_PDB_files_using_BioPython)提供了删除残留的示例。我有以下代码来删除残留物

 residue_ids_to_remove = [105, 5, 8, 10, 25, 48]
 structure = pdbparser.get_structure("3chy", "./3chy.pdb")
 first_model = structure[0]
 for chain in first_model:
     for residue in chain:
         id = residue.id
         if id[1] in residue_ids_to_remove:
             chain.detach_child(id[1])
 modified_first_model = first_model 

但是这段代码不起作用并引发了错误

def detach_child(self, id):
    "Remove a child."
    child=self.child_dict[id]
    KeyError: '105'

这段代码出了什么问题?

或者,我可以使用accept_residue()并将其写入PDB。我不想这样跟随,因为我想在内存中进行进一步处理。

1 个答案:

答案 0 :(得分:3)

Biopython无法在内部词典中找到链中的键,因为您正在提供随机键。这个词典看起来像这样:

child_dict = {(' ', 5, ' '): <Residue HOH het=W resseq=5 icode= >,
              (' ', 6, ' '): <Residue HOH het=W resseq=6 icode= >,
              (' ', 7, ' '): <Residue HOH het=W resseq=7 icode= >}

即:使用元组作为dict键。你可以看到d print chain.child_dict

一旦你知道这一点,错误/解决方案就很清楚了。将有效密钥传递给detach_child,即删除[1]

   if id[1] in residue_ids_to_remove:
       chain.detach_child(id)

正确的方式

将儿童从链条级别移开,不要直接循环残留物:

for chain in first model:
    for id in residue_ids_to_remove:
        chain.detach_child((' ', id, ' '))

或者列表理解:

for chain in first_model:
    [chain.detach_child((' ', id, ' ')) for id in residue_ids_to_remove]