即使pdb退出,Biopython也无法下载文件

时间:2017-03-16 11:22:33

标签: biopython

我正在尝试使用python3的biopython自动下载pdbs。但是对于一些pdbs我遇到了404错误的问题。

urllib.error.HTTPError: HTTP Error 404: Not Found

一个例子,它不起作用但应该是:4YUU pdb文件退出数据库,我没有看到下载的pdbs biopython有任何差异。任何帮助将不胜感激。

使用代码:

import Bio
from Bio.PDB import PDBList
pdbl=PDBList()
pdbl.retrieve_pdb_file('4YUU')

1 个答案:

答案 0 :(得分:1)

4YUU的PDF格式文件确实不存在,goto http://www.rcsb.org/pdb/explore/explore.do?structureId=4YUU用于4YUU(来自红色藻类的析氧光系统II的晶体结构),以及“显示文件”和“下载文件” “PDB格式条目的菜单显示为灰色。

如果不进一步研究,我会猜测这是一种非常大的蛋白质,或者还有一些其他东西无法用传统的基于旧文本的PDB文件格式表示。

尝试通过Biopython应该能够解析的网站下载PDBx / mmCIF文件。

请注意,Biopython的下一个版本(将是Biopython 1.69)已经更改了PDBList下载代码以支持此功能。