使用Python从NCBI页面(JS)中提取表

时间:2016-12-16 20:23:25

标签: javascript python-3.x beautifulsoup

您好我需要从NCBI网页的蛋白页面中提取Feature表。页面示例如下: https://www.ncbi.nlm.nih.gov/protein/Q8TB36.3

我在Python 3.x中编写脚本,使用BeautifulSoup包获取页面的html。问题是,如果我下载此页面的html源代码,我没有得到功能表 - 功能表是由javascript生成的? 有什么办法,如何调用该脚本并自己生成Feature表?或者任何其他方式如何从页面中提取所需的数据?

感谢您的建议

1 个答案:

答案 0 :(得分:0)

JavaScript从此网址获取数据:

https://www.ncbi.nlm.nih.gov/sviewer/viewer.fcgi?id=269849682&db=protein&report=genpept&extrafeat=984&fmt_mask=0&retmode=html&withmarkup=on&tool=portal&log$=seqview&maxplex=3&maxdownloadsize=1000000

您可以向此网址发出请求并获取所需的数据。

您可以在Chrome开发工具中找到此网址。