Question

您好我需要从NCBI网页的蛋白页面中提取Feature表。页面示例如下： https://www.ncbi.nlm.nih.gov/protein/Q8TB36.3

我在Python 3.x中编写脚本，使用BeautifulSoup包获取页面的html。问题是，如果我下载此页面的html源代码，我没有得到功能表 - 功能表是由javascript生成的？有什么办法，如何调用该脚本并自己生成Feature表？或者任何其他方式如何从页面中提取所需的数据？

感谢您的建议

Answer 1

JavaScript从此网址获取数据：

https://www.ncbi.nlm.nih.gov/sviewer/viewer.fcgi?id=269849682&db=protein&report=genpept&extrafeat=984&fmt_mask=0&retmode=html&withmarkup=on&tool=portal&log$=seqview&maxplex=3&maxdownloadsize=1000000

您可以向此网址发出请求并获取所需的数据。

您可以在Chrome开发工具中找到此网址。

使用Python从NCBI页面（JS）中提取表

1 个答案: