将html文件保存在完整的源代码中

时间:2016-09-06 10:26:45

标签: html curl wget

我想在此网页中找到一些参数:https://math.stackexchange.com/a/87238/250498

例如,如果我想找到" Topological Polar Surface Area"的值。

如果我使用Internet Explorer手动保存页面,那么我可以使用这些命令找到值

cat file.html | grep -c  "Topological Polar Surface Area" , 

但是,如果我想使用命令wgetcurl进行保存,那么我无法找到该值。

1 个答案:

答案 0 :(得分:0)

它是由JavaScript通过异步加载内容引起的。当您通过wgetcurl保存文档时,您无法获得从网站动态加载的内容,因为JS无法执行。

您要查找的数据是从此JSON网址https://pubchem.ncbi.nlm.nih.gov/rest/pug_view/index/compound/16678118/JSON/加载的。

您可以在chrome开发人员工具(或任何类似工具)中查看网络标签,以查看从哪个URL加载的数据。