如何解析通过Java Script生成的HTML代码

时间:2016-02-29 08:32:32

标签: javascript html ajax web-scraping xmlhttprequest

我的任务是通过vba下载文件。问题是,该页面主要是通过JavaScript生成的。很抱歉,我不能与你分享这个页面,因为我不拥有它,但我会尽量让事情变得清晰。

来自IE源查看器的HTML看起来类似于:

<head>
  css stuff
  jscript link
  more jscript links
  more css stuff
</head>
<body>
divs and links and so on

<div magic inside that div that shows on browser but not in source code></div>

</body>

我非常相信java脚本生成一个iframe并用html代码填充它。

你认为可以从java脚本中检索完成的iframe吗?因为我可以在使用chrome DOM资源管理器时看到HTML代码,但我无法在vba中获取HMTL数据。它让我发疯,我不明白这一点:D

感谢您的时间

1 个答案:

答案 0 :(得分:0)

您所描述的内容看起来像是一个典型的DHTML,可以在XHR请求后由JS生成。所以打开网页e。 G。在Chrome中,选中“网络”标签。在页面上生成目标内容后,您将在选项卡上看到所有请求,检查它们,通常需要检索所有需要检索的数据(请注意,可能需要对数据进行一些转换)。如果您找到它,那么您可以只使用相同的参数执行XHR以检索结果。或者换句话说,如果iframe是相同的原点,您可以检索生成的HTML内容访问DOM,如上所述。