我一直在研究用于抓取网页的Excel VBA宏。
该工具的早期版本使用msxml2.xmlhttp
加载页面
Set html_Page = CreateObject("htmlFile")
With CreateObject("msxml2.xmlhttp")
.Open "GET", page_url, False
.send
html_Page.body.innerHTML = .responseText
End With
我使用这个html_Page
对象来解析页面上的标签。
当我转移页面上的所有文本(html_Page
)时,我发现只有静态内容可用。
目标页面可能早先是静态的,因此宏工作了一段时间。 由于网站已经更新,页面现在有一些数据似乎是在通过JS / AJAX加载页面后获取的。我通过在Firefox中加载页面来确认这一点,并禁用了JS。
那么有没有办法在这个页面上运行JS,以便所有元素都加载msxml2.xmlhttp
或类似的东西?