我试图使用excel从网页上抓取一些文字。该页面有很多带有决策树的js,所以当我使用ie.document.body.innertext时,我会看到那些if语句。我不想处理那些。我想要将它们输出到屏幕上的结果。 outertext不起作用,因为它似乎给出了与innertext相同的结果。 Innerhtml& outerhtml还显示决策树。
有关如何获取在屏幕上绘制的可见文字的任何想法?
答案 0 :(得分:0)
我建议使用Selenium Webdriver,它可以扩展基于浏览器的自动化功能。
HERE是一个很好的概述。
HERE是下载/文档。
以下是其使用示例:
Sub GetWebPageText(url$)
' REQUIRES REFERENCE TO THE SELENIUM WEBDRIVER TYPE LIBRARY
Dim selenium As New SeleniumWrapper.WebDriver
selenium.Start "InternetExplorer", url
selenium.Open url
Debug.Print selenium.getBodyText
End Sub