使用VBA将HTML源代码提取到excel中

时间:2018-09-28 04:00:32

标签: excel vba function web-scraping getelementbyid

我试图使用getElementByID函数将内容或内部文本简单地粘贴到excel中。 内容实际上是我试图将其提取并粘贴到单元格中的iframe链接。 显示的照片是html源代码。

 Sub GetData()

    Dim ie As New SHDocVw.InternetExplorer
    Dim htmldoc As MSHTML.HTMLDocument
    Dim result As MSHTML.IHTMLElement


    ie.Visible = True
    ie.navigate "http://www.bursamalaysia.com/market/listed-companies/company-announcements/5925865"

    Do While ie.readyState <> READYSTATE_COMPLETE
    Loop


    Application.Wait (Now() + TimeValue("00:00:016")) ' For internal page refresh or loading

    Set htmldoc = ie.document
    Set Results = HTML.getElementById("bm_ann_detail_iframe")

    Sheets("Sheet1").Range("a1").Value = Results.innerText

End Sub

html source code

1 个答案:

答案 0 :(得分:1)

您应该在代码中使用一致的变量命名。如果将Option Explicit放在代码的顶部,这将有所帮助。

您要访问src的{​​{1}}属性以获取显示的URL。

如果您打算使用新的URL,则实际上需要在“#”之前的部分。这意味着更改为:

iframe

代码:

ThisWorkbook.Worksheets("Sheet1").Range("A1").Value = Split(ie.document.getElementById("bm_ann_detail_iframe").src, "#")(0)