如何使用VBA提取HTML源代码?

时间:2019-06-17 14:48:50

标签: html excel vba

我尝试提取HTML的网站的某些URL不起作用。 其他的也可以。

我尝试了发布的代码及其各种代码。但是我没有使它适用于以下URL:https://www.genome.jp/kegg-bin/show_genomemap?ORG=vph&ACCESSION=VPUCM_0536

对于来自同一网站的该URL,相同代码完全可以正常工作: https://www.genome.jp/kegg-bin/show_organism?org=T03116

Public Function getHTTP(ByVal url As String) As String
    With CreateObject("MSXML2.XMLHTTP")
        .Open "GET", url, False: .Send
        getHTTP = .responseBody
    End With
End Function

没有显示实际的HTML代码,只有#VALUE错误。当我在MsgBox中输入getHTTP时,它确实显示了HTML源代码的前2500个字符。

1 个答案:

答案 0 :(得分:0)

我认为您最好使用:

getHTTP = .responseText

您会看到.responseBody属性here

  

以无符号字节数组的形式获取响应实体主体。

同时拥有.responseText属性:

  

以文本形式获取响应实体主体。