Question

我尝试提取HTML的网站的某些URL不起作用。其他的也可以。

我尝试了发布的代码及其各种代码。但是我没有使它适用于以下URL：https://www.genome.jp/kegg-bin/show_genomemap?ORG=vph&ACCESSION=VPUCM_0536

对于来自同一网站的该URL，相同代码完全可以正常工作： https://www.genome.jp/kegg-bin/show_organism?org=T03116

Public Function getHTTP(ByVal url As String) As String
    With CreateObject("MSXML2.XMLHTTP")
        .Open "GET", url, False: .Send
        getHTTP = .responseBody
    End With
End Function

没有显示实际的HTML代码，只有#VALUE错误。当我在MsgBox中输入getHTTP时，它确实显示了HTML源代码的前2500个字符。

Answer 1

我认为您最好使用：

getHTTP = .responseText

您会看到.responseBody属性here：

以无符号字节数组的形式获取响应实体主体。

同时拥有.responseText属性：

以文本形式获取响应实体主体。

如何使用VBA提取HTML源代码？

1 个答案: