使用VBScript中的Microsoft.XMLHTTP在XPATH中解析XHTML

时间:2012-03-22 12:42:51

标签: xpath vbscript html-parsing xmlhttprequest selectnodes

我希望在VBScript中使用带有XPATH的Microsoft.XMLHTTP解析xhtml文档。我有以下xhtml文档结构。我如何获得一系列网址?

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
    <head>
        <meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />
        <title>Local index</title>
    </head>
    <body>
        <table>
            <tr>
                <td>
                    <a href="url1.html">url1</a><br/>
                    <a href="url2.html">url2</a><br/>
                    <a href="url3.html">url3</a>
                </td><td>
                    <a href="url1-1.html">url1-1</a><br/>
                    <a href="url2-1.html">url2-1</a><br/>
                    <a href="url3-1.html">url3-1</a>
                </td>
            </tr>
        </table>
    </body>
</html>

1 个答案:

答案 0 :(得分:0)

您确定需要使用过时的程序ID Microsoft.XMLHTTP吗?目前,MSXML 3和MSXML 6都是操作系统的一部分,分别支持自Windows XP以来的任何服务包。 至于使用XPath和MSXML 3,这是一个例子:

Dim doc
Set doc = CreateObject("Msxml2.DOMDocument.3.0")
doc.validateOnParse = False
doc.resolveExternals = False
If doc.load("file.xml") Then
  doc.setProperty "SelectionLanguage", "XPath"
  doc.setProperty "SelectionNamespaces", "xmlns:xhtml='http://www.w3.org/1999/xhtml'"
  For Each link In doc.selectNodes("//xhtml:a")
    WScript.Echo(link.getAttribute("href") & ": " & link.text)
  Next
Else
  WScript.Echo(doc.parseError.reason)
End If