如何从链接中仅获取href值

时间:2009-05-20 07:51:46

标签: regex vbscript

我的页面中有很多链接。

例如<a href="/promotions/download/schools/australia.aspx">Australia</a>

现在我只想要带有值的href,即(href =“/ promotions / download / schools / australia.aspx”)和vbscript正则表达式。

2 个答案:

答案 0 :(得分:4)

我的正则表达式如下:

href="([^"]*)"

可能需要在您的上下文中转义但是(或者非常类似的东西)应该可以工作。

答案 1 :(得分:1)

正则表达式在解析HTML方面根本不好(请参阅Can you provide some examples of why it is hard to parse XML and HTML with a regex?了解原因)。幸运的是,您应该可以访问最好的解析器:Web浏览器。现代浏览器创建Document Object Model,它是一种树结构,包含有关页面的所有信息。您可以在DOM上调用的方法之一是链接。我真的不知道vbscript,但是这段代码看起来应该可以工作:

For i = 0 To document.links.length
  document.write(document.links(i).href & "<BR>")
Next