我的页面中有很多链接。
例如<a href="/promotions/download/schools/australia.aspx">Australia</a>
现在我只想要带有值的href,即(href =“/ promotions / download / schools / australia.aspx”)和vbscript正则表达式。
答案 0 :(得分:4)
我的正则表达式如下:
href="([^"]*)"
可能需要在您的上下文中转义但是(或者非常类似的东西)应该可以工作。
答案 1 :(得分:1)
正则表达式在解析HTML方面根本不好(请参阅Can you provide some examples of why it is hard to parse XML and HTML with a regex?了解原因)。幸运的是,您应该可以访问最好的解析器:Web浏览器。现代浏览器创建Document Object Model,它是一种树结构,包含有关页面的所有信息。您可以在DOM上调用的方法之一是链接。我真的不知道vbscript,但是这段代码看起来应该可以工作:
For i = 0 To document.links.length
document.write(document.links(i).href & "<BR>")
Next