2 VB RegEx问题

时间:2010-11-29 16:03:39

标签: regex asp-classic vbscript html-parsing

我需要一些VB RegEx的帮助。

我有两个RegEx需要做两件事。

RegEx one - 我不确定如何做到这一点,但我需要在Href标签内获取所有内容。即。

String = "<a href=""test.html"">"

我需要RegEx返回.... test.html

RegEx Two - 我部分得到了这项工作。

我有像

这样的标签
RegEx = "<div class=""top""(.*?)</div>"
String = "<div class=""top""><a><b><div class=""bottom""></div></b></a></div>"

我遇到的问题是这不会返回任何东西,它应该返回所有“top”,但它什么也不返回。

2 个答案:

答案 0 :(得分:3)

使用正则表达式无法很好地解决用例问题。

改为使用HTML解析器,例如HTML Agility Pack

答案 1 :(得分:0)

好吧,如果您的html不包含嵌套标签,您可以使用正则表达式执行第一部分(只要您可以控制搜索源代码,就可以更加确定您的结果)。

\<a href=""([^""]+)\>

test.html将在非被动群组中找到,称为$1

第二部分我担心你在那里有嵌套标签而且它失败了。使用正则表达式和html的是,正则表达式无法深入研究嵌套允许但不是最佳实践的代码,该代码可以按预期执行但形式不正确。

你能为第二种情况发布一些搜索源,以便我们看看吗?