我需要一些VB RegEx的帮助。
我有两个RegEx需要做两件事。
RegEx one - 我不确定如何做到这一点,但我需要在Href标签内获取所有内容。即。
String = "<a href=""test.html"">"
我需要RegEx返回.... test.html
RegEx Two - 我部分得到了这项工作。
我有像
这样的标签RegEx = "<div class=""top""(.*?)</div>"
String = "<div class=""top""><a><b><div class=""bottom""></div></b></a></div>"
我遇到的问题是这不会返回任何东西,它应该返回所有“top”,但它什么也不返回。
答案 0 :(得分:3)
使用正则表达式无法很好地解决用例问题。
改为使用HTML解析器,例如HTML Agility Pack。
答案 1 :(得分:0)
好吧,如果您的html不包含嵌套标签,您可以使用正则表达式执行第一部分(只要您可以控制搜索源代码,就可以更加确定您的结果)。
\<a href=""([^""]+)\>
test.html将在非被动群组中找到,称为$1
。
第二部分我担心你在那里有嵌套标签而且它失败了。使用正则表达式和html的是,正则表达式无法深入研究嵌套允许但不是最佳实践的代码,该代码可以按预期执行但形式不正确。
你能为第二种情况发布一些搜索源,以便我们看看吗?