使用正则表达式,如何匹配<a>
标记中不的特定单词。
例如。我正在寻找不是链接的单词software
(即未被<a ... </a>
包围)
示例输入
... <a href='#'>this software</a> ... software ... <a href='#'>software</a>.
是否可以使用正则表达式仅匹配第二个software
?
如果不可能,如果匹配的元素位于<a>
标记内,您如何检查C#?
答案 0 :(得分:4)
可能:是
推荐:否
有很多可能有帮助的HTML解析器
以下是关于为什么不推荐它的好文章:RegEx match open tags except XHTML self-contained tags。即使我尝试
,我也无法把它变得更好答案 1 :(得分:0)
我对这个要求并不完全清楚。以下正则表达式应该为您可能正在寻找的东西提供一些基础......
(?<=\</\w*\>).*