我有一个HTML:
<html>
<span class="b-serp-url__item">newdomain.com</span>
<span class="b-serp-url__item">USA</span>
<span class="b-serp-url__item">U.S.A.</span>
<span class="b-serp-url__item">new<a href="#1">bad.com</a>USA</span>
<span class="b-serp-url__item">new<b>domain</b>.com</span>
...
</html>
如果<SPAN>
标记的内容包含域名或域名加<B>
标记,我该如何匹配?{1}}标记的内容?所以我在上面的例子中喜欢REGEXP匹配new<b>domain</b>.com
和new<b>domain</b>.com
。
我尝试使用<span class="b-serp-url__item">(?:(?!<[^b]+).*?)\.(?:(?!<[^b]+).*?)</span>
但它也匹配new<a href="#1">bad.com</a>USA
。有人可以建议如何只使用正则表达式吗?