正则表达式match_all短语或标签内使用掩码的另一个标签?

时间:2014-05-17 09:37:56

标签: regex regex-negation

我有一个HTML:

<html>
    <span class="b-serp-url__item">newdomain.com</span>
    <span class="b-serp-url__item">USA</span>
    <span class="b-serp-url__item">U.S.A.</span>
    <span class="b-serp-url__item">new<a href="#1">bad.com</a>USA</span>
    <span class="b-serp-url__item">new<b>domain</b>.com</span>
    ...
</html>

如果<SPAN>标记的内容包含域名或域名加<B>标记,我该如何匹配?{1}}标记的内容?所以我在上面的例子中喜欢REGEXP匹配new<b>domain</b>.comnew<b>domain</b>.com

我尝试使用<span class="b-serp-url__item">(?:(?!<[^b]+).*?)\.(?:(?!<[^b]+).*?)</span>但它也匹配new<a href="#1">bad.com</a>USA。有人可以建议如何只使用正则表达式吗?

0 个答案:

没有答案