php regex将重复列表与单个事件组合在一起并排除整个单词

时间:2018-02-28 10:44:27

标签: php regex regex-negation

我失败了,我需要一些正则表达式来替换一些文本信息。

以下任务也可以在非正则表达式中完成,但如果在regex中使用它会很好,因为有很多要替换的。

但问题是:

  • 在集[\w\. \&\=\?\-\(\)\'\+]中找到可能出现3-99次的字符,所以请写:[\w\. \&\=\?\-\(\)\'\+]{3-99}
  • 在列表中,换行符 可以出现,所以请写\n?
  • 在此字符后面会出现一个固定的字符串,所以只需写下:<test@mail.se>
  • 但在字符列表中,单词&#34; for&#34;不应该出现

因此,如果我使用((?!for)[\w\. \&\=\?\-\(\)\'\+]{3,99}|(\n?))<test@mail\.se>这个词,那就是&#39;虽然会匹配。有人有想法吗?

所以例子: 在这个字符串中:

    To: Lasse Erikson <test@mail.se>

我想匹配名称和邮件。

即使在这里:

To: Lasse Erikson <test@mail.se>, Sara
    Larsson <mail@mail.se>

但在这里我不想取任何东西:

 for <test@mail.se>; Thu, 14 Dec 2017 21:18:22 +0100 (CET)

因为有一个&#34; for&#34;在线。

我希望你明白这一点......

提前谢谢

1 个答案:

答案 0 :(得分:1)

PHP(PCRE)提供了一些动词来跳过或失败当前匹配过程,您可以使用它来跳过单词for或者如果需要则使整个匹配失败:

((?(?=\bfor\b)for(*SKIP)(*F))[ \w.(&=?\-+)](?(2)|(\R)?)){3,99}<[^<>@]*@[^<>]*>

Live demo

故障:

(   # Start of capturing group #1
    (?(?=\bfor\b)for(*SKIP)(*F))    # Skip over `for` if any
    [ \w.(&=?\-+)]  # Match whitelist characters
    (?(2)|(\R)?)    # One newline character between
){3,99} # Between 3 or 99 times, end of CG #1
<[^<>@]*@[^<>]*> # Match an email format