正则表达式:以任何顺序匹配特定字符,而不会出现多于指定的每个字符

时间:2014-03-14 17:05:35

标签: regex

我有一个字符列表,例如{o, b, c, c, d, o, f}

如果字符串包含不在该列表中的字符,我不希望它成为匹配项。如果一个字符串包含的字符数多于该列表中该字符的出现次数,我不希望它成为匹配。

字符串中的字符可以按任何顺序出现,并且不必显示所有字符。在上面的示例中,"foo"应该是匹配但不是"fooo"

例如,我已将上面的示例缩小到(o{0,2}b?c{0,2}d?f?),但由于该正则表达式中的顺序很重要,因此无法正常工作。我获得了"oof"的匹配,但没有获得"foo"的匹配。

3 个答案:

答案 0 :(得分:6)

正如gview所说,正则表达式不是正确的工具。但是,如果您的正则表达式引擎支持前瞻,您可以使用:

(?=(?:[^o]*o){0,2}[^o]*$)(?=(?:[^c]*c){0,2}[^c]*$)(?=[^b]*b?[^b]*$)(?=[^d]*d?[^d*]*$)(?=[^f]*f?[^f]*$)^[obcdf]+$

它有点长但很简单:

该字符串与^[obcdf]+$匹配(请注意使用锚点。)

前瞻(?=...)只是检查(后跟):

(?=(?:[^o]*o){0,2}[^o]*$)   # no more than 2 o until the end

(?=[^b]*b?[^b]*$) # no more than 1 b until the end

前瞻中的每个子模式都描述了整个字符串。

答案 1 :(得分:4)

我认为正则表达式不是满足该要求的正确工具。我会创建一个简单的数组,其中包含白名单中的字符数。如果您的语言具有关联数组,则按字母键入并在数组元素中出现次数。

然后逐字符处理单词,在关联数组中尝试匹配,并递减可用计数。

如果有的话,它会失败:

  • 您的数组中的字母没有匹配
  • 你匹配,但匹配的信件没有剩余的计数。

答案 2 :(得分:3)

另一种方式也可以起作用

 # ^(?!(?:.*o){3})(?!(?:.*c){3})(?!(?:.*b){2})(?!(?:.*d){2})(?!(?:.*f){2})[obcdf]+$

 ^                 # BOS
 (?! (?:.* o){3} ) # not more than 2 'o'
 (?! (?:.* c){3} ) # not more than 2 'c'
 (?! (?:.* b){2} ) # not more than 1 'b'
 (?! (?:.* d){2} ) # not more than 1 'd'
 (?! (?:.* f){2} ) # not more than 1 'f'
 [obcdf]+          # can only be these
 $                 # EOS