我有一个字符列表,例如{o, b, c, c, d, o, f}
。
如果字符串包含不在该列表中的字符,我不希望它成为匹配项。如果一个字符串包含的字符数多于该列表中该字符的出现次数,我不希望它成为匹配。
字符串中的字符可以按任何顺序出现,并且不必显示所有字符。在上面的示例中,"foo"
应该是匹配但不是"fooo"
。
(o{0,2}b?c{0,2}d?f?)
,但由于该正则表达式中的顺序很重要,因此无法正常工作。我获得了"oof"
的匹配,但没有获得"foo"
的匹配。
答案 0 :(得分:6)
正如gview所说,正则表达式不是正确的工具。但是,如果您的正则表达式引擎支持前瞻,您可以使用:
(?=(?:[^o]*o){0,2}[^o]*$)(?=(?:[^c]*c){0,2}[^c]*$)(?=[^b]*b?[^b]*$)(?=[^d]*d?[^d*]*$)(?=[^f]*f?[^f]*$)^[obcdf]+$
它有点长但很简单:
该字符串与^[obcdf]+$
匹配(请注意使用锚点。)
前瞻(?=...)
只是检查(后跟):
(?=(?:[^o]*o){0,2}[^o]*$) # no more than 2 o until the end
(?=[^b]*b?[^b]*$) # no more than 1 b until the end
前瞻中的每个子模式都描述了整个字符串。
答案 1 :(得分:4)
我认为正则表达式不是满足该要求的正确工具。我会创建一个简单的数组,其中包含白名单中的字符数。如果您的语言具有关联数组,则按字母键入并在数组元素中出现次数。
然后逐字符处理单词,在关联数组中尝试匹配,并递减可用计数。
如果有的话,它会失败:
答案 2 :(得分:3)
另一种方式也可以起作用
# ^(?!(?:.*o){3})(?!(?:.*c){3})(?!(?:.*b){2})(?!(?:.*d){2})(?!(?:.*f){2})[obcdf]+$
^ # BOS
(?! (?:.* o){3} ) # not more than 2 'o'
(?! (?:.* c){3} ) # not more than 2 'c'
(?! (?:.* b){2} ) # not more than 1 'b'
(?! (?:.* d){2} ) # not more than 1 'd'
(?! (?:.* f){2} ) # not more than 1 'f'
[obcdf]+ # can only be these
$ # EOS