晚上,
我想在MySQL表中的某些列中搜索[a-z] \。[a-z]的任何实例,例如:
John.than,Ame.ica,Llan.antffraid等。
但我不希望这包括字符串'a.m.'或者“下午”。我尝试过使用(?!a.m。| p.m。),但这不起作用。它返回错误:“得到错误'重复 - 操作数操作数无效'来自regexp”。
我有以下正则表达式:
REGEXP BINARY '[a-z]\\\.[a-z]'
N.B。如果一个列包括上午或下午。但是还包含像bro.ken这样的字符串,需要返回。
答案 0 :(得分:3)
逐步构建正则表达式:
你想要一切,除了它是一个“独立的”a.m或p.m:
[b-oq-z]{1}\.[a-ln-z]{1}
会匹配x.y
或a.#
或p.#
#.m
的所有格式
但是你错过了a.a
,a.b
,a.c
......所以添加这些案例:
a\.[^m]
(同样适用于p
- 案例:p\.[^m]
)a.m
前面有字符时, kra.m, tra.m
有效。同样适用于p.m
:erp.m
[a-z]{1}[ap]\.m
涵盖了此条款。现在,我们缺少字符串,其中第二部分更长:a.mod, p.markt
:
[ap]\.m[a-z]+
涵盖了那个。最后,只有以.m
结尾但具有不同前缀的那些缺失:
[b-oq-z]{1}\.m
现在应该涵盖所有可能的用例。简单地将模式与OR(|
)结合起来就完成了:
([b-oq-z]{1}\.[a-ln-z]{1}|a\.[^m]|p\.[^m]|[a-z]{1}[ap]\.m|[ap]\.m[a-z]+|[b-oq-z]{1}\.m)
注意:这不会给你exakt匹配组。但是,由于您只在SQL查询中使用它,因此只需要匹配的情况。 (ark.m
将与k.m
匹配 - 但它符合您的规范)
请记住:创建正则表达式时,没有正确的解决方案:只是工作,而不是工作。 a\.[^m]|p\.[^m]
等于[ap]\.[^m]
,这会将模式减少一个OR。
当满足2个条件时,您已找到完美正则表达式模式:
答案 1 :(得分:1)
如果你可以使用断言,这可能有用,但不确定回溯。
# (?=^.*(?:(?!a\.m|p\.m)[a-z]\.[a-z]|(?:a\.m|p\.m).*(?!a\.m|p\.m)[a-z]\.[a-z]))
(?=
^
.*
(?:
(?! a\.m | p\.m )
[a-z] \. [a-z]
|
(?: a\.m | p\.m )
.*
(?! a\.m | p\.m )
[a-z] \. [a-z]
)
)
答案 2 :(得分:0)
我会这样做:
SELECT 'Ame.ica wakes up at 8 a.m.' REGEXP
'[b-oq-z]\\.[a-ln-z]|[ap]\\.[^m]|[^ap]\\.m|[[:alpha:]][ap]\\.m|[ap]\\.m[[:alpha:]]' findme,
'America wakes up at 8 a.m.' REGEXP
'[b-oq-z]\\.[a-ln-z]|[ap]\\.[^m]|[^ap]\\.m|[[:alpha:]][ap]\\.m|[ap]\\.m[[:alpha:]]' dontfindme
它是一个更短的,因此更快的版本的dognose的答案。它也是为MySQL量身定制的,它有一些奇怪的[[:alpha:]]
类。