我的商店数据库中有一个地址列表。但显然很多都是假的;它们由dfdfdfsd@somewhere.com
和qwsdrtghj@somewherelse.com
等字符串组成。
换句话说:连续至少5个双元音。如何在SQL query
中搜索这样的字符串?基本上:任何diphthong
后跟任何diphthong
和5 times
。
答案 0 :(得分:1)
看起来你正在加倍一些辅音以确定一个双音节。例如:
dfdfdfsd
如果我将df
,df
,df
和sd
计算为单独的双元数,则总数为4。所以看起来你可能会重叠:
dfdfdfsd
^df
^fd
^df
^fd
^df
^fs
^sd
总共有7个双元音。
我不知道如何匹配,那么如何检查连续5个(或更多)辅音呢?这样就可以了:
email RLIKE '[b-df-hj-np-twxz]{5,}'
如果您不想将y
视为元音,只需将其添加到上面的字符串中即可。将它放在x
和z
之间以便于阅读,或者至少不要将它放在一个连字符之后,否则你将破坏表达式。
同样,如果连续的6个(或7个或8个)辅音是您所追求的临界点,请相应调整上面表达式中的5
。