在MySQL中找到连续的双元音

时间:2013-05-14 14:19:26

标签: mysql

我的商店数据库中有一个地址列表。但显然很多都是假的;它们由dfdfdfsd@somewhere.comqwsdrtghj@somewherelse.com等字符串组成。

换句话说:连续至少5个双元音。如何在SQL query中搜索这样的字符串?基本上:任何diphthong后跟任何diphthong5 times

1 个答案:

答案 0 :(得分:1)

看起来你正在加倍一些辅音以确定一个双音节。例如:

dfdfdfsd

如果我将dfdfdfsd计算为单独的双元数,则总数为4。所以看起来你可能会重叠:

dfdfdfsd
^df
 ^fd
  ^df
   ^fd
    ^df
     ^fs
      ^sd

总共有7个双元音。

我不知道如何匹配,那么如何检查连续5个(或更多)辅音呢?这样就可以了:

email RLIKE '[b-df-hj-np-twxz]{5,}'

如果您不想将y视为元音,只需将其添加到上面的字符串中即可。将它放在xz之间以便于阅读,或者至少不要将它放在一个连字符之后,否则你将破坏表达式。

同样,如果连续的6个(或7个或8个)辅音是您所追求的临界点,请相应调整上面表达式中的5