如何从包含不同语言的记录中过滤掉英语记录(包括数字和标点符号)

时间:2019-06-16 09:56:30

标签: mysql

有些评论是由不同国家的人用不同的语言撰写的。 如何只过滤英文评论。

  

我尝试了如下代码:

  1. SELECT *来自评论REGEXP'^ [0-9A-Za-z]';
  2. SELECT *从评论那里评论REGEXP'[[:alpha:]] +';
  

但仍然无法覆盖所有结果,尤其是像(,;。''“”&...)这样的标点符号

     

排除的记录:

  • での疲れを愈してくれる;
  • 好评,位置不错;

  • מלוןמעולהבאווירהאוטנטית;

  • Accueil狂妄自大à;

  • 我上一次在汉堡逗留期间住在万豪酒店,想尝试一下文艺复兴时期。我当然不会失望。升级到套房和免费早餐后,我的钛金精英得到了认可。

  

预期结果:

  • 我上次在汉堡和汉堡期间住过万豪酒店, 想尝试一下文艺复兴时期。我当然不会失望。 升级到套件并免费获得了我的钛金精英奖 早餐。

0 个答案:

没有答案