标签: php mysql profanity
我有一个mysql表,其中包含一个多语言坏词的大列表(大约5000个单词)。我需要找到一种有效的方法来过滤掉用户创建的短信中的亵渎词。使用php正则表达式在我看来并不合适,因为坏词列表很大。
将消息分成单词然后查询每个单词是一种解决方案,对于用户发布大量消息的高流量网站而言非常糟糕。我需要一个优化的解决方案,因为许多用户将同时使用此服务。
有什么建议吗?或者如果您认为正则表达式是合适的,那么您能解释一下cpu /内存使用和执行时间方面的可行性吗?