如何通过重复字符使用坏词来避免垃圾邮件?

时间:2011-07-19 22:18:16

标签: php regex

如您所知,有一个常用代码可以替换坏词:

$badwords = array('bad', 'very bad');
$string = str_replace($badwords, "***", $string);

但是如果垃圾邮件发送者复制某些字符呢?比如“baaad”或“veery bad”。

1 个答案:

答案 0 :(得分:0)

您可以使用PHP的Levenshtein Distance实现levenshtein算法。如果单词只需要一个编辑就可以成为一个坏词,那么它可能是一个带有重复字符的可能的垃圾词。