词黑名单在内容的过滤消息

时间:2009-08-25 09:27:09

标签: php filter spam-prevention blacklist

对于从孩子那里获取输入的网站,我们需要过滤他们在网站上输入评论时使用的任何顽皮/坏词(运行PHP)。

评论是免费字段,用户可以输入他们想要的任何评论。我能想到的解决方案就是有一个单词列表 BLACKLIST:糟糕,糟糕,单词,woord,craap,craaaap,(我们可以填写所有列入黑名单的单词)。

然后,当表单保存时,我们可以查看列表,如果有任何单词存在,那么我们将不允许保存评论。

但是这个方法的问题是,他们可以通过在单词中添加字母来使其跳过过滤器EG:shiiiiit

让我知道你认为为这些词创建一些过滤器的最佳方法。

6 个答案:

答案 0 :(得分:6)

你永远无法过滤每个排列。也许最可行的解决方案是过滤明显的,并实施“报告滥用”机制,以便有人可以手动查看(并拒绝)可疑评论。

答案 1 :(得分:5)

所以你要禁止shit,shït,shıt,śhit和śhi?

黑名单在Unicode时代不是一个可行的解决方案。然而,直接禁止欧元似乎过度。

答案 2 :(得分:4)

如果你有足够的时间,那么值得一读Scunthorpe problem

杰夫阿特伍德也有the futility of obscenity filters的帖子。

答案 3 :(得分:1)

感谢太多的PHP,我发现了一些可能是您案例解决方案的链接:

答案 4 :(得分:0)

使用uClassify训练不良评论,当系统训练得足够好时,您可以标记违规评论以进行审核。

答案 5 :(得分:-1)

此外,总是有可能过滤像“低音”这样的词,当然这包括一个不允许的词。目前,一些优秀的主持人似乎是解决此类问题的最佳方案。