对于从孩子那里获取输入的网站,我们需要过滤他们在网站上输入评论时使用的任何顽皮/坏词(运行PHP)。
评论是免费字段,用户可以输入他们想要的任何评论。我能想到的解决方案就是有一个单词列表 BLACKLIST:糟糕,糟糕,单词,woord,craap,craaaap,(我们可以填写所有列入黑名单的单词)。
然后,当表单保存时,我们可以查看列表,如果有任何单词存在,那么我们将不允许保存评论。
但是这个方法的问题是,他们可以通过在单词中添加字母来使其跳过过滤器EG:shiiiiit
让我知道你认为为这些词创建一些过滤器的最佳方法。
答案 0 :(得分:6)
你永远无法过滤每个排列。也许最可行的解决方案是过滤明显的,并实施“报告滥用”机制,以便有人可以手动查看(并拒绝)可疑评论。
答案 1 :(得分:5)
所以你要禁止shit,shït,shıt,śhit和śhi?
黑名单在Unicode时代不是一个可行的解决方案。然而,直接禁止欧元似乎过度。
答案 2 :(得分:4)
如果你有足够的时间,那么值得一读Scunthorpe problem。
杰夫阿特伍德也有the futility of obscenity filters的帖子。答案 3 :(得分:1)
感谢太多的PHP,我发现了一些可能是您案例解决方案的链接:
答案 4 :(得分:0)
使用uClassify训练不良评论,当系统训练得足够好时,您可以标记违规评论以进行审核。
答案 5 :(得分:-1)
此外,总是有可能过滤像“低音”这样的词,当然这包括一个不允许的词。目前,一些优秀的主持人似乎是解决此类问题的最佳方案。