我经营一个小型的小众个人广告网站。人们发布广告,然后其他人回复他们,该广告向广告的原始创建者发送电子邮件,告诉他们有人感兴趣并向他们提供该感兴趣的人的联系信息。
最近发生了一些奇怪的垃圾邮件。人们收到广告的无意义回复。以下是一个例子:
Name: xkauwvyr
Reply: vRYmbI <a href="http://rypmoxdkfblf.com/">rypmoxdkfblf</a>, url=http://pnjlwvhizwbq.com/]pnjlwvhizwbq[/url], [link=http://hmenwoujxrfv.com/]hmenwoujxrfv[/link], http://ogsekuhoyeud.com/
它们的长度和构图各不相同,但它们看起来大致相同。我的第一个想法是简单地抛弃包含字符串“a href”的任何回复 但这让我对一种更有效的防止无意义的方法感兴趣,可能会查看每个单词,如果某个百分比不在字典中,则抛出该答复。我该怎么办?
此外,这个垃圾邮件是不是在我的网站上玩耍的伎俩,还是更恶毒的东西?
答案 0 :(得分:1)
查看reCaptcha - http://code.google.com/apis/recaptcha/,这很容易实现。不一定有人进来并手动输入这些东西。它可能是一个机器人。
不确定是否有恶意,不会试图找出答案。有人试图通过广告观点来赚钱,或者更糟糕地利用浏览器漏洞并安装恶意软件或任何其他数量的东西。无论哪种方式,你都希望它消失,CAPTCHA是一种很好的方式。
您可以做的另一件事是阻止发布内容的人的IP地址,这也可以帮助减少它。当然,对他们来说使用代理或其他什么是微不足道的,但你永远不能完全停止这些东西。这基本上是一场战争,胜利的小战斗可以走很长的路。
修改
关于分析文本的想法,这是垃圾邮件启动以来一直在进行的大规模任务。您可以使用贝叶斯分析和启发式方法研究如何过滤垃圾邮件。你不会想花那么多时间,相信我。
如果您只想使用现成的东西,请查看akismet - http://akismet.com/,它有点在API中汇总该功能。它最初是一个wordpress插件,并且已经演变成一个独立的项目,你可以发表评论,它会回复它是垃圾邮件的可能性。
答案 1 :(得分:1)
答案 2 :(得分:0)
reCAPTCHA和强烈的节制,没有别的。应该将垃圾邮件减少到几乎没有。
答案 3 :(得分:0)
一些答案建议reCAPTCHA但"In fact, it reCAPTCHA became pretty useless" 它只是破坏了CAPTCHA的原始概念 我会在验证码环访问者中建议更多flexible approaches