目前最佳垃圾邮件过滤算法

时间:2010-12-22 16:40:23

标签: algorithm spam-prevention

目前检测垃圾邮件的最佳方法是什么?特别是在移动短信上。 有没有资源或比较分析?

4 个答案:

答案 0 :(得分:9)

研究有监督的学习技巧是很好的。已有多项研究将Multinomial Naive Bayes分类器用于垃圾邮件过滤,取得了很大成功。如果它适用于垃圾邮件过滤,那么它应该与SMS过滤一起使用。你需要的是一个庞大的示例垃圾短信文本数据集,并用它训练分类器。

此外,查看支持向量机可能会有所帮助,其中;虽然在垃圾邮件过滤中使用较少;是一种更强大的技术。

此外,仅仅在原始文本上训练算法可能不是最好的前进方式。 Mehran Sahami从1998年进行的一项研究发现,当他们考虑其他启发式时,他们取得了优异的性能(例如,发送到邮件列表的电子邮件是从域名发送的电子邮件,以“.edu”结尾) ,“。com”,“。org”?电子邮件是否包含多个标点符号(“!!!”)?等等。

但是从Multinomial朴素贝叶斯分类器开始。它实现起来非常简单,而且非常易于使用,并且从个人经验来看:它的培训时间也非常短。

答案 1 :(得分:4)

据我了解,大多数现代垃圾邮件过滤都是Bayes' theorem的实施和一些启发式的组合,例如:发件人黑名单,标准合规性,发送模式。

在移动电话网络中实现此功能的最简单的地方可能是SMS message centre,因为音量较高,这使得很多启发式实现更容易。

答案 2 :(得分:0)

使用各种算法和启发式(而非“最佳方法”)是保护您的网络和订阅者免受垃圾邮件,欺诈,恶意内容,网络欺凌,身份盗窃,病毒等攻击的好方法。 / p>

Cloudmark它是各种合作伙伴,竞争是一个开始寻找的好地方。

答案 3 :(得分:-1)

为什么你需要在事后发现垃圾邮件,prevent it in the再次发现... ... ...

更新:
blackhat SEO / SEm和犯罪分子可以轻松广泛地使用过滤器将黑名单/转储竞争对手使用 此外,它们具有追溯力,因此注定要始终落后于垃圾邮件发送者的技术进步