天真的贝叶斯垃圾邮件过滤问题

时间:2010-04-11 17:34:31

标签: algorithm math statistics naivebayes spam-prevention

我计划使用朴素贝叶斯分类模型实施垃圾邮件过滤器。

在线我看到很多关于朴素贝叶斯分类的信息,但问题在于它有很多数学内容,而不是明确说明它是如何完成的。 问题是我更像是一个程序员而不是数学家(是的,我在学校里学过了概率和贝叶斯定理,但是长时间没有接触,我没有奢侈品现在学习它(有近3周的时间来提出工作原型))。

因此,如果有人可以解释或指出我为程序员解释的位置而不是数学家,那将是一个很大的帮助。

PS:顺便说一下,如果你想知道,我必须在C中实现它。 :(

此致 微内核

5 个答案:

答案 0 :(得分:4)

本书Programming Collective Intelligence有章节介绍了这个和其他方法。本章(#6)可以在不参考前面章节的情况下理解,写得很清楚,只讨论完成工作所需的最小数学。

答案 1 :(得分:2)

你可以尝试这个website。它有一些源代码。

答案 2 :(得分:2)

我强烈推荐Andrew Moore's tutorials,我认为你应该从this one开始。

答案 3 :(得分:1)

您还可以查看一个开源垃圾邮件过滤器引擎POPFile

答案 4 :(得分:1)