应用错误收集

时间：2010-04-11 17:34:31

标签： algorithm math statistics naivebayes spam-prevention

我计划使用朴素贝叶斯分类模型实施垃圾邮件过滤器。

在线我看到很多关于朴素贝叶斯分类的信息，但问题在于它有很多数学内容，而不是明确说明它是如何完成的。 问题是我更像是一个程序员而不是数学家（是的，我在学校里学过了概率和贝叶斯定理，但是长时间没有接触，我没有奢侈品现在学习它（有近3周的时间来提出工作原型））。

因此，如果有人可以解释或指出我为程序员解释的位置而不是数学家，那将是一个很大的帮助。

PS：顺便说一下，如果你想知道，我必须在C中实现它。：（

此致微内核

答案 0 :(得分：4)

本书Programming Collective Intelligence有章节介绍了这个和其他方法。本章（＃6）可以在不参考前面章节的情况下理解，写得很清楚，只讨论完成工作所需的最小数学。

答案 1 :(得分：2)

你可以尝试这个website。它有一些源代码。

答案 2 :(得分：2)

我强烈推荐Andrew Moore's tutorials，我认为你应该从this one开始。

答案 3 :(得分：1)

您还可以查看一个开源垃圾邮件过滤器引擎POPFile。

答案 4 :(得分：1)