我计划使用朴素贝叶斯分类模型实施垃圾邮件过滤器。
在线我看到很多关于朴素贝叶斯分类的信息,但问题在于它有很多数学内容,而不是明确说明它是如何完成的。 问题是我更像是一个程序员而不是数学家(是的,我在学校里学过了概率和贝叶斯定理,但是长时间没有接触,我没有奢侈品现在学习它(有近3周的时间来提出工作原型))。
因此,如果有人可以解释或指出我为程序员解释的位置而不是数学家,那将是一个很大的帮助。
PS:顺便说一下,如果你想知道,我必须在C中实现它。 :(
此致 微内核
答案 0 :(得分:4)
本书Programming Collective Intelligence有章节介绍了这个和其他方法。本章(#6)可以在不参考前面章节的情况下理解,写得很清楚,只讨论完成工作所需的最小数学。
答案 1 :(得分:2)
你可以尝试这个website。它有一些源代码。
答案 2 :(得分:2)
我强烈推荐Andrew Moore's tutorials,我认为你应该从this one开始。
答案 3 :(得分:1)
您还可以查看一个开源垃圾邮件过滤器引擎POPFile。
答案 4 :(得分:1)