训练有素的垃圾邮件机器学习分类器/模型

时间:2010-07-16 07:44:40

标签: machine-learning spam-prevention

我有一个大约1700万的句子列表。我需要将句子识别为垃圾邮件/火腿/不确定。互联网上是否有训练有素的模型,我可以将其作为“测试”集输入我的数据,系统会将我的句子归类为垃圾邮件/火腿?

注意:句子不是电子邮件。

1 个答案:

答案 0 :(得分:0)

你可以使用贝叶斯垃圾邮件过滤,看看这篇文章非常好理解理论http://robotics.stanford.edu/users/sahami/papers-dir/spam.pdf