标签: machine-learning spam-prevention bayesian-networks
嗨我对我正在尝试开发的系统有一个概念性问题,试图对电子邮件进行分类。我有一大堆(> 100k)非垃圾邮件和一大堆未分类邮件。那么可以使用一种方法(可能是贝叶斯)来检测垃圾邮件而不需要垃圾邮件数据集吗?我绝对需要对垃圾邮件进行分类吗?
答案 0 :(得分:1)
是的,你可以这样做。结果很可能比监督方法更差。一般问题通常被称为异常检测。我们的想法是创建一个数据模型,并为每个新实例决定它是否来自这个模型。有很多方法可以做到这一点,选择正确的方法很困难。您可以开始学习here。