应用错误收集

为什么贝叶斯过滤在分类垃圾邮件时比神经网络更好？

时间：2011-11-07 12:38:46

标签： machine-learning

根据StackOverflow的几个人，贝叶斯过滤比神经网络更好地检测垃圾邮件。

根据我读过的文献，不应该是这样的。请解释一下！

2 个答案:

答案 0 :(得分：3)

没有数学证据或解释可以解释为什么神经网络的应用在检测垃圾邮件方面不如贝叶斯过滤器那么好。这并不意味着神经网络不会产生类似或更好的结果，但是一个人调整神经网络拓扑结构并训练它以获得与贝叶斯滤波器大致相同的结果所需的时间根本就不合理。在一天结束时，人们关心结果并最大限度地减少实现这些结果的时间/精力。在垃圾邮件检测方面，贝叶斯过滤器以最少的精力和时间为您提供最佳结果。如果使用贝叶斯过滤器的垃圾邮件检测系统正确检测到99％的垃圾邮件，那么人们花费大量时间调整神经网络的动机非常小，因此他们可以额外获得0.5％的垃圾邮件。

“根据我读过的文献，不应该是这样。”

技术上是正确的。如果配置得当，神经网络会比贝叶斯过滤器获得更好或更好的结果，但其成本/效益比会产生差异，最终会产生趋势。

答案 1 :(得分：0)

神经网络主要用作黑盒方法。您确定您的输入和输出。之后找到合适的架构（2个隐藏层多层感知器，RBF网络等）主要是凭经验完成的。有建议确定架构，但它们是好的建议。这对于某些问题很有用，因为我们域名分析师没有足够的关于问题本身的信息。 NN找到答案的能力是想要的。

另一方面，贝叶斯网络主要由域名分析师设计。由于垃圾邮件分类是一个众所周知的问题，域名分析师可以更轻松地调整架构。贝叶斯网络将以这种方式更容易获得更好的结果。

此外，大多数NN在改变功能方面都不是很好，因此几乎总是需要重新训练，昂贵的操作。另一方面，贝叶斯网络可能只会改变概率。