朴素贝叶斯的天真是什么?
答案 0 :(得分:47)
实际上有一个很好的例子on Wikipedia:
简单来说,朴素贝叶斯分类器假定在给定类变量的情况下,类的特定特征的存在(或不存在)与任何其他特征的存在(或不存在)无关。例如,如果果实是红色的,圆形的,直径约4英寸,果实可以被认为是苹果。即使这些特征相互依赖或者存在其他特征,一个朴素的贝叶斯分类器也会考虑所有的这些属性独立地促成了这种水果成为苹果的概率。
基本上,它是“天真的”,因为它做出的假设可能会或可能不会是正确的。
答案 1 :(得分:9)
如果您的数据由特征向量X = {x1,x2,... x10}和您的类标签Y = {y1,y2,.. y5}组成。因此,贝叶斯分类器将正确的类标签标识为最大化以下公式的类标签:
P(y / X)= P(X / y)* P(y)= P(x1,x2,... x10 / y)* P(y)
因此,它仍然不是天真的。然而,很难计算P(x1,x2,... x10 / Y),因此我们假设这些特征是独立的,这就是我们所说的朴素假设,因此,我们最终得到以下公式< / p>
P(y / X)= P(x1 / y)* P(x2 / y)* ... P(x10 / y)* P(y)
答案 2 :(得分:4)
它被称为天真,因为它假设所有属性彼此独立。这个假设是为什么它被称为天真,因为在许多现实世界的情况下,这是不适合的。尽管如此,分类器在许多实际情况下都能很好地工作,并且在某些情况下(尽管不是全部)具有与中性网络和SVM相当的性能。
答案 3 :(得分:1)
对于分类,当我们发现联合分布时,问题在于它只是反映训练数据并且也很难计算。所以我们需要一些更有用的概括。
天真模型强烈概括每个属性的分布独立于任何其他属性。
这在很大程度上有助于不关心属性之间的依赖关系。
答案 4 :(得分:0)
在这里,我正在分享一份有关朴素贝叶斯分类器的实用解释的好文档,这将为您提供一个很好的主意。