mahout中StandardNaiveBayesClassifier和ComplementaryNaiveBayesClassifier之间的差异

时间:2013-12-20 00:16:47

标签: algorithm machine-learning mahout

也许我的问题非常复杂,但我想知道StandardNaiveBayesClassifierComplementaryNaiveBayesClassifierMahout算法之间的主要区别。哪一个在较少量的训练数据上表现较好,或者是数据相关问题?哪一个更适合情绪分析?还有一些其他的aspecs ......

提前谢谢!

3 个答案:

答案 0 :(得分:9)

Complement naive Bayes是一种天真的贝叶斯变体,当训练集中的类不平衡时,它往往比香草版更好。简而言之,它根据 y 补充估计每个类 y 的特征概率,即所有其他类'样本,而不是类 y 本身的训练样本。

答案 1 :(得分:1)

Compliment Naive Bayes(CNB)分类器通过估计除我们正在评估的情感类别之外的所有情绪类别中的数据的参数来改进朴素贝叶斯分类器的弱点。

答案 2 :(得分:0)

1)即使NaïveBayes表现良好,也会产生一些糟糕的假设,例如数据独立性和不均衡的训练 特定类的数据(偏斜数据)。 2)补充NaïveBayes是NaïveBayes变体之一,它解决了父母NaïveBayes分类器的不良假设,例如不均匀训练大小(训练数据中最常出现的类在实际中占主导地位) 分类)和独立性(所有特征或属性都是单独处理的)假设。假设数据是指一个类别的训练样例多于另一个类别,这导致决策边界权重有偏差。这反过来又导致分类器无意中偏好一个类 在另一个。为了解决这个问题,补充NaïveBayes提出了一个概率估计参数,它使用了除c

之外的所有类的数据