标签: mahout
我正在使用朴素贝叶斯算法训练一个有两个类别的数据集。
我想知道两个类别是否需要在每个类别中对于要分配好的单词的权重具有相同的数量,或者这不是必需的?
由于
答案 0 :(得分:1)
没有必要,尽管每个类别都应该有足够的样本以避免过度拟合。