在使用NLTK中的伯努利朴素贝叶斯算法和scikit-learn模块中的文本分类文本(仅在两个类别中)时,我得到了完全不同的结果。尽管两者之间的总体准确度相当(尽管差异很大),但I型和II型误差的差异很大。特别是,NLTK朴素贝叶斯分类器会提供比类型II错误更多的类型I,而scikit-learn - 则相反。这种“异常”似乎在不同的特征和不同的训练样本中是一致的。是否有一个原因 ?哪两个更值得信赖?
答案 0 :(得分:2)
NLTK没有实施伯努利朴素贝叶斯。它实现了多项式朴素贝叶斯,但只允许二进制特征。