不天真的文本分类算法?

时间:2016-12-20 13:30:06

标签: machine-learning text-classification data-science

朴素贝叶斯算法假定特征之间的独立性。什么是一些不是天真的文本分类算法,即不假设它的特征之间的独立性。

1 个答案:

答案 0 :(得分:0)

答案非常直接,因为几乎每个分类器(除了天真贝叶斯)都不天真。特征独立性是非常罕见的假设,而不是(在其他巨大的列表中):

  • 逻辑回归(在称为最大熵模型的NLP社区中)
  • 线性判别分析(fischer线性判别)
  • 的kNN
  • 支持向量机
  • 决策树/随机森林
  • 神经网络
  • ...

您在询问文本分类,但文本没有什么特别之处,您可以将任何现有的分类器用于此类数据。