应用错误收集

分类LDA与TFIDF

时间：2016-12-06 01:52:53

标签： machine-learning gensim lda text-classification

我在文本数据上运行多标签分类我注意到TFIDF大幅超越了LDA。 TFIDF准确度为50％，LDA约为29％。

这是预期的还是LDA应该比这更好？

1 个答案:

答案 0 :(得分：2)

LDA通常用于无监督学习，不用于分类。它提供了一个生成模型，而不是一个判别模型（What is the difference between a Generative and Discriminative Algorithm?），这使得它不太适合分类。 LDA也可以对数据预处理和模型参数敏感。