分类LDA与TFIDF

时间:2016-12-06 01:52:53

标签: machine-learning gensim lda text-classification

我在文本数据上运行多标签分类我注意到TFIDF大幅超越了LDA。 TFIDF准确度为50%,LDA约为29%。

这是预期的还是LDA应该比这更好?

1 个答案:

答案 0 :(得分:2)

LDA通常用于无监督学习,不用于分类。它提供了一个生成模型,而不是一个判别模型(What is the difference between a Generative and Discriminative Algorithm?),这使得它不太适合分类。 LDA也可以对数据预处理和模型参数敏感。