标签: machine-learning gensim lda text-classification
我在文本数据上运行多标签分类我注意到TFIDF大幅超越了LDA。 TFIDF准确度为50%,LDA约为29%。
这是预期的还是LDA应该比这更好?
答案 0 :(得分:2)
LDA通常用于无监督学习,不用于分类。它提供了一个生成模型,而不是一个判别模型(What is the difference between a Generative and Discriminative Algorithm?),这使得它不太适合分类。 LDA也可以对数据预处理和模型参数敏感。