应用错误收集

Sk-learn LDA用于主题提取，困惑和分数

时间：2017-12-04 11:38:05

标签： scikit-learn text-classification lda supervised-learning perplexity

大家好！

作为项目的一部分，我需要使用我拥有的标记数据构建文本分类器。数据点由单个句子和每个句子的3个类别之一组成。我用LDA从这个数据库中提取了5个主题。

我想要尝试的是，我想使用这些主题来确定一个看不见的句子所属的类。我正在考虑培训带有5个指标的监督模型，该指标显示给出这5个主题的句子的主题分布。

问题在于，对于给出句子的每个主题，我无法获得单独的可能性。我对LDA模型的困惑和得分表示困惑。它们似乎返回单个浮点值。

另外，我知道LDA的监督版本。我想知道我的方法是否有意义。

提前致谢！

0 个答案:

没有答案