标签: lda topic-modeling mallet
我正在使用MALLET的主题建模。
我有一组关键字以及一组文档的权重,我想训练这些文档并使用该模型来推断新文档。
注意:文档的每个关键字都有权重,与tf-idf得分类似。
根据我在文档中可以推断的内容,MALLET的主题建模仅支持序列数据,而不支持矢量数据。
我想使用分配给文档的每个关键字的权重进行分析。如果不这样做,那么每个关键字都会被平等对待,因此我在分析时会丢失重要信息。