MALLET主题推理

时间:2016-12-19 08:37:19

标签: java bash mallet

我试图根据MALLET训练的主题模型推断文档的主题。我在mallet目录中使用以下命令

./mallet infer-topics --inferencer topic-model --input indata.mallet --output-doc-topics infered_docs

但是它在演员异常中被卡住了:

java.lang.ClassCastException: cc.mallet.topics.ParallelTopicModel cannot be cast to cc.mallet.topics.TopicInferencer 我怎么解决这个问题?

1 个答案:

答案 0 :(得分:6)

模型和推理器之间存在差异。 --output-model FILENAME命令中的train-topics选项生成一个文件(模型),其中包含训练数据以及所有推断参数。 --inferencer-filename FILENAME生成一个小得多的文件(推理器),它只包含推断新文档主题所需的参数。

infer-topics命令需要主题推理器,而不是完整的模型。您可以使用train-topics--input-model FILENAME选项与--inferencer-filename FILENAME一起运行--num-iterations 0,从现有模型文件创建推理器。