我试图根据MALLET训练的主题模型推断文档的主题。我在mallet目录中使用以下命令
./mallet infer-topics --inferencer topic-model --input indata.mallet --output-doc-topics infered_docs
但是它在演员异常中被卡住了:
java.lang.ClassCastException: cc.mallet.topics.ParallelTopicModel cannot be cast to cc.mallet.topics.TopicInferencer
我怎么解决这个问题?
答案 0 :(得分:6)
模型和推理器之间存在差异。 --output-model FILENAME
命令中的train-topics
选项生成一个文件(模型),其中包含训练数据以及所有推断参数。 --inferencer-filename FILENAME
生成一个小得多的文件(推理器),它只包含推断新文档主题所需的参数。
infer-topics
命令需要主题推理器,而不是完整的模型。您可以使用train-topics
和--input-model FILENAME
选项与--inferencer-filename FILENAME
一起运行--num-iterations 0
,从现有模型文件创建推理器。