使用槌我可以获得特定数量的主题及其单词。如何确保主题词的概率分布(即总和为1)?
例如,如果我按照下面的方式运行它,我如何使用mallet提供的输出来确保主题0的主题词的概率加起来为1?
mallet train-topics --input text.vectors --output-topic-keys topics.txt --output-doc-topics doc_comp.txt --topic-word-weights-file weights.txt --num-top-words 50 --word-topic-counts-file counts.txt --num-topics 3 --output-state topicstate.gz --alpha 1