标签: terminal mallet
我正在通过终端使用槌。我已经以单一文件格式导入了训练数据:
project5 TokenNameCOMMENT This is the actual text
我已经使用train-topics命令创建了几种大小的主题模型。
我现在要做的是在相同格式的测试集上测试经过训练的模型。 更具体地说,如果可能的话,我希望将主题分配给我的每个测试文件,以及该主题和测试文件的每个单词的概率。如果有可能获得任何主题的每个单词的概率,那将是很好的。
谢谢