用木槌获取单词主题概率

时间:2014-07-29 21:09:54

标签: terminal mallet

我正在通过终端使用槌。我已经以单一文件格式导入了训练数据:

project5 TokenNameCOMMENT This is the actual text

我已经使用train-topics命令创建了几种大小的主题模型。

我现在要做的是在相同格式的测试集上测试经过训练的模型。 更具体地说,如果可能的话,我希望将主题分配给我的每个测试文件,以及该主题和测试文件的每个单词的概率。如果有可能获得任何主题的每个单词的概率,那将是很好的。

谢谢

0 个答案:

没有答案