mavout 0.7中cvb的输出

时间:2013-05-13 09:54:34

标签: mahout topic-modeling

我在hadoop 1.0.4上运行Mahout 0.7。我想查看路透数据集的主题建模任务结果。但是,当我在Mahout中使用vectordump工具时,我得到了一些无用的结果。 我已经阅读了此示例的以下一组说明: Run cvb in mahout 0.8
但在执行vectordump工具后,我在输出中收到一个巨大的文件,其中包含如下行:{0.01:5.726429339702471E-12,0.05:6.196569958376538E-9,...} 我不确定这是否是我们应该在路透社数据集中看到的实际输出。

2 个答案:

答案 0 :(得分:0)

同样的事情发生了,解决方案很简单: 在他们的svn服务器中获取最新版本:http://svn.apache.org/repos/asf/mahout/trunk

这是因为Mahout 0.7中存在vectorSize的错误。

答案 1 :(得分:0)

我认为他们还没有提供您正在寻找的那种输出https://issues.apache.org/jira/browse/MAHOUT-1470