我在hadoop 1.0.4上运行Mahout 0.7。我想查看路透数据集的主题建模任务结果。但是,当我在Mahout中使用vectordump工具时,我得到了一些无用的结果。
我已经阅读了此示例的以下一组说明:
Run cvb in mahout 0.8。
但在执行vectordump工具后,我在输出中收到一个巨大的文件,其中包含如下行:{0.01:5.726429339702471E-12,0.05:6.196569958376538E-9,...}
我不确定这是否是我们应该在路透社数据集中看到的实际输出。
答案 0 :(得分:0)
同样的事情发生了,解决方案很简单: 在他们的svn服务器中获取最新版本:http://svn.apache.org/repos/asf/mahout/trunk
这是因为Mahout 0.7中存在vectorSize的错误。
答案 1 :(得分:0)
我认为他们还没有提供您正在寻找的那种输出https://issues.apache.org/jira/browse/MAHOUT-1470