我使用seq2sparse将序列文件转换为稀疏向量。这花了这么长时间是正常的吗?我现在被卡在监视器和打印机上三十分钟了。它似乎在做某事,因为任何在机器上做任何其他事情的尝试都非常缓慢。但我很高兴知道我是否应该停止并再试一次,或者我是否应该等待。
这是我使用的命令:
mahout home/bin/mahout seq2sparse -o outputDirectory -i inputDirectory -ml 10 -ng 2 -seq
我应该调整一些开关以帮助它更有效地运行吗?
这是在一台本地计算机上。序列文件是151MB。
编辑:做其他事情不再迟钝,但是htop显示java正在做与hadoop和mahout有关的事情所以我想我应该离开吗?现在,这个过程的这一部分已经进行了四十分钟。
编辑2:嗯不用担心,我出去后回来了,它完成了没有崩溃或任何东西。如果你读完这一切,无论如何都欢呼!