我在最新版本的Hadoop上运行Mahout 0.9版本。在K-Means算法中,我根据需要将输入数据转换为向量。
我执行了以下命令,运行K-Means:
mahout kmeans -i /user/ubuntu/Test/Vec/tfidf-vectors/ -c /user/ubuntu/Test/init-cluster -o /user/ubuntu/Test/Result -x 10 -k 2 -ow -cl
/user/ubuntu/Test/init-cluster
是一个空文件夹,因为我已经提供了-k参数。
有趣的是,根据下面的日志信息,Mahout删除了群集文件夹(/user/ubuntu/Test/init-cluster
):
15/11/27 17:13:31 INFO common.HadoopUtil: Deleting /user/ubuntu/Test/init-cluster
最后,Mahout给出了:
Exception in thread "main" java.lang.IllegalStateException:
No input clusters found in /user/ubuntu/Test/init-cluster/part-randomSeed.
Check your -c argument
知道怎么解决吗?