标签: hadoop mapreduce mahout
我是Hadoop / Mahout的新手,我理解这些概念,但是我遇到了将Mahout作业部署到已设置的计算机群集的问题。
我在单台计算机上使用过Mahout,但是我应该怎么做才能将其运行到已经形成的Hadoop集群中?
我有一个安装了Hadoop 0.20.2的集群,以及包含Hadoop 1.2.1的Mahout 0.9。我应该复制哪些罐子,以便我可以运行包含Mahout调用的代码,或者我应该做些什么来使它在Hadoop集群上运行?
任何建议/示例/教程都会很棒。
由于
答案 0 :(得分:0)
您问题的重要链接
https://mahout.apache.org/users/clustering/k-means-commandline.html