我使用的是Mahout Cookbook,它显示了Mahout 0.8的示例并使用了Hadoop 0.23.5。
我是整个系统的新手,所以我想知道在运行Mahout 0.9时要使用哪个Hadoop版本?
由于
答案 0 :(得分:0)
当从maven拉出Mahout 0.9时,它包括hadoop-core版本1.2.1。根据{{3}},Mahout版本0.9不适用于hadoop 2。它在github上的最新this分支中得到解决,但这需要您从源代码重新编译mahout并包含hadoop 2库。 Mahout 1.0应该支持hadoop 2.X版本。
答案 1 :(得分:0)
如果您选择使用Hadoop 2运行Mahout 0.9,您可以按照以下步骤使其运行:
git clone https://github.com/apache/mahout.git
在Mahout文件夹中,输入:
mvn -Dhadoop2.version=2.2.0 -DskipTests clean install
mvn -Dhadoop2.version=2.2.0 clean package
以下是recommendeditembased的使用示例:
bin/mahout recommenditembased --input input/input.txt --output output --usersFile input/users.txt --similarityClassname SIMILARITY_COOCCURRENCE
修改:原始来源为http://mahout.apache.org/developers/buildingmahout.html
答案 2 :(得分:0)
此版本的Mahout也使用hadoop 0.2核心jar运行。 我在Windows机器上使用它,从0.2开始,hadoop为Windows系统提供了许可例外