Mahout是什么意思建立在Hadoop上?

时间:2013-05-29 08:08:51

标签: hadoop mahout

我已经读过Mahout是在Hadoop上开发的,我们可以在有或没有Hadoop的情况下使用Mahout。说Mahout算法可以在Hadoop上运行是什么意思? Mahout算法不是用Map-Reduce形式编写的吗?能用一个例子向我解释一下吗?

谢谢!

2 个答案:

答案 0 :(得分:3)

你看过源代码了吗?这些算法实现为Map / Reduce作业(不是全部,而是大部分),这正是这个陈述的原因。

答案 1 :(得分:0)

Mahout有两个版本非分布式和分布式。有一些基本的分布式(Hadoop)实现可用,如ItemBased Collaborative Filtering。默认分发的限制是,如果您的评级数据具有用户标识和项目标识为字母数字,那么您将需要自定义它。

如果你想实现一些自定义算法,那么你将不得不编写Mapper和Reducers甚至代码来调用它们。

我已经覆盖org.apache.mahout.cf.taste.hadoop.item.RecommenderJob以使用我的自定义Map和Reduce任务。

如果我错了,请大家纠正我。