我应该使用mahout吗?

时间:2013-02-25 17:57:10

标签: mahout recommendation-engine unsupervised-learning

我想推荐标记的商品,并分为三种价格类别(便宜,常规和昂贵)。我知道可以通过Mahout推荐,但这就是为什么我不知道如何使用它。

Mahout基于其他用户的意见,但我想推荐的所有新项目都只是尚未设置任何偏好设置的新项目。

Mahout是否是正确的工具?这是基于内容的吗? (mahout还不支持????)或者我应该使用分类?

谢谢!

2 个答案:

答案 0 :(得分:1)

由于我从未构建任何推荐系统 - 请不要非常认真地对待这个答案(没人回答,所以我试试)

推荐系统必须建立在一些已知的(或部分已知的数据)上。如果您只有新的(看不见的)数据,则只能使用一些聚类算法来构建一些聚类。

如果这些集群没问题,它们可以用来培训一些推荐系统。

Mahout只是一种实现各种ML方法的工具。您可以使用Weka,R等其他工具......

答案 1 :(得分:0)

如果您根本没有关于新用户的数据,那么无论您做什么,都无法提出建议。零输入可以区分人与其他人。

然而,在第一次输入可用后,良好的系统应该能够做一些合理的事情。

这本质上不是分类器问题,不是。它也不是一个集群工具,尽管有其他答案。

价格类别不是您要使用的任何rec过程的核心。你可能有其他数据,它是什么?这很重要。

最后是否使用Mahout取决于品味。如果要使用Java和Hadoop,可以使用它。反过来,你只考虑Hadoop,如果你有非常大的输入,很少有人拥有那么多的数据(比如至少10M数据点)。

(嗯,不完全 - 我的推荐人在Mahout之前的Hadoop片段,适用于在线的小规模应用程序。如果你使用的是Java,你可能确实对此感兴趣。)