我想推荐标记的商品,并分为三种价格类别(便宜,常规和昂贵)。我知道可以通过Mahout推荐,但这就是为什么我不知道如何使用它。
Mahout基于其他用户的意见,但我想推荐的所有新项目都只是尚未设置任何偏好设置的新项目。
Mahout是否是正确的工具?这是基于内容的吗? (mahout还不支持????)或者我应该使用分类?
谢谢!
答案 0 :(得分:1)
由于我从未构建任何推荐系统 - 请不要非常认真地对待这个答案(没人回答,所以我试试)
推荐系统必须建立在一些已知的(或部分已知的数据)上。如果您只有新的(看不见的)数据,则只能使用一些聚类算法来构建一些聚类。
如果这些集群没问题,它们可以用来培训一些推荐系统。
Mahout只是一种实现各种ML方法的工具。您可以使用Weka,R等其他工具......
答案 1 :(得分:0)
如果您根本没有关于新用户的数据,那么无论您做什么,都无法提出建议。零输入可以区分人与其他人。
然而,在第一次输入可用后,良好的系统应该能够做一些合理的事情。
这本质上不是分类器问题,不是。它也不是一个集群工具,尽管有其他答案。
价格类别不是您要使用的任何rec过程的核心。你可能有其他数据,它是什么?这很重要。
最后是否使用Mahout取决于品味。如果要使用Java和Hadoop,可以使用它。反过来,你只考虑Hadoop,如果你有非常大的输入,很少有人拥有那么多的数据(比如至少10M数据点)。
(嗯,不完全 - 我的推荐人在Mahout之前的Hadoop片段,适用于在线的小规模应用程序。如果你使用的是Java,你可能确实对此感兴趣。)