如何构建数据以便在mahout中使用推荐引擎

时间:2014-11-26 14:36:43

标签: mahout recommendation-engine

例如,我有一个交易表,跟踪哪个用户购买了哪个项目和数量。我的数据仅包括用户,项目和数量。因此,我如何使用mahout向用户推荐其他项目? 任何推荐方法都可以....

例如,事务表数据:

User   Item    Quantity

user1  item1         20
user1  item2         50 
user1  item3          0
user1  item4         10
user1  item5          0

user2  item1         50
user2  item2          1
user2  item3        100
user2  item4         77
user2  item5         40

user3  item1        150
user3  item2          0
user3  item3          5
user3  item4         10
user3  item5         40

我怎么知道我应该向user1推荐哪个项目?

1 个答案:

答案 0 :(得分:0)

我认为使用数量列在推荐系统中并不那么明智。至少mahout没有实现数据量(相反,存在评级的实现)。

因此,您可以删除数量为0的数量列和行,然后您将拥有布尔pref数据集。

布尔pref数据集有几种实现方法,例如;

http://bigdatahandling.blogspot.co.uk/2014/01/recommendations-with-mahout-for-boolean.html