通过协作过滤从附加数据中获取用户邻域

时间:2013-04-10 11:48:03

标签: mahout recommendation-engine collaborative-filtering myrrix

我想根据Utilizing multiple, weighed data models for a Mahout recommender

中的多个数据集做推荐

但我的问题是其他数据集不能很好地转换为主要项目。我的域名是特定的,但想象这也是基于音乐品味推荐电影的问题。

如果我以同样的方式对待电影和音乐,我也会在结果中获得音乐。

我想使用其他数据集来获得更好的邻居。这可能与Mahout或Myrrix有关吗?

1 个答案:

答案 0 :(得分:2)

如果您以相同方式对待它们,则可以使用Rescorer类来过滤掉音乐结果。 Myrrix也可以访问Rescorer(s)

例如,Mahout in Action一书中的this Rescorer example过滤掉了没有库存的书籍的建议。你会做一些类似的事情,你会(以某种方式)跟踪哪些项目id是音乐,然后在Rescorer中使用这些信息来过滤它们,这样就不会推荐它们。