我想根据Utilizing multiple, weighed data models for a Mahout recommender
中的多个数据集做推荐但我的问题是其他数据集不能很好地转换为主要项目。我的域名是特定的,但想象这也是基于音乐品味推荐电影的问题。
如果我以同样的方式对待电影和音乐,我也会在结果中获得音乐。
我想使用其他数据集来获得更好的邻居。这可能与Mahout或Myrrix有关吗?
答案 0 :(得分:2)
如果您以相同方式对待它们,则可以使用Rescorer
类来过滤掉音乐结果。 Myrrix也可以访问Rescorer(s)
例如,Mahout in Action一书中的this Rescorer
example过滤掉了没有库存的书籍的建议。你会做一些类似的事情,你会(以某种方式)跟踪哪些项目id是音乐,然后在Rescorer
中使用这些信息来过滤它们,这样就不会推荐它们。