Mahout中Rescorer和UserSimilarity之间的区别

时间:2012-02-04 19:24:00

标签: mahout collaborative-filtering

我正在实现一个基于用户的reccomender,它应该只对项目类别起作用,以避免计算无用的数据。为了更清楚,如果用户在类别页面中,我不想计算所有项目的首选项,而只是计算已审阅同一类别内容的用户。

要做到这一点,我想实现一个自定义UserSimilarity,告诉Mahout如果用户从未审阅过此类别中的项目,则该用户不相似。我可以使用过滤检查来实现一个Rescorer。

我知道在算法开始时使用userSimilarity以避免在整个集合上进行计算,但我不知道它是否在Rescorer上是相同的。 Rescorer在我看来就像一个Post处理器......我只是想避免繁重的计算。我应该使用Rescorer还是自定义UserSimilarity?如何在两者之间做出选择?

1 个答案:

答案 0 :(得分:0)

IDRescorer实际上扮演两个角色,既可以预先过滤要考虑的项目,也可以对其得分进行后处理。这些对应于其方法isFiltered()rescore()。你想要做的就是你对isFiltered()的所作所为。对于您正在考虑的类别中的任何内容,返回true。