Mahout rescorer实施

时间:2011-08-19 23:57:21

标签: mahout

我想将两个项目之间的所有PearsonItemSimilarity值加权,它们共享的那些颜色除以50。

或换句话说,相应地更新两个项目(例如项目a和b)之间的通用皮尔逊相似性 -  similarity_new_ab = similarity_ab * numCoRatings_ab / 50

  1. 如何使用现有的mahout框架获得两场比赛之间的战斗数量。

  2. 有人可以将我链接到(或说明)rescorer的示例实现吗?

  3. 我这样做的理由如下,

    我假设计算出的大部分Pearson相似性是基于少量(在大多数情况下为1或2)的涂层。这将导致游戏彼此之间共享Pearson相关性1,如果存在更多的corating,事实上可能不会是这种情况。

    为了解释这一点,我想把这些“幼稚”的Pearson相似性改为相似性,这也是基于联合评级的数量。

    我认为这是重建者的目的,但我想我错了。

1 个答案:

答案 0 :(得分:0)

您希望getNumUsersWithPreferenceFor()上的方法DataModel并将其传递给两个项目ID。 我不认为这是针对此相似性指标的最佳选择。如果您正在使用共现,请查看LogLikelihoodSimilarity

这与Rescorer无关,那你的问题是什么?