Mapreduce类似的电影

时间:2014-02-10 21:38:12

标签: hadoop mapreduce

MapReduce:查找类似的电影

在创建一对候选类似电影后,我如何计算它们之间的jaccard相似度,以便我找到类似的电影?

e.g。 userID,电影ID1,电影ID2评级1,评级2

 1,      1        , 2         5      , 4
 2,      1        , 4         4      , 3
 3,      1        , 2         4      , 5

该表显示movie1和movie 2是相似的,因为它们已被评为2个不同用户(user1和user3)的相似评级。

1 个答案:

答案 0 :(得分:0)

阅读维基百科中的“非负矩阵分解”。

在MapReduce级别:随机梯度下降完成后,我将训练集划分为reducers处理的子集,然后平均子集之间的参数。

请参阅Mahout中的Collaborative Filtering以供参考。