MapReduce:查找类似的电影
在创建一对候选类似电影后,我如何计算它们之间的jaccard相似度,以便我找到类似的电影?
e.g。 userID,电影ID1,电影ID2评级1,评级2
1, 1 , 2 5 , 4
2, 1 , 4 4 , 3
3, 1 , 2 4 , 5
该表显示movie1和movie 2是相似的,因为它们已被评为2个不同用户(user1和user3)的相似评级。
答案 0 :(得分:0)
阅读维基百科中的“非负矩阵分解”。
在MapReduce级别:随机梯度下降完成后,我将训练集划分为reducers处理的子集,然后平均子集之间的参数。
请参阅Mahout中的Collaborative Filtering以供参考。