我已经学习了一些MapReduce,并且已经开始阅读一些常见的练习,例如字数统计,电影推荐,共同的朋友等等。但是,我并不真正了解两者之间的比较唯一键有效。
例如,如果您查看一个MapReduce作业,该作业旨在根据其他用户或“朋友”是否给他们推荐了相同的电影,向用户推荐电影。我认为这项工作的一部分需要涉及知道是否有一个以上的人观看了一部电影来确定他们的“朋友”,并知道每个用户都没看过以推荐他们还未看过的东西,但是那就是我被困住的地方。
Reducer可以一一处理所有内容,例如,如何查看“ User1”并将其值与所有其他唯一用户的值进行比较?我的想法是使用HashMap,并将userID存储在密钥中,并将所有值(在本例中为movieID)存储在ArrayList中,因为HashMap中不能有重复的密钥。 movieID将与其他用户一起检查,以便找到朋友并确定推荐,但是我不太确定如何从语法上解决问题。
从我注意到的问题来看,这个问题与“共同之友”练习有很多相似之处,但是我仍然不太真正地理解语法。