我正在尝试在Apache Pig中实现“您可能认识的人”算法,我遵循此MapReduce implementation作为参考,但是我不知道如何启动它。
我有示例数据,例如:
0 {(1),(2),(3),(6),(8),(9)}
1 {(0),(5),(9)}
2 {(0),(9)}
3 {(0),(4),(5),(7),(9)}
4 {(3),(8)}
5 {(1),(3),(6),(8)}
6 {(0),(5),(9)}
7 {(3),(8)}
8 {(0),(4),(5),(7)}
9 {(0),(1),(2),(3),(6)}
第一个值是用户,方括号{}内的值是朋友列表,我在Pig中用以下代码阅读:
friends = load 'data.txt' as (user:int, list:{friend:(id:int)});
现在我正在尝试生成commonFriends和已经是Friends表,但是我不知道该怎么做,我正在努力循环列出朋友列表。