在Pig中创建邻接列表

时间:2015-03-16 19:47:26

标签: hadoop apache-pig adjacency-list adjacency-matrix

我是猪的新手。有人能指出我如何做到这一点? 我有一个包含邻接矩阵的文本文件:

*   x1  x2  x3  x4  x5
x1  0   1   0   1   1
x2  0   0   0   1   0
x3  0   0   0   0   1
x4  0   0   0   0   0
x5  0   1   0   0   0

我想从这个矩阵创建邻接列表,看起来应该是这样的

x1  x2
x1  x4
x1  x5
x2  x4
x3  x5
x5  x2  

所以在我从文件中读取矩阵后:A = LOAD'matrix.txt'使用PigStorage('\ t')AS(x,x1,x2,x3,x4,x5);所以DUMP A现在是

(*,x1,x2,x3,x4,x5) 
(x1,0,1,0,1,1) 
(x2,0,0,0,1,0)
(x3,0,0,0,0,1)
(x4,0,0,0,0,0)
(x5,0,1,0,0,0)

现在我想创建一个组,将第一列的每个x1,x2,x3,x4,x5映射到至少有一个列的其他列

任何帮助表示赞赏!

0 个答案:

没有答案