Pig Schema加载数据

时间:2014-04-03 22:31:50

标签: hadoop apache-pig

我有如下输入数据格式来表示来自源URL的外出链接,即源URL 1有2个和3个外发URL

1 2 3
2 3 4
3 4
4 1

我想加载到Pig,如下所示

N,  aN
(1,(2,3))
(2,(3,4))
(3,(4))
(4,(1))

我可以使用默认AS架构执行此操作吗?还是必须编写自定义加载程序函数。

1 个答案:

答案 0 :(得分:0)

您需要编写自定义加载程序,或稍微修改数据结构。如果没有自定义加载器,您可以使用以下格式:

N,  aN
(1,(2,3))
(2,(3,4))
(,(3,4))
(,(4,1))