在Pig关系中创建类似序列的RDBMS

时间:2012-05-17 07:28:40

标签: hadoop apache-pig

我想在猪关系上创建一个序列。

说例如,我与数据有关系:

(John, A-1)
(Jack, B-2)
(Jim, C-1)

我想创建序列,即为关系添加一列,比如 计数器并继续增加每个读取记录的计数。预期的输出应该是这样的:

(如果200是开始序列。)

(John, A-1, 201)
(Jack, B-2, 202)
(Jim, C-1, 203)

我该如何处理?

1 个答案:

答案 0 :(得分:1)

我不确定你是否可以在map / reduce中实际执行此操作,因为没有全局位置将保持和同步此序列 - 不同的映射实例各自在单独的服务器上运行而您无法同步它们(没有重要意义)无论如何痛苦)