使用Apache Pig从记录中发出2条记录

时间:2012-02-21 19:17:37

标签: hadoop apache-pig

如何使用Apache Pig从输入关系为每条记录发出2条记录?

例如:

A = load 'data' using PigStorage() as (f1: int, f2: int);

我想生成B,使得B对于A中存在的每条记录有2条记录,即一条原始记录和一条修改过的记录。

我知道我可以创建另一个与修改过的记录的关系,然后用A UNION与A.但是,这会破坏目的,因为在前面的例子中,一切都只会在地图阶段发生。

0 个答案:

没有答案