标签: hadoop apache-pig
如何使用Apache Pig从输入关系为每条记录发出2条记录?
例如:
A = load 'data' using PigStorage() as (f1: int, f2: int);
我想生成B,使得B对于A中存在的每条记录有2条记录,即一条原始记录和一条修改过的记录。
我知道我可以创建另一个与修改过的记录的关系,然后用A UNION与A.但是,这会破坏目的,因为在前面的例子中,一切都只会在地图阶段发生。
UNION