标签: apache-pig
Pig产生了如此多的输出,我发现很难弄清楚它实际上在做什么。
例如,如果我在dump foo;之前store foo ...; - 是否会为dump生成额外的MR作业,或者是否会在以下store作业中捎带?
dump foo;
store foo ...;
dump
store
(相关数据集很小 - 约100条记录)
答案 0 :(得分:1)
multi-query-execution:
您不想使用DUMP,因为它会禁用多个查询执行 并且可能会减慢执行速度。 (如果您已包含DUMP 脚本中的语句用于调试目的,您应该删除 它们。)