标签: join hadoop apache-pig
来自Pig's Skewed Join documentation:
歪斜的联接并不能解决(平衡)不均匀的数据分布问题 减速。但是,在大多数情况下,倾斜连接可确保连接 将完成(无论如何慢慢)而不是失败。
有人可以解释一下这意味着什么吗?倾斜连接的重点不是实际处理这些偏斜的数据并将它正确地传递到Reducer中吗?