偏斜连接不能解决不均匀数据的含义是什么意思?

时间:2014-05-13 12:19:08

标签: join hadoop apache-pig

来自Pig's Skewed Join documentation

  

歪斜的联接并不能解决(平衡)不均匀的数据分布问题   减速。但是,在大多数情况下,倾斜连接可确保连接   将完成(无论如何慢慢)而不是失败。

有人可以解释一下这意味着什么吗?倾斜连接的重点不是实际处理这些偏斜的数据并将它正确地传递到Reducer中吗?

0 个答案:

没有答案