应用错误收集

由于超出VM限制，MapReduce处理失败

时间：2018-02-08 06:13:19

标签： arrays hadoop mapreduce limit skew

由于超出了VM限制，MapReduce处理失败。我们发现的只是数据偏斜，由于数据偏斜，MapReduce背后是否有任何理性失败？

1 个答案:

答案 0 :(得分：0)

如果您的数据严重偏差，那么这意味着一个映射器或缩减器必须处理更多数据。这意味着它需要更多内存并运行更长时间。如果您积极设置群集的节点管理器内存，则可以轻松地淹没VM或节点。

这是一个常见的问题和足够大的问题，人们已经在上面写了论文。