由于超出VM限制,MapReduce处理失败

时间:2018-02-08 06:13:19

标签: arrays hadoop mapreduce limit skew

由于超出了VM限制,MapReduce处理失败。 我们发现的只是数据偏斜, 由于数据偏斜,MapReduce背后是否有任何理性失败?

1 个答案:

答案 0 :(得分:0)

如果您的数据严重偏差,那么这意味着一个映射器或缩减器必须处理更多数据。这意味着它需要更多内存并运行更长时间。如果您积极设置群集的节点管理器内存,则可以轻松地淹没VM或节点。

这是一个常见的问题和足够大的问题,人们已经在上面写了论文。