Hadoop EMR - 使用4mz压缩时的物理内存错误(zstd)

时间:2016-11-21 11:37:43

标签: hadoop compression emr

我的AWS EMR中运行的hadoop群集存在问题。

当我使用lzo或bz2的压缩运行我的集群步骤时,一切正常。问题是我想要一个更好的压缩,也可以处理分裂,所以我去了https://github.com/ReactiveX/RxJava/wiki/What's-different-in-2.0使用4mz(或zstd)。

现在,当我运行我的群集时,它失败并显示错误: InvCDF = function(n, sd) { for (i in 1:n) { u=runif(1, min = 0, max = 1) x = sqrt(-2*(sd^2)*log(1-u)) print(x) } }

我尝试使用x = vector(mode="numeric",length=n) 增加内存但它仍然失败(只是在稍后的时间......看起来减速器在失败之前完成了一些压缩)。

我想知道为什么使用这种新的压缩类型会导致我的群集失败?

我的群集: 8个c4.xlarge实例

谢谢!

0 个答案:

没有答案