我的AWS EMR中运行的hadoop群集存在问题。
当我使用lzo或bz2的压缩运行我的集群步骤时,一切正常。问题是我想要一个更好的压缩,也可以处理分裂,所以我去了https://github.com/ReactiveX/RxJava/wiki/What's-different-in-2.0使用4mz(或zstd)。
现在,当我运行我的群集时,它失败并显示错误:
InvCDF = function(n, sd) {
for (i in 1:n) {
u=runif(1, min = 0, max = 1)
x = sqrt(-2*(sd^2)*log(1-u))
print(x)
}
}
我尝试使用x = vector(mode="numeric",length=n)
增加内存但它仍然失败(只是在稍后的时间......看起来减速器在失败之前完成了一些压缩)。
我想知道为什么使用这种新的压缩类型会导致我的群集失败?
我的群集: 8个c4.xlarge实例
谢谢!