RDD的弹性是什么?

时间:2017-05-27 14:51:31

标签: java apache-spark rdd

我遇到了两个版本的Resilient意味着RDD?

理解1: - 在内存中创建RDD时,它还会将算法存储在二级存储中,以便创建RDD。因此,即使RDD丢失,也可以在以后构建 算法。这就是为什么它被称为弹性/可靠。 RDD只存储/备份算法而不是二级存储中的实际RDD数据。

理解2: - 在内存中创建RDD时,它也会备份另一个节点上的数据。因此,即使一个节点上的RDD丢失,也可以稍后根据存储的数据构建RDD 在另一个节点上。

哪一个是正确的?

0 个答案:

没有答案