标签: java apache-spark rdd
我遇到了两个版本的Resilient意味着RDD?
理解1: - 在内存中创建RDD时,它还会将算法存储在二级存储中,以便创建RDD。因此,即使RDD丢失,也可以在以后构建 算法。这就是为什么它被称为弹性/可靠。 RDD只存储/备份算法而不是二级存储中的实际RDD数据。
理解2: - 在内存中创建RDD时,它也会备份另一个节点上的数据。因此,即使一个节点上的RDD丢失,也可以稍后根据存储的数据构建RDD 在另一个节点上。
哪一个是正确的?