标签: apache-spark replication-factor
我正在向本地文件系统写入spark执行结果。有什么办法,我可以为中间任务结果提供一个复制因子,这样如果一个工作节点出现故障,就不需要重新运行那个已在该节点上执行的任务了吗?