ALS.checkpointInterval更高还是更低?

时间:2016-04-15 16:58:48

标签: hadoop apache-spark pyspark

设置ALS.checkpointInterval时,应该在设置时考虑什么?更高或更低的区间是什么意思?

1 个答案:

答案 0 :(得分:1)

ALS.checkpointInterval 值指的是多少次的迭代次数。时间缓存将被检查点。
例如。如果interval设置为10意味着缓存将每10次迭代检查一次。

检查点有助于恢复(当节点失败时)和由长谱系引起的StackOverflow异常。它还有助于消除磁盘上的临时shuffle文件,这在有许多ALS迭代时非常重要。

默认值 10 。因此,根据您的系统内存,您可以设置更低或更高的值