Tensorflow检查点保存数据文件

时间:2019-01-22 19:41:34

标签: tensorflow checkpoint

大家好,

我正在使用tensorflow解决某些机器学习问题,但考虑到检查点却有一个未解决的问题。保存检查点将生成元,索引和数据文件。 但是,例如,数据文件末尾的数字是什么意思 model.ckpt.data-00000-of-00001? 为什么总是00000-of-00010001?

1 个答案:

答案 0 :(得分:0)

一个tf.training.Saver无效时,其参数sharded缺省设置为false。

  

分片:如果为True,则将检查点分片(每个设备一个)。

根据文档说明,当您致电save()时:

  

返回:字符串:用于检查点文件的路径前缀。如果保护程序是分片的,则此字符串以以下结尾:'-??????-of-nnnnn'其中'nnnnn'是创建的分片数。如果保护程序为空,则返回None。

因此,如果您设置sharded=True并在多个设备上进行训练(例如使用GPU集群),或者简单地以一个本地计算机为例,您的模型中的一部分在CPU中,另一部分在在GPU中,您将获得:data-00000-00002和data-00001-of-00002。