大家好,
我正在使用tensorflow解决某些机器学习问题,但考虑到检查点却有一个未解决的问题。保存检查点将生成元,索引和数据文件。 但是,例如,数据文件末尾的数字是什么意思 model.ckpt.data-00000-of-00001? 为什么总是00000-of-00010001?
答案 0 :(得分:0)
一个tf.training.Saver无效时,其参数sharded
缺省设置为false。
分片:如果为True,则将检查点分片(每个设备一个)。
根据文档说明,当您致电save()
时:
返回:字符串:用于检查点文件的路径前缀。如果保护程序是分片的,则此字符串以以下结尾:'-??????-of-nnnnn'其中'nnnnn'是创建的分片数。如果保护程序为空,则返回None。
因此,如果您设置sharded=True
并在多个设备上进行训练(例如使用GPU集群),或者简单地以一个本地计算机为例,您的模型中的一部分在CPU中,另一部分在在GPU中,您将获得:data-00000-00002和data-00001-of-00002。