应用错误收集

当我使用estiamtor.train（）从检查点重新开始训练时，是否会使用最后一批数据继续训练？

时间：2019-11-02 21:53:19

标签： python tensorflow tensorflow-estimator

我的数据集由293个TF记录组成，我在COLAB TPU上从头开始训练BERT。而且由于colab TPU每隔12小时就会关闭一次，因此我需要从保存在GCS存储桶中的检查点重新开始训练。

因此，当重新开始训练时，估计器是从关闭前的最后一批开始继续训练，还是从第一个TFrecord文件中的第一批开始继续训练？

我的tfrecords是使用以下命令（ls ./shards/ | xargs -n 1 -P 8 -I{} python3 bert/create_pretraining_data.py --input_file=./shards/{} --output_file=pretraining_data/{}.tfrecord使用BERT中的create_pretraining_data.py创建的，其中每个分片包含256000个句子。

这也是所用COLAB笔记本的链接：COLAB

0 个答案:

没有答案

Spring Batch从上一个异常重启
tensorflow：从检查点恢复以继续训练
Spark从检查点重新启动流时发生的事情
使用BrainScript时，CNTK继续进行模型训练
从EventHostProcessor中的上一个检查点重新启动消耗
从火炬7的检查站恢复CNN的训练
从Tensorflow中的检查点进行训练时重新初始化学习率
Apache Flink：重新启动应用程序后，我的应用程序无法从检查点恢复
继续训练SavedModel或从SavedModel加载检查点
当我使用estiamtor.train（）从检查点重新开始训练时，是否会使用最后一批数据继续训练？

我写了这段代码，但我无法理解我的错误
我无法从一个代码实例的列表中删除 None 值，但我可以在另一个实例中。为什么它适用于一个细分市场而不适用于另一个细分市场？
是否有可能使 loadstring 不可能等于打印？卢阿
java中的random.expovariate()
Appscript 通过会议在 Google 日历中发送电子邮件和创建活动
为什么我的 Onclick 箭头功能在 React 中不起作用？
在此代码中是否有使用“this”的替代方法？
在 SQL Server 和 PostgreSQL 上查询，我如何从第一个表获得第二个表的可视化
每千个数字得到
更新了城市边界 KML 文件的来源？