Google Colab中的Tensorflow模型API SSSD Mobilenet中的步骤1之后的训练停止

时间:2018-11-01 09:14:52

标签: tensorflow

最近我正在尝试在我在google colab中的自定义数据集上训练tensorflow模型api的ssd mobilenet对象检测模型,在步骤1之后,训练课程停止了而没有显示或抛出任何异常或消息。我无法弄清楚问题谁能解释一下吗?

2 个答案:

答案 0 :(得分:1)

我认为可能是由于内存有限导致的问题。您可以尝试:-

  • 查看培训数据样本的大小(调整为较小尺寸)

在配置文件时:-

  • 减小批量大小
  • 禁用数据扩充
  • 将以下参数设置为低。

例如:-

  train_config: {
  batch_size: 1
  ...
  batch_queue_capacity: 50
  num_batch_queue_threads: 8
  prefetch_queue_capacity: 10
}

答案 1 :(得分:0)

培训将在1步后停止,这意味着您只有1个批次要处理。

num_batches = num_epochs * (num_samples / batch_size)

即使将steps设置为一个很大的值,如果上面的num_batches仅是1,也会在第1步后停止。