我有一个 ASL (美国手语)数据集,其中每个字母有3000张图片,我将使用此脚本在tensorflow codelabs
的帮助下训练我的模型
"python -m scripts.retrain \
--bottleneck_dir=tf_files/bottlenecks \
--how_many_training_steps=? \
--model_dir=tf_files/models/ \ --summaries_dir=tf_files/training_summaries/"mobilenet_1.0_224" \
--output_graph=tf_files/retrained_graph.pb \
--output_labels=tf_files/retrained_labels.txt \
--architecture="mobilenet_1.0_224" \ --image_dir=tf_files/dataset".
任何人都可以告诉我为准确预测选择了多少步骤?
我是新学习的深度学习建议,因为我处于学习阶段。
答案 0 :(得分:1)
如果每个字母有大约3,000张图像,并且有26个字母,那么每个纪元会为您提供大约78,000张图像。如果您的批量大小为 b ,则每个时期为您提供78,000 / b 培训步骤。我建议先训练10个时代,看看会发生什么。
这是实验科学。在每个纪元后打印准确性,看看如果网络改善了会发生什么。当它停止显着改善时停止训练。