我正在尝试训练一个SSD模型,但没有成功,它使用大约1000个训练和200个带有验证标签的图像来检测单个字符。
训练有素的模型无法预测所有测试用例;边界框似乎是随机生成的。我要附上训练和验证mAP曲线的图像。
看来验证曲线表现不正常,所以我有两个问题:
超参数设置如下(使用Python AWS Sagemaker软件包):
base_network='vgg-16',
use_pretrained_model=1,
mini_batch_size=16,
epochs=600,
learning_rate=0.0001,
optimizer='rmsprop',
momentum=0.9,
image_shape=512,
label_width=350,
有什么想法吗?