关于CNN和tensorflow我是新手。我训练了一个经过预训练的ssd-mobilenev1-pets.config来检测建筑物的圆柱,大约一天,但是损失在2-1之间,并且自10个小时前就没有减少。 我意识到我的输入图像是128x128,SSD将图像的大小调整为300 * 300。 输入图像的大小会影响训练吗? 如果是这样,我应该使用更大的输入图像来重新训练网络吗?或减少损失的另一种选择是什么?我的火车数据集有660张图像并测试166我不知道是否有足够的图像 我真的很感谢您的帮助....
答案 0 :(得分:1)
ssd_mobilenet
的损失值可以与faster_rcnn
不同。摘自EdjeElectronics的TensorFlow对象检测教程:
对于我的Faster-RCNN-Inception-V2模型的培训,它始于 约3.0,并迅速跌至0.8以下。我建议允许您 训练模型,直到损失持续下降到0.05以下 将需要大约40,000个步骤,或大约2个小时(具体取决于 强大的CPU和GPU)。注意:损失数将是 如果使用不同的模型则不同。 MobileNet-SSD以 损失约20,应进行培训,直到持续损失 在2下。
SSD Mobilnet架构需要额外的培训才能满足 但是,R-CNN模型的损失精度值提供了 在小型设备上的实用性,可伸缩性和易于访问性 这揭示了SSD模型是进一步发展的有希望的候选者 评估(Fleury和Fleury,2018年)。
有关更多信息:Fleury,D.和Fleury,A.(2018)。区域CNN和SSD机器学习对象检测架构的实现,用于在暗视场显微镜中实时分析血源性病原体。 MDPI AG。
答案 1 :(得分:0)
make sure your model also has sufficient data to learn from!
re-training the ssd mobilenet until the loss consistently becomes under 1.
make sure the model is not over-fitting.
都是关于反复试验的事情。 (损失在0.5和1之间似乎做得不错,但同样取决于您。)The model has not been given enough knowledge in training data to make the model learn for new variety of testing data.
(例如:您的测试数据包含一些建筑物的新角度的图像,这些图像在训练数据中不足以显示)。在这种情况下,建议您将各种图像放入训练数据中,然后选择图像进行测试以确保您仍然有足够的新姿势训练数据。因此,我建议您采用15%-20%的测试数据。