我正在尝试训练学习模型来识别一个特定的场景。例如,假设我想训练它以识别在游乐园拍摄的照片,并且我已经在游乐园拍摄了1万张照片。我想用这些图片训练这个模型,以便能够给出在游乐园拍摄它们的概率的其他图片的分数。我怎么做? 考虑到这是一个图像识别问题,我可能会使用卷积神经网络,但我不太确定如何训练它。
谢谢!
答案 0 :(得分:1)
有几种可能的方法。最微不足道的是收集大量的反面例子(来自其他地方的图像)并训练一个两级模型。
第二种方法是训练网络从输入图像中提取有意义的低维表示(嵌入)。在这里,您可以使用暹罗训练来明确训练网络,以了解图像之间的相似之处。例如,这种方法用于人脸识别(见FaceNet)。有了这样的嵌入,您可以使用一些成熟的方法进行离群值检测,例如,1类SVM或任何其他分类器。在这种情况下,您还需要反面的例子。
我会使用图像裁剪大量增加您的数据 - 这是增加您的案例培训数据量的最明显方法。
一般而言,您在此任务中的成功很大程度上取决于任务声明(仅限于公园或任何类型的地方)和正确的数据。