我正在尝试训练一个学习模型,以识别图像中代表某个已知对象的哪个部分(左/中/右),假设模型的输入可以是以下之一:左部分的图像对象的(整个左侧部分或左侧部分的较小部分);中心部分(整个中心部分或中心部分的较小部分)的图像;右部分(整个右部分或右部分的较小部分)的图像。对象的位置始终是固定的,因此所有图像都在对象的前面拍摄,在这种情况下,也会要求模型进行预测。 我已经收集了数千个图像,分别属于对象的左,中和右部分。如前所述,对于每个部分,有些图像代表整个部分,而另一些图像则代表该部分的较小部分, 无论如何,我只是想预测图像属于对象的哪一部分(左/中/右),所以我已经将其作为3个标签的分类任务来解决,但我想知道此任务的最佳选择是使用卷积神经网络或其他方法。
任何建议都非常感谢。 谢谢
答案 0 :(得分:0)
由于您试图区分三个独立状态,因此分类方法是一个明智的起点。您可以从this tutorial开始,然后按照您的建议添加一些卷积层。
还有其他方法:分类任务通常意味着每个错误答案都同样是错误的。如果正确的答案是“左”,而您的算法给出的答案是“右”,那么这是否比给出“中”的答案还差?如果是这样,您可能会认为这是一个回归问题。
最后,您可能更喜欢将AI stack exchange论坛用于概念性问题,因为stackoverflow通常是为特定的编码问题保留的。