我正在做一个计算机视觉项目,我需要一些帮助。 我的项目的目标是提取任何物体的属性 - 例如,如果我有一个耐克跑鞋,我应该能够弄清楚它是一个鞋子,然后弄清楚它是一个耐克鞋而不是阿迪达斯的鞋子(可能是因为耐克蜱),然后弄清楚它是一个跑鞋而不是足球鞋钉。
我开始将此视为图像分类问题,我使用以下步骤:
我想知道如何从这里开始?使用D-SIFT进行特征提取是否可以帮助我识别属性,因为它只代表某些点周围的梯度?
有时,我的分类出错了,例如,如果我使用左鞋和手表的图像训练分类器,右鞋被归类为手表。我知道我必须在我的训练集中加入合适的鞋来解决这个问题,但我还有其他方法吗?
还有什么方法可以理解形状吗?例如,如果我已经训练了手表的分类器,并且训练集中有带圆形和矩形表盘的手表,我可以识别任何新测试图像的形状吗?或者我是否只为带有圆形和矩形表盘的手表单独训练? 谢谢