应用错误收集

我正在做一个计算机视觉项目，我需要一些帮助。我的项目的目标是提取任何物体的属性 - 例如，如果我有一个耐克跑鞋，我应该能够弄清楚它是一个鞋子，然后弄清楚它是一个耐克鞋而不是阿迪达斯的鞋子（可能是因为耐克蜱），然后弄清楚它是一个跑鞋而不是足球鞋钉。

我开始将此视为图像分类问题，我使用以下步骤：

我想知道如何从这里开始？使用D-SIFT进行特征提取是否可以帮助我识别属性，因为它只代表某些点周围的梯度？

有时，我的分类出错了，例如，如果我使用左鞋和手表的图像训练分类器，右鞋被归类为手表。我知道我必须在我的训练集中加入合适的鞋来解决这个问题，但我还有其他方法吗？

还有什么方法可以理解形状吗？例如，如果我已经训练了手表的分类器，并且训练集中有带圆形和矩形表盘的手表，我可以识别任何新测试图像的形状吗？或者我是否只为带有圆形和矩形表盘的手表单独训练？谢谢