视觉识别训练的图像选择

时间:2016-10-31 16:28:31

标签: tensorflow image-recognition visual-recognition watson

我正在训练分类器以识别图像中的某些对象。我正在使用Watson Visual Recognition API,但我认为同样的问题也适用于其他识别API。

我收集了400张照片 - 例如犬。

在我训练沃森之前,我可以删除可能会丢掉东西的照片。我应该删除以下图片:

  1. 多只狗
  2. 与另一只动物的狗
  3. 有人的狗
  4. 一只部分遮盖的狗
  5. 戴眼镜的狗
  6. 此外,白色背景上的狗是否可以提供更好的训练样本?

    Watson也采取了反面的例子。猫和其他小动物会成为好的反面例子吗?还有什么?

1 个答案:

答案 0 :(得分:5)

您是对的,这是各种自定义分类器和识别器的常见问题 - 无论是 vize.it clarifai ,< strong> IBM Watsontraining a neural network on your own say in caffe。 (按您需要使用的示例图像的数量排序。)

您需要问的重要事项是您将如何使用分类器?您将为机器提供预测所显示对象的真实图像是什么?作为一般规则,您的训练图像应尽可能与预测时间图像相似 - 包括它们描绘的内容(物种的种类和种类)以及它们如何描绘(例如背景)。神经网络是超级强大的,如果你给他们足够的图像,他们甚至会学习困难的情况。

也许您想在用户的文件夹中找到狗图像 - 其中包括家庭照片,屏幕截图和文档扫描。反映训练集中的多样性。询问用户是否应将带有其他动物的狗标记为狗照片。

也许您想在荒野照片陷阱上找到狗图像。只需使用该照片陷阱拍摄的各种图像(或几张照片陷阱,如果它是整个网络)。

简而言之 - 将样本图像定制为手头的任务!