我正在训练分类器以识别图像中的某些对象。我正在使用Watson Visual Recognition API,但我认为同样的问题也适用于其他识别API。
我收集了400张照片 - 例如犬。
在我训练沃森之前,我可以删除可能会丢掉东西的照片。我应该删除以下图片:
此外,白色背景上的狗是否可以提供更好的训练样本?
Watson也采取了反面的例子。猫和其他小动物会成为好的反面例子吗?还有什么?
答案 0 :(得分:5)
您是对的,这是各种自定义分类器和识别器的常见问题 - 无论是 vize.it , clarifai ,< strong> IBM Watson 或training a neural network on your own say in caffe。 (按您需要使用的示例图像的数量排序。)
您需要问的重要事项是您将如何使用分类器?您将为机器提供预测所显示对象的真实图像是什么?作为一般规则,您的训练图像应尽可能与预测时间图像相似 - 包括它们描绘的内容(物种的种类和种类)以及它们如何描绘(例如背景)。神经网络是超级强大的,如果你给他们足够的图像,他们甚至会学习困难的情况。
也许您想在用户的文件夹中找到狗图像 - 其中包括家庭照片,屏幕截图和文档扫描。反映训练集中的多样性。询问用户是否应将带有其他动物的狗标记为狗照片。
也许您想在荒野照片陷阱上找到狗图像。只需使用该照片陷阱拍摄的各种图像(或几张照片陷阱,如果它是整个网络)。
简而言之 - 将样本图像定制为手头的任务!