Google tensorflow图像分类器

时间:2015-12-08 17:45:35

标签: machine-learning computer-vision neural-network classification tensorflow

我们计划使用Google Tensorflow构建图像分类器。

我想知道使用卷积深度神经网络训练自定义图像分类器的最小值和最佳要求是什么?

问题具体是:

  • 每个班级应至少提供多少张图片?
  • 我们需要appx吗?每班提供相同数量的训练图像,或者每班的数量是不同的?
  • 错误图像数据对训练数据的影响是什么?例如。 500个网球鞋和50个其他鞋子的图像。
  • 是否可以训练一个比最近发布的inception-v3模型更多类的分类器?让我们说:30.000。

2 个答案:

答案 0 :(得分:7)

“每个班级应该至少提供多少张图片?”

取决于你的训练方式。

如果从头开始训练新模型,纯粹监督:对于图像数量的经验法则,您可以查看MNIST和CIFAR任务。这些似乎可以正常工作,每班约5,000张图像。那就是你从头开始训练。

您可以通过在ImageNet上训练的模型开始来引导您的网络。这个模型已经具有很好的功能,因此它应该能够学习如何在没有很多标记示例的情况下对新类别进行分类。我认为这个研究不足以告诉你具体的数字。

如果使用未标记的数据进行培训,则每个类别可能只有100个带标签的图像。最近有很多关于这个主题的研究工作,尽管没有像Imagenet这样大的任务扩展。 易于实施:

http://arxiv.org/abs/1507.00677

复杂实施:

http://arxiv.org/abs/1507.02672
http://arxiv.org/abs/1511.06390
http://arxiv.org/abs/1511.06440

“我们是否需要appx。每班提供相同数量的培训图像,或者每个班级的数量可以不同?”

每个班级应该使用不同数量的例子。

“错误的图像数据对训练数据的影响是什么?例如,500张网球鞋和50张其他鞋子的图像。”

您应该使用本文所述的标签平滑技术:

http://arxiv.org/abs/1512.00567

根据您对标签错误率的估算来平滑标签。

“是否有可能训练一个比最近发布的inception-v3模型更多类的分类器?让我们说:30.000。”

答案 1 :(得分:4)

  

每个班级应至少提供多少张图片?

     

我们需要appx吗?每班提供相同数量的训练图像,或者每班的数量是不同的?

     

错误图像数据对训练数据的影响是什么?例如。 500张网球鞋和50张其他鞋子的图片。

这三个问题并非真正特定的TensorFlow。但简短的回答是,它取决于模型在处理不平衡数据集和噪声标签时的弹性。

  

是否可以训练分类器的类比最近发布的初始-v3模型多?让我们说:30.000。

是的,当然。这意味着更大的分类器层,因此您的训练时间可能会更长。除此之外,TensorFlow没有任何限制。