Tensorflow培训的裁剪图像与否?

时间:2016-10-14 07:04:12

标签: tensorflow

我正在玩TensorFlow,我使用的是image recognition system。我用自己的图像内容提供和训练应用程序。

一切顺利,直到我开始有几个类别。

例如,一开始我只有:

-hat

并取得了很好的成绩(得分约为0.95)

然后我添加了:

-shoes
-canne

结果开始变得不那么准确,我得到了帽子得分为0,94的无帽人。

我使用文档中所写的arg - how_many_training_steps 4000 来获得更好的效果。

所以我认为我没有以正确的方式教授应用程序:

  • 我是否需要用没有身体或整个身体和帽子的裁剪图像来显示帽子?鞋子,沙恩等也一样......
  • 每个类别需要多少张图片才能获得好成绩?我看到鲜花的例子每个花名约有600-800张图片,实际上每个类别有150张图片。
  • 我是否必须使用拮抗图像?比如帽子和文件夹帽子的头部或身体,头部或身体没有帽子的文件夹没有帽子?
  • 我是否必须在多个类别中使用相同的图像,例如戴帽子和鞋子的人以及canne我将图像复制到文件夹 hat,shoes,canne

1 个答案:

答案 0 :(得分:0)

初始v3是一个图像分类系统,这意味着它给出了整个图像的每个类的概率。您可以使用输出概率来推断除了最高结果之外的图片中还有其他内容,但这不是该模型的用途。

我建议:

https://research.googleblog.com/2016/09/show-and-tell-image-captioning-open.html

它可能会返回一个标题,如“男子戴着一顶带有戛纳的帽子”

编辑:如果你打算使用一个图像分类系统,每个类应该至少有100个图像(这是最低限度的),图像应该只适合一个类。如果您希望系统处理不属于任何类别的图像,而不是像“无帽子”这样的反类别只有一个“其他”类别。