我正在玩TensorFlow,我使用的是image recognition system。我用自己的图像内容提供和训练应用程序。
一切顺利,直到我开始有几个类别。
例如,一开始我只有:
-hat
并取得了很好的成绩(得分约为0.95)
然后我添加了:
-shoes
-canne
结果开始变得不那么准确,我得到了帽子得分为0,94的无帽人。
我使用文档中所写的arg - how_many_training_steps 4000 来获得更好的效果。
所以我认为我没有以正确的方式教授应用程序:
答案 0 :(得分:0)
初始v3是一个图像分类系统,这意味着它给出了整个图像的每个类的概率。您可以使用输出概率来推断除了最高结果之外的图片中还有其他内容,但这不是该模型的用途。
我建议:
https://research.googleblog.com/2016/09/show-and-tell-image-captioning-open.html
它可能会返回一个标题,如“男子戴着一顶带有戛纳的帽子”
编辑:如果你打算使用一个图像分类系统,每个类应该至少有100个图像(这是最低限度的),图像应该只适合一个类。如果您希望系统处理不属于任何类别的图像,而不是像“无帽子”这样的反类别只有一个“其他”类别。