我正在开发一个系统来简化我们的图像库,该库每周从7k到20k的新图片增长。具体的应用是识别图片中有哪些赛车(所有赛车的形状相似,涂装方案不同)。我计划在项目的这一部分使用python和tensorflow。
我最初的想法是使用图像分类对汽车图像进行分类。但是,图片中包含多辆汽车的可能性很高。我的下一个想法是使用对象检测来检测汽车编号(在所有汽车的固定位置(鼻子,尾巴,门和车顶)都存在,并且每周都有一致的字体)。最后是整车的目标识别方法。从表面上看,这似乎是最实际的。但是,涂装方案的更改可能不会更改。
哪种方法能给我最好的结果?我已经抽取了大量图像进行训练,显然不同的方法需要非常不同的训练数据集。
答案 0 :(得分:1)
最好的方法是将这3种方法都当作一个错误。您训练所有这三个模型,并将输入图像传递给所有这三个模型。然后,有几种方法可以评估输出。
您可以总结所有3个模型的所有类别的概率,然后根据最高概率得出结论。
您可以从每个模型中获得预测并根据投票数进行决策:1.模型-class1,2.模型-class2,3.模型-class2 ==> class2
您可以执行加权决策等操作。因此,假设第一个模型是最好的和最健壮的模型,但是您并不100%相信它,而是想看看其他模型会说些什么。比起第一个模型的输出权重为0.6,其他两个模型的输出权重为0.2。
我希望这会有所帮助:)