首先,我有2个经过预先训练的模型(在hdf5文件中):
第一个模型是在数据集A上训练的基于YOLO的模型,该模型用于在任何图像中定位人(请注意:该模型中经过训练的图像可能在内部包含很多人)
第二个模型是CNN模型,用于基于仅包含1个人的图像来检测一个人的性别(男性或女性)。
假设我只想使用这两个模型,并且不想重新训练或修改数据集上的任何内容。我如何在数据集A的图片中找到女性?
我认为可行的可能解决方案:
首先使用第一个模型进行检测,即在图像中的人周围创建边界框。
将边界框裁剪为唯一的图像。将这些图像提供给第二个模型,以查看该人是女性/男性
但是,此解决方案的性能很慢。那么,有没有办法可以提出这种解决方案或以不同的方式执行此任务呢?