标签: deep-learning computer-vision conv-neural-network object-detection yolo
我的目标是构建一个物体检测器,以执行物体检测,例如使用xView之类的高架图像来检测车辆和建筑物。假设我有两组数据: 1)在全场景图像中具有丰富且丰富的边界框标签的数据, 2)较小的数据集,很少有我生成或合成的稀有类的标签(例如,来自CAD模型的合成数据),而没有框框标签(仅图像级标签)的边界,没有任何背景上下文或场景。
如何将来自数据集2的图像集成到训练RCNN或YOLO之类的深度网络中,以增强数据集1的丰富标签以找到那些稀有类别?