我正在尝试对大型鸟类进行图像识别,并且由于相机正在移动,我通常的背景去除和形状识别策略将不会有效。由于所有成年鸟of the species在着色方面非常相似,我认为哈尔分类器可能有效,found some resources尝试训练我自己的分类器。
负像应明显大于正像,并呈现相似的环境但不包含正像。但是,我还没有找到太多有关良好的积极培训形象的详细信息。我发现一些参考文献试图在所有正面训练图像中保持相似的纵横比,但是对于像鸟一样可以在不同的姿势(翅膀打开,翅膀关闭)中发生显着变化的东西,它是否至关重要?为每个要识别的目标姿势和方向训练多个分类器是否更好?是否更好的是尝试识别相对一致的对象的子集(如鸟的非常独特的黑白头)?
如果我使用像头部这样的子功能,在某些视图中是否“镜像”是否重要?我是否应该人为地使我的正面图像朝向相同的方向,并且在图像上运行分类器时,运行两次,一次镜像?在为分类器设计正图像集时需要考虑哪些因素?