这是一个相当简单的问题,但我是该领域的新手。使用此tutorial我有一种检测某些模式或功能的好方法。然而,我测试的图像很大,并且我寻找的特征通常只占图像的一小部分。当我在整个画面上运行时,分类很糟糕,但是当它被缩放并裁剪时,分类是好的。
我考虑过编写一个脚本,将图像分成许多不同的图像并对所有图像进行测试(时间并不是一个巨大的问题)。然而,这似乎仍然效率低下且不理想。我想知道最好的建议,也是最容易实现的解决方案。
我正在使用Python。
答案 0 :(得分:1)
这似乎是一个简单的问题,但答案并非如此简单。本地化是一项艰巨的任务,需要比分类整个图像更多的腿部工作。人们已经尝试过许多不同的工具和模型。一些型号包括R-CNN,它以与您建议的方式不太相似的方式查看许多区域。或者,您可以查看YOLO或TensorBox等模型。
对此没有一个答案,这会被问到很多!例如:Does Convolutional Neural Network possess localization abilities on images?
您希望在研究论文中寻找的术语是“本地化”。如果你正在寻找一个肮脏的解决方案(这不是时间敏感的),那么滑动窗口肯定是第一步。我希望这可以让你进入你的项目,你可以从那里进步。