我想将此图片分段 (我只想要蜜蜂,我有100张像未标记的图像)。我认为最好的方法是使用频域,因为蜜蜂似乎有特定的频率。但我不知道该怎么做。如何找到合适的频率?
或许你想到一个更好的方法吗?
提前致谢!
答案 0 :(得分:2)
我强烈建议不要使用频域方法进行分割:
关于频域的好处是它捕获非局部属性,如纹理。然而,你为这个全球信息支付的价格是缺乏位置信息:说“这个频率来自图片的位置”是非常重要的。唉,这个位置信息至关重要用于分割:您必须知道哪个像素属于“频率”/纹理/区域...
存在基于频率的描述符,其被设计为维持一些位置信息(例如,Gabor滤波器等)。但是,这些技术并不容易实现“开箱即用”。
您是否考虑过使用深层语义分割方法?如果您没有很多带标签的图片,我建议您查看半监督的内容,例如Ning Xu, Brian Price, Scott Cohen, Jimei Yang, Thomas Huang, Deep GrabCut for Object Selection (arXiv 2017)。
答案 1 :(得分:1)
谢谢你的回答!
我最终通过使用CNN(unet架构)解决了这个任务。我注释了3张完整的图像,因为一张图像中有很多蜜蜂就足够了。训练是使用小补丁(大到足以容纳一只蜜蜂)完成的,而不是整个图像。
我也使用CRF来改善细分!
我在50张图片中测试了这个方法,最终效果很好:)